百面机器学习主题的文章列表，还有百面机器学习的技术要点_第95页

Python机器学习（十七）AdaBoost原理与代码实现

Adaboost体现的是“三个臭皮匠，胜过一个诸葛亮”，它是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器（强分类器）。训练过程如下（参考Andy的机器学习--浅析Adaboost算法，他说得非常形象，贴切。）&nbs...

代码星球 ·2020-09-20

Python机器学习（十六）KNN原理与代码实现

KNN（k-NearestNeighbour）：K-近邻算法，主要思想可以归结为一个成语：物以类聚1.1工作原理给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的k（k<=20）个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。https://www.cnblogs.com/ybj...

代码星球 ·2020-09-20

Python机器学习（十五）朴素贝叶斯算法原理与代码实现

朴素贝叶斯是经典的机器学习算法之一，也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单，也很容易实现，多用于文本分类，比如垃圾邮件过滤。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立（条件特征独立）性和连续变量的正态性假设为前提，就会导致算法...

代码星球 ·2020-09-20

Python机器学习（十四）Logistic回归算法原理与代码实现

根据现有数据对分类边界线建立回归公式，以此进行分类，其核心是通过最优化算法寻找最佳回归系数（权重系数），主要应用于二分类。二分类的特点是非此即彼，其数学特性符合单位阶跃函数，在...

代码星球 ·2020-09-20

Python机器学习（十）经典算法大全

由于knn算法涉及到距离的概念，KNN算法需要先进行归一化处理fromsklearn.preprocessingimportStandardScalerstandardScaler=StandardScaler()standardScaler.fit(X_train)X_train_standard=standardS...

代码星球 ·2020-09-20

Python机器学习（十三）最近邻居/k-近邻算法

KNN算法是一种基于实例的学习，或者是局部近似和将所有计算推迟到分类之后的惰性学习。用最近的邻居（k）来预测未知数据点。k值是预测精度的一个关键因素，无论是分类还是回归，衡量邻居的权重都非常有用，较近邻居的权重比较远邻居的权重大。KNN算法的缺点是对数据的局部结构非常敏感。计算量大，需要对数据进行规范化处理，使每个数据...

代码星球 ·2020-09-20

Python机器学习（十二）支持向量机算法

最基本的应用是数据分类，特别是对于非线性不可分数据集。支持向量机不仅能对非线性可分数据集进行分类，对于非线性不可分数据集的也可以分类（我认为这才是支持向量机的真正魅力所在，因为现实场景中，样本数据往往是非线性不可分的）。现实场景一：样本数据大部分是线性可分的，但是只是在样本中含有少量噪声或特异点，去掉这些噪声或特异点后...

代码星球 ·2020-09-20

Python机器学习（十一）线性回归算法

回归分析（RegressionAnalysis）是统计学的数据分析方法，目的在于了解两个或多个变量间是否相关、相关方向与强度，并建立数学模型以便观察特定变量来预测其它变量的变化情况。线性回归算法（LinearRegression）的建模过程就是使用数据点来寻找最佳拟合线。公式，y=mx+c，其中y是因变量，x是自变量，...

代码星球 ·2020-09-20

Python机器学习（九）简单神经网络

　深度神经网络算法，是基于神经网络算法的一种拓展，其层数更深，达到多层，本文以简单神经网络为例，利用梯度下降算法进行反向更新来训练神经网络权重和偏向参数，文章最后，基于Python 库实现了一个简单神经网络算法程序，并对异或运算和0-9字符集进行预测。　　利用如下图像结构，通过训练集对其参数进行训练，当有新的...

代码星球 ·2020-09-20

人工智能深度学习入门练习之（7）线性回归

代码实现：importnumpyasnpdefcompute_error_for_line_given_points(b,w,points):totalError=0foriinrange(0,len(points)):x=points[i,0]y=points[i,1]#computermean-squared-er...

代码星球 ·2020-09-20

Python机器学习（九十七）Pandas 绘图

Pandas的另一个优点是与Matplotlib的集成，可以直接绘制DataFrame和Series。注意：如没有安装Matplotlib，需首先安装：pipinstallmatplotlib。importmatplotlib.pyplotaspltplt.rcParams.update({'font.size':20...

代码星球 ·2020-09-19

Python机器学习（九十六）Pandas apply函数

与Python中的列表类似，可以使用for循环遍历DataFrame或Series，但是这样做(尤其是在大型数据集上)非常慢。Pandas中提供了一个高效的替代方案：apply()方法。语法DataFrame.apply(func)Series.apply(func)func –要对数据集中所有元...

代码星球 ·2020-09-19

Python机器学习（九十五）Pandas 有条件访问

有时需要根据条件，访问DataFrame中的数据。例如，找出电影数据集中，某个导演的电影：#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description',...

代码星球 ·2020-09-19

Python机器学习（九十四）Pandas 访问行数据

访问行数据，有两个方法:.loc –使用索引名定位.iloc –使用索引序号定位示例中的数据以电影名作为索引：#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.column...

代码星球 ·2020-09-19

Python机器学习（九十三）Pandas 访问列数据

访问DataFrame中的Series，可以使用DataFrame['列名']方式。#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description','di...

代码星球 ·2020-09-19

Python机器学习（十七）AdaBoost原理与代码实现

Python机器学习（十六）KNN原理与代码实现

Python机器学习（十五）朴素贝叶斯算法原理与代码实现

Python机器学习（十四）Logistic回归算法原理与代码实现

Python机器学习（十）经典算法大全

Python机器学习（十三） 最近邻居/k-近邻算法

Python机器学习（十二）支持向量机算法

Python机器学习（十一）线性回归算法

Python机器学习（九）简单神经网络

人工智能深度学习入门练习之（7）线性回归

Python机器学习（九十七）Pandas 绘图

Python机器学习（九十六）Pandas apply函数

Python机器学习（九十五）Pandas 有条件访问

Python机器学习（九十四）Pandas 访问行数据

Python机器学习（九十三）Pandas 访问列数据

Python机器学习（十三）最近邻居/k-近邻算法