#百面机器学习

Python机器学习(十七)AdaBoost原理与代码实现

Adaboost体现的是“三个臭皮匠,胜过一个诸葛亮”,它是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。训练过程如下(参考Andy的机器学习--浅析Adaboost算法,他说得非常形象,贴切。)&nbs...

Python机器学习(十六)KNN原理与代码实现

KNN(k-NearestNeighbour):K-近邻算法,主要思想可以归结为一个成语:物以类聚1.1工作原理给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k(k<=20)个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。https://www.cnblogs.com/ybj...

Python机器学习(十五)朴素贝叶斯算法原理与代码实现

朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法...

Python机器学习(十四)Logistic回归算法原理与代码实现

      根据现有数据对分类边界线建立回归公式,以此进行分类,其核心是通过最优化算法寻找最佳回归系数(权重系数),主要应用于二分类。      二分类的特点是非此即彼,其数学特性符合单位阶跃函数,在...

Python机器学习(十)经典算法大全

由于knn算法涉及到距离的概念,KNN算法需要先进行归一化处理fromsklearn.preprocessingimportStandardScalerstandardScaler=StandardScaler()standardScaler.fit(X_train)X_train_standard=standardS...

Python机器学习(十三) 最近邻居/k-近邻算法

KNN算法是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。用最近的邻居(k)来预测未知数据点。k值是预测精度的一个关键因素,无论是分类还是回归,衡量邻居的权重都非常有用,较近邻居的权重比较远邻居的权重大。KNN算法的缺点是对数据的局部结构非常敏感。计算量大,需要对数据进行规范化处理,使每个数据...

Python机器学习(十二)支持向量机算法

最基本的应用是数据分类,特别是对于非线性不可分数据集。支持向量机不仅能对非线性可分数据集进行分类,对于非线性不可分数据集的也可以分类(我认为这才是支持向量机的真正魅力所在,因为现实场景中,样本数据往往是非线性不可分的)。现实场景一:样本数据大部分是线性可分的,但是只是在样本中含有少量噪声或特异点,去掉这些噪声或特异点后...

Python机器学习(十一)线性回归算法

回归分析(RegressionAnalysis)是统计学的数据分析方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测其它变量的变化情况。线性回归算法(LinearRegression)的建模过程就是使用数据点来寻找最佳拟合线。公式,y=mx+c,其中y是因变量,x是自变量,...

Python机器学习(九)简单神经网络

 深度神经网络算法,是基于神经网络算法的一种拓展,其层数更深,达到多层,本文以简单神经网络为例,利用梯度下降算法进行反向更新来训练神经网络权重和偏向参数,文章最后,基于Python 库实现了一个简单神经网络算法程序,并对异或运算和0-9字符集进行预测。  利用如下图像结构,通过训练集对其参数进行训练,当有新的...

人工智能深度学习入门练习之(7)线性回归

代码实现:importnumpyasnpdefcompute_error_for_line_given_points(b,w,points):totalError=0foriinrange(0,len(points)):x=points[i,0]y=points[i,1]#computermean-squared-er...

Python机器学习(九十七)Pandas 绘图

Pandas的另一个优点是与Matplotlib的集成,可以直接绘制DataFrame和Series。注意:如没有安装Matplotlib,需首先安装:pipinstallmatplotlib。importmatplotlib.pyplotaspltplt.rcParams.update({'font.size':20...

Python机器学习(九十六)Pandas apply函数

与Python中的列表类似,可以使用for循环遍历DataFrame或Series,但是这样做(尤其是在大型数据集上)非常慢。Pandas中提供了一个高效的替代方案:apply()方法。语法DataFrame.apply(func)Series.apply(func)func –要对数据集中所有元...

Python机器学习(九十五)Pandas 有条件访问

有时需要根据条件,访问DataFrame中的数据。例如,找出电影数据集中,某个导演的电影:#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description',...

Python机器学习(九十四)Pandas 访问行数据

访问行数据,有两个方法:.loc –使用索引名定位.iloc –使用索引序号定位示例中的数据以电影名作为索引:#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.column...

Python机器学习(九十三)Pandas 访问列数据

访问DataFrame中的Series,可以使用DataFrame['列名']方式。#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description','di...
首页上一页...9394959697...下一页尾页