#算法的乐趣

Python机器学习(二十四)机器学习常见算法分类汇总

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习...

Python机器学习(二十二)马尔科夫算法

隐马尔科夫HMM模型是一类重要的机器学习方法,其主要用于序列数据的分析,广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来,由于RNN等深度学习方法的发展,HMM模型逐渐变得不怎么流行了,但并不意味着完全退出应用领域,甚至在一些轻量级的任务中仍有应用。本系列博客将详细剖析隐马尔科夫链HMM模型,同以...

Python机器学习(二十一)随机森林算法

一、随机森林算法简介:    在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。LeoBreiman和AdeleCutler发展出推论出随机森林的算法。而"RandomForests"是他们的商标。这个术语是1995年由贝尔实验室...

Python机器学习(十五)朴素贝叶斯算法原理与代码实现

朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法...

Python机器学习(十四)Logistic回归算法原理与代码实现

      根据现有数据对分类边界线建立回归公式,以此进行分类,其核心是通过最优化算法寻找最佳回归系数(权重系数),主要应用于二分类。      二分类的特点是非此即彼,其数学特性符合单位阶跃函数,在...

Python机器学习(十)经典算法大全

由于knn算法涉及到距离的概念,KNN算法需要先进行归一化处理fromsklearn.preprocessingimportStandardScalerstandardScaler=StandardScaler()standardScaler.fit(X_train)X_train_standard=standardS...

Python机器学习(十三) 最近邻居/k-近邻算法

KNN算法是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。用最近的邻居(k)来预测未知数据点。k值是预测精度的一个关键因素,无论是分类还是回归,衡量邻居的权重都非常有用,较近邻居的权重比较远邻居的权重大。KNN算法的缺点是对数据的局部结构非常敏感。计算量大,需要对数据进行规范化处理,使每个数据...

Python机器学习(十二)支持向量机算法

最基本的应用是数据分类,特别是对于非线性不可分数据集。支持向量机不仅能对非线性可分数据集进行分类,对于非线性不可分数据集的也可以分类(我认为这才是支持向量机的真正魅力所在,因为现实场景中,样本数据往往是非线性不可分的)。现实场景一:样本数据大部分是线性可分的,但是只是在样本中含有少量噪声或特异点,去掉这些噪声或特异点后...

Python机器学习(十一)线性回归算法

回归分析(RegressionAnalysis)是统计学的数据分析方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测其它变量的变化情况。线性回归算法(LinearRegression)的建模过程就是使用数据点来寻找最佳拟合线。公式,y=mx+c,其中y是因变量,x是自变量,...

数据结构之(3)python实现排序算法

冒泡排序(英语:BubbleSort)是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。冒泡排序算法的...

Tensorflow从0到1(3)之实战传统机器算法

代码实现:importnumpyasnpimporttensorflow.compat.v1astftf.disable_v2_behavior()#使用静态图模式运行以下代码asserttf.__version__.startswith('2.')sess=tf.Session()x_vals=np.array([1...

python机器学习(四)分类算法-决策树

 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。相亲 相亲决策树女儿:多大年纪了?母亲:26。女儿:长的帅不帅?母亲:挺帅的。女儿:收入高不?母亲:不算很高,中等情况。女儿:是公务员不?母亲:是,在税务局上班呢。女儿...

python 机器学习(二)分类算法-k近邻算法

 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法最早是由Cover和Hart提出的一种分类算法.两个样本的距离可以通过如下公式计算,又叫欧式距离。比如说,a(a1,a2,a3),b(b1,b2,b3) 欧式距离sklear...

spark机器学习从0到1利用机器算法RFM模型做用户价值分析(十七)

 在产品迭代过程中,通常需要根据用户的属性进行归类,也就是通过分析数据,对用户进行归类,以便于在推送及转化过程中获得更大的收益。本案例是基于某互联网公司的实际用户购票数据为研究对象,对用户购票的时间,购买的金额进行了采集,每个用户用手机号来区别唯一性。数据分析人员根据用户购买的时间和金额,通过建立RFM模型,...

spark机器学习从0到1聚类算法 (十)

  1.1、定义按照某一个特定的标准(比如距离),把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不再同一个簇内的数据对象的差异性也尽可能的大。聚类属于典型的无监督学习(UnsupervisedLearning)方法。与监督学习(如分类器)相比,无监督学习的训练集没有人...
首页上一页...4041424344...下一页尾页