算法的乐趣主题的文章列表，还有算法的乐趣的技术要点_第42页

Python机器学习（二十四）机器学习常见算法分类汇总

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法，以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是，很多算法是一类算法，而有些算法又是从其他算法中延伸出来的。这里，我们从两个方面来给大家介绍，第一个方面是学习...

代码星球 ·2020-09-20

Python机器学习（二十二）马尔科夫算法

隐马尔科夫HMM模型是一类重要的机器学习方法，其主要用于序列数据的分析，广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来，由于RNN等深度学习方法的发展，HMM模型逐渐变得不怎么流行了，但并不意味着完全退出应用领域，甚至在一些轻量级的任务中仍有应用。本系列博客将详细剖析隐马尔科夫链HMM模型，同以...

代码星球 ·2020-09-20

Python机器学习（二十一）随机森林算法

一、随机森林算法简介：在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。LeoBreiman和AdeleCutler发展出推论出随机森林的算法。而"RandomForests"是他们的商标。这个术语是1995年由贝尔实验室...

代码星球 ·2020-09-20

Python机器学习（十五）朴素贝叶斯算法原理与代码实现

朴素贝叶斯是经典的机器学习算法之一，也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单，也很容易实现，多用于文本分类，比如垃圾邮件过滤。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立（条件特征独立）性和连续变量的正态性假设为前提，就会导致算法...

代码星球 ·2020-09-20

Python机器学习（十四）Logistic回归算法原理与代码实现

根据现有数据对分类边界线建立回归公式，以此进行分类，其核心是通过最优化算法寻找最佳回归系数（权重系数），主要应用于二分类。二分类的特点是非此即彼，其数学特性符合单位阶跃函数，在...

代码星球 ·2020-09-20

Python机器学习（十）经典算法大全

由于knn算法涉及到距离的概念，KNN算法需要先进行归一化处理fromsklearn.preprocessingimportStandardScalerstandardScaler=StandardScaler()standardScaler.fit(X_train)X_train_standard=standardS...

代码星球 ·2020-09-20

Python机器学习（十三）最近邻居/k-近邻算法

KNN算法是一种基于实例的学习，或者是局部近似和将所有计算推迟到分类之后的惰性学习。用最近的邻居（k）来预测未知数据点。k值是预测精度的一个关键因素，无论是分类还是回归，衡量邻居的权重都非常有用，较近邻居的权重比较远邻居的权重大。KNN算法的缺点是对数据的局部结构非常敏感。计算量大，需要对数据进行规范化处理，使每个数据...

代码星球 ·2020-09-20

Python机器学习（十二）支持向量机算法

最基本的应用是数据分类，特别是对于非线性不可分数据集。支持向量机不仅能对非线性可分数据集进行分类，对于非线性不可分数据集的也可以分类（我认为这才是支持向量机的真正魅力所在，因为现实场景中，样本数据往往是非线性不可分的）。现实场景一：样本数据大部分是线性可分的，但是只是在样本中含有少量噪声或特异点，去掉这些噪声或特异点后...

代码星球 ·2020-09-20

Python机器学习（十一）线性回归算法

回归分析（RegressionAnalysis）是统计学的数据分析方法，目的在于了解两个或多个变量间是否相关、相关方向与强度，并建立数学模型以便观察特定变量来预测其它变量的变化情况。线性回归算法（LinearRegression）的建模过程就是使用数据点来寻找最佳拟合线。公式，y=mx+c，其中y是因变量，x是自变量，...

代码星球 ·2020-09-20

数据结构之（3）python实现排序算法

冒泡排序（英语：BubbleSort）是一种简单的排序算法。它重复地遍历要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。冒泡排序算法的...

代码星球 ·2020-09-19

Tensorflow从0到1（3）之实战传统机器算法

代码实现：importnumpyasnpimporttensorflow.compat.v1astftf.disable_v2_behavior()#使用静态图模式运行以下代码asserttf.__version__.startswith('2.')sess=tf.Session()x_vals=np.array([1...

代码星球 ·2020-09-19

python机器学习（四）分类算法-决策树

决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-then结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法。相亲相亲决策树女儿：多大年纪了？母亲：26。女儿：长的帅不帅？母亲：挺帅的。女儿：收入高不？母亲：不算很高，中等情况。女儿：是公务员不？母亲：是，在税务局上班呢。女儿...

代码星球 ·2020-09-19

python 机器学习（二）分类算法-k近邻算法

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。KNN算法最早是由Cover和Hart提出的一种分类算法.两个样本的距离可以通过如下公式计算，又叫欧式距离。比如说，a(a1,a2,a3),b(b1,b2,b3) 欧式距离sklear...

代码星球 ·2020-09-19

spark机器学习从0到1利用机器算法RFM模型做用户价值分析（十七）

在产品迭代过程中，通常需要根据用户的属性进行归类，也就是通过分析数据，对用户进行归类，以便于在推送及转化过程中获得更大的收益。本案例是基于某互联网公司的实际用户购票数据为研究对象，对用户购票的时间，购买的金额进行了采集，每个用户用手机号来区别唯一性。数据分析人员根据用户购买的时间和金额，通过建立RFM模型，...

代码星球 ·2020-09-19

spark机器学习从0到1聚类算法 (十）

1.1、定义按照某一个特定的标准（比如距离），把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不再同一个簇内的数据对象的差异性也尽可能的大。聚类属于典型的无监督学习（UnsupervisedLearning）方法。与监督学习（如分类器）相比，无监督学习的训练集没有人...

代码星球 ·2020-09-19

Python机器学习（二十四）机器学习常见算法分类汇总

Python机器学习（二十二）马尔科夫算法

Python机器学习（二十一）随机森林算法

Python机器学习（十五）朴素贝叶斯算法原理与代码实现

Python机器学习（十四）Logistic回归算法原理与代码实现

Python机器学习（十）经典算法大全

Python机器学习（十三） 最近邻居/k-近邻算法

Python机器学习（十二）支持向量机算法

Python机器学习（十一）线性回归算法

数据结构之（3）python实现排序算法

Tensorflow从0到1（3）之实战传统机器算法

python机器学习（四）分类算法-决策树

python 机器学习（二）分类算法-k近邻算法

spark机器学习从0到1利用机器算法RFM模型做用户价值分析（十七）

spark机器学习从0到1聚类算法 (十）

Python机器学习（十三）最近邻居/k-近邻算法