51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#百面机器学习
Python机器学习(三十一)Sklearn K均值聚类
到目前为止,我们已经非常深入地了解了数据集,并且把它分成了训练子集与测试子集。接下来,我们将使用聚类方法训练一个模型,然后使用该模型来预测测试子集的标签,最后评估该模型的性能。聚类(clustering)是在一组未标记的数据中,将相似的数据(点)归到同一个类别中的方法。聚类与分类的最大不同在于分类的目标事先已知,而聚类...
代码星球
·
2020-09-20
Python
机器
学习
三十一
Sklearn
Python机器学习(三十)Sklearn 预处理数据
前面章节中,我们首先加载数据,接着查看数据集的基本信息,然后可视化数据进一步查看数据集信息。接下来,我们开始处理数据,但这之前,通常需要预处理数据。大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进...
代码星球
·
2020-09-20
Python
机器
学习
三十
Sklearn
Python机器学习(二十九)Sklearn 可视化数据:主成分分析(PCA)
主成分分析(PCA)是一种常用于减少大数据集维数的降维方法,把大变量集转换为仍包含大变量集中大部分信息的较小变量集。减少数据集的变量数量,自然是以牺牲精度为代价的,降维的好处是以略低的精度换取简便。因为较小的数据集更易于探索和可视化,并且使机器学习算法更容易和更快地分析数据,而不需处理无关变量。总而言之,主成分分析(P...
代码星球
·
2020-09-20
Python
机器
学习
二十九
Sklearn
Python机器学习(二十八)Sklearn 使用matplotlib可视化数据
digits是一个手写数字的数据集,我们可以使用Python的数据可视化库,比如matplotlib,来查看这些手写数字图像。示例显示digits.images中的手写数字图像。fromsklearnimportdatasets#加载`digits`数据集digits=datasets.load_digits()#导入...
代码星球
·
2020-09-20
Python
机器
学习
二十八
Sklearn
Python机器学习(二十七)Sklearn 数据集基本信息
前面章节中,我们加载了SciKit-Learn自带的数据集digits,可以通过以下语句查看数据集中包含哪些主要内容:digits.keys()输出dict_keys(['data','target','target_names','images','DESCR'])data 样本数据target ...
代码星球
·
2020-09-20
Python
机器
学习
二十七
Sklearn
Python机器学习(二十六)Sklearn 加载数据集
机器学习是计算机科学的一个分支,研究的是无需人类干预,能够自己学习的算法。与TensorFlow不同,Scikit-learn(sklearn)的定位是通用机器学习库,而TensorFlow(tf)的定位主要是深度学习库。数据科学中的第一步通常都是加载数据,我们首先学习怎么使用SciKit-Learn来加载数据集。数据...
代码星球
·
2020-09-20
Python
机器
学习
二十六
Sklearn
Python机器学习(二十五)尬聊机器学习
如果你从来没有使用过机器学习,你会想,这个不就是编程吗?或者,到底机器学习是什么?首先,我们确实是使用编程语言来实现机器学习模型,我们跟计算机其他领域一样,使用同样的编程语言和硬件。但不是每个程序都用了机器学习。对于第二个问题,精确定义机器学习就像定义什么是数学一样难,但我们试图在这章提供一些直观的解释。我们日常交互的...
代码星球
·
2020-09-20
机器
学习
Python
二十五
尬聊
人工智能深度学习入门练习之(9)机器学习与深度学习的区别
近年来,随着科技的快速发展,人工智能不断进入我们的视野中。作为人工智能的核心技术,机器学习和深度学习也变得越来越火。一时间,它们几乎成为了每个人都在谈论的话题。那么,机器学习和深度学习到底是什么,它们之间究竟有什么不同呢?机器学习(MachineLearning,ML)是人工智能的子领域,也是人工智能的核心。它囊括了几...
代码星球
·
2020-09-20
学习
深度
人工智能
入门
习之
人工智能深度学习入门练习之(8)比较深度学习三大框架
人工智能的浪潮正席卷全球,诸多词汇时刻萦绕在我们的耳边,如人工智能,机器学习,深度学习等。“人工智能”的概念早在1956年就被提出,顾名思义用计算机来构造复杂的,拥有与人类智慧同样本质特性的机器。经过几十年的发展,在2012年后,得益于数据量的上涨,运算力的提升和机器学习算法(深度学习)的出现,...
代码星球
·
2020-09-20
深度
学习
人工智能
入门
习之
Python机器学习(二十四)机器学习常见算法分类汇总
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习...
代码星球
·
2020-09-20
机器
学习
Python
二十四
常见
Python机器学习(二十二)马尔科夫算法
隐马尔科夫HMM模型是一类重要的机器学习方法,其主要用于序列数据的分析,广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来,由于RNN等深度学习方法的发展,HMM模型逐渐变得不怎么流行了,但并不意味着完全退出应用领域,甚至在一些轻量级的任务中仍有应用。本系列博客将详细剖析隐马尔科夫链HMM模型,同以...
代码星球
·
2020-09-20
Python
机器
学习
二十二
马尔
Python机器学习(二十一)随机森林算法
一、随机森林算法简介: 在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。LeoBreiman和AdeleCutler发展出推论出随机森林的算法。而"RandomForests"是他们的商标。这个术语是1995年由贝尔实验室...
代码星球
·
2020-09-20
Python
机器
学习
二十一
随机
Python机器学习(二十)决策树系列三—CART原理与代码实现
ID3,C4.5算法缺点ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分,也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中,将不再起作用,所以...
代码星球
·
2020-09-20
Python
机器
学习
二十
决策树
Python机器学习(十九)决策树之系列二—C4.5原理与代码实现
它一般会优先选择有较多属性值的Feature,因为属性值多的特征会有相对较大的信息增益,信息增益反映的是,在给定一个条件以后,不确定性减少的程度,这必然是分得越细的数据集确定性更高,也就是条件熵越小,信息增益越大。为了解决这个问题,C4.5就应运而生,它采用信息增益率来作为选择分支的准则。信息增益率定义为: ...
代码星球
·
2020-09-20
Python
机器
学习
十九
决策树
Python机器学习(十八)决策树之系列一ID3原理与代码实现
你是否玩过二十个问题的游戏,游戏的规则很简单:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题的答案也只能用对或错回答。问问题的人通过推断分解,逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似,用户输人一系列数据,然后给出游戏的答案。如下表假如我告诉你,我有一个海洋生物,它不浮...
代码星球
·
2020-09-20
Python
机器
学习
十八
决策树
首页
上一页
...
92
93
94
95
96
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他