51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#机器视觉
Python机器学习(三十)Sklearn 预处理数据
前面章节中,我们首先加载数据,接着查看数据集的基本信息,然后可视化数据进一步查看数据集信息。接下来,我们开始处理数据,但这之前,通常需要预处理数据。大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进...
代码星球
·
2020-09-20
Python
机器
学习
三十
Sklearn
Python机器学习(二十九)Sklearn 可视化数据:主成分分析(PCA)
主成分分析(PCA)是一种常用于减少大数据集维数的降维方法,把大变量集转换为仍包含大变量集中大部分信息的较小变量集。减少数据集的变量数量,自然是以牺牲精度为代价的,降维的好处是以略低的精度换取简便。因为较小的数据集更易于探索和可视化,并且使机器学习算法更容易和更快地分析数据,而不需处理无关变量。总而言之,主成分分析(P...
代码星球
·
2020-09-20
Python
机器
学习
二十九
Sklearn
Python机器学习(二十八)Sklearn 使用matplotlib可视化数据
digits是一个手写数字的数据集,我们可以使用Python的数据可视化库,比如matplotlib,来查看这些手写数字图像。示例显示digits.images中的手写数字图像。fromsklearnimportdatasets#加载`digits`数据集digits=datasets.load_digits()#导入...
代码星球
·
2020-09-20
Python
机器
学习
二十八
Sklearn
Python机器学习(二十七)Sklearn 数据集基本信息
前面章节中,我们加载了SciKit-Learn自带的数据集digits,可以通过以下语句查看数据集中包含哪些主要内容:digits.keys()输出dict_keys(['data','target','target_names','images','DESCR'])data 样本数据target ...
代码星球
·
2020-09-20
Python
机器
学习
二十七
Sklearn
Python机器学习(二十六)Sklearn 加载数据集
机器学习是计算机科学的一个分支,研究的是无需人类干预,能够自己学习的算法。与TensorFlow不同,Scikit-learn(sklearn)的定位是通用机器学习库,而TensorFlow(tf)的定位主要是深度学习库。数据科学中的第一步通常都是加载数据,我们首先学习怎么使用SciKit-Learn来加载数据集。数据...
代码星球
·
2020-09-20
Python
机器
学习
二十六
Sklearn
Python机器学习(二十五)尬聊机器学习
如果你从来没有使用过机器学习,你会想,这个不就是编程吗?或者,到底机器学习是什么?首先,我们确实是使用编程语言来实现机器学习模型,我们跟计算机其他领域一样,使用同样的编程语言和硬件。但不是每个程序都用了机器学习。对于第二个问题,精确定义机器学习就像定义什么是数学一样难,但我们试图在这章提供一些直观的解释。我们日常交互的...
代码星球
·
2020-09-20
机器
学习
Python
二十五
尬聊
人工智能深度学习入门练习之(9)机器学习与深度学习的区别
近年来,随着科技的快速发展,人工智能不断进入我们的视野中。作为人工智能的核心技术,机器学习和深度学习也变得越来越火。一时间,它们几乎成为了每个人都在谈论的话题。那么,机器学习和深度学习到底是什么,它们之间究竟有什么不同呢?机器学习(MachineLearning,ML)是人工智能的子领域,也是人工智能的核心。它囊括了几...
代码星球
·
2020-09-20
学习
深度
人工智能
入门
习之
Python机器学习(二十四)机器学习常见算法分类汇总
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习...
代码星球
·
2020-09-20
机器
学习
Python
二十四
常见
Python机器学习(二十二)马尔科夫算法
隐马尔科夫HMM模型是一类重要的机器学习方法,其主要用于序列数据的分析,广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来,由于RNN等深度学习方法的发展,HMM模型逐渐变得不怎么流行了,但并不意味着完全退出应用领域,甚至在一些轻量级的任务中仍有应用。本系列博客将详细剖析隐马尔科夫链HMM模型,同以...
代码星球
·
2020-09-20
Python
机器
学习
二十二
马尔
Python机器学习(二十一)随机森林算法
一、随机森林算法简介: 在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。LeoBreiman和AdeleCutler发展出推论出随机森林的算法。而"RandomForests"是他们的商标。这个术语是1995年由贝尔实验室...
代码星球
·
2020-09-20
Python
机器
学习
二十一
随机
Python机器学习(二十)决策树系列三—CART原理与代码实现
ID3,C4.5算法缺点ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分,也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中,将不再起作用,所以...
代码星球
·
2020-09-20
Python
机器
学习
二十
决策树
Python机器学习(十九)决策树之系列二—C4.5原理与代码实现
它一般会优先选择有较多属性值的Feature,因为属性值多的特征会有相对较大的信息增益,信息增益反映的是,在给定一个条件以后,不确定性减少的程度,这必然是分得越细的数据集确定性更高,也就是条件熵越小,信息增益越大。为了解决这个问题,C4.5就应运而生,它采用信息增益率来作为选择分支的准则。信息增益率定义为: ...
代码星球
·
2020-09-20
Python
机器
学习
十九
决策树
Python机器学习(十八)决策树之系列一ID3原理与代码实现
你是否玩过二十个问题的游戏,游戏的规则很简单:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题的答案也只能用对或错回答。问问题的人通过推断分解,逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似,用户输人一系列数据,然后给出游戏的答案。如下表假如我告诉你,我有一个海洋生物,它不浮...
代码星球
·
2020-09-20
Python
机器
学习
十八
决策树
Python机器学习(十七)AdaBoost原理与代码实现
Adaboost体现的是“三个臭皮匠,胜过一个诸葛亮”,它是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。训练过程如下(参考Andy的机器学习--浅析Adaboost算法,他说得非常形象,贴切。)&nbs...
代码星球
·
2020-09-20
Python
机器
学习
十七
AdaBoost
Python机器学习(十六)KNN原理与代码实现
KNN(k-NearestNeighbour):K-近邻算法,主要思想可以归结为一个成语:物以类聚1.1工作原理给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k(k<=20)个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。https://www.cnblogs.com/ybj...
代码星球
·
2020-09-20
Python
机器
学习
十六
KNN
首页
上一页
...
11
12
13
14
15
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他