机器视觉主题的文章列表，还有机器视觉的技术要点_第13页

Python机器学习（三十）Sklearn 预处理数据

前面章节中，我们首先加载数据，接着查看数据集的基本信息，然后可视化数据进一步查看数据集信息。接下来，我们开始处理数据，但这之前，通常需要预处理数据。大型数据分析项目中，数据来源不同，量纲及量纲单位不同，为了让它们具备可比性，需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进...

代码星球 ·2020-09-20

Python机器学习（二十九）Sklearn 可视化数据:主成分分析(PCA)

主成分分析(PCA)是一种常用于减少大数据集维数的降维方法，把大变量集转换为仍包含大变量集中大部分信息的较小变量集。减少数据集的变量数量，自然是以牺牲精度为代价的，降维的好处是以略低的精度换取简便。因为较小的数据集更易于探索和可视化，并且使机器学习算法更容易和更快地分析数据，而不需处理无关变量。总而言之，主成分分析(P...

代码星球 ·2020-09-20

Python机器学习（二十八）Sklearn 使用matplotlib可视化数据

digits是一个手写数字的数据集，我们可以使用Python的数据可视化库，比如matplotlib，来查看这些手写数字图像。示例显示digits.images中的手写数字图像。fromsklearnimportdatasets#加载`digits`数据集digits=datasets.load_digits()#导入...

代码星球 ·2020-09-20

Python机器学习（二十七）Sklearn 数据集基本信息

前面章节中，我们加载了SciKit-Learn自带的数据集digits，可以通过以下语句查看数据集中包含哪些主要内容：digits.keys()输出dict_keys(['data','target','target_names','images','DESCR']）data 样本数据target ...

代码星球 ·2020-09-20

Python机器学习（二十六）Sklearn 加载数据集

机器学习是计算机科学的一个分支，研究的是无需人类干预，能够自己学习的算法。与TensorFlow不同，Scikit-learn(sklearn)的定位是通用机器学习库，而TensorFlow(tf)的定位主要是深度学习库。数据科学中的第一步通常都是加载数据，我们首先学习怎么使用SciKit-Learn来加载数据集。数据...

代码星球 ·2020-09-20

Python机器学习（二十五）尬聊机器学习

如果你从来没有使用过机器学习，你会想，这个不就是编程吗？或者，到底机器学习是什么？首先，我们确实是使用编程语言来实现机器学习模型，我们跟计算机其他领域一样，使用同样的编程语言和硬件。但不是每个程序都用了机器学习。对于第二个问题，精确定义机器学习就像定义什么是数学一样难，但我们试图在这章提供一些直观的解释。我们日常交互的...

代码星球 ·2020-09-20

人工智能深度学习入门练习之（9）机器学习与深度学习的区别

近年来，随着科技的快速发展，人工智能不断进入我们的视野中。作为人工智能的核心技术，机器学习和深度学习也变得越来越火。一时间，它们几乎成为了每个人都在谈论的话题。那么，机器学习和深度学习到底是什么，它们之间究竟有什么不同呢？机器学习(MachineLearning，ML)是人工智能的子领域，也是人工智能的核心。它囊括了几...

代码星球 ·2020-09-20

Python机器学习（二十四）机器学习常见算法分类汇总

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法，以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是，很多算法是一类算法，而有些算法又是从其他算法中延伸出来的。这里，我们从两个方面来给大家介绍，第一个方面是学习...

代码星球 ·2020-09-20

Python机器学习（二十二）马尔科夫算法

隐马尔科夫HMM模型是一类重要的机器学习方法，其主要用于序列数据的分析，广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来，由于RNN等深度学习方法的发展，HMM模型逐渐变得不怎么流行了，但并不意味着完全退出应用领域，甚至在一些轻量级的任务中仍有应用。本系列博客将详细剖析隐马尔科夫链HMM模型，同以...

代码星球 ·2020-09-20

Python机器学习（二十一）随机森林算法

一、随机森林算法简介：在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。LeoBreiman和AdeleCutler发展出推论出随机森林的算法。而"RandomForests"是他们的商标。这个术语是1995年由贝尔实验室...

代码星球 ·2020-09-20

Python机器学习（二十）决策树系列三—CART原理与代码实现

ID3，C4.5算法缺点ID3决策树可以有多个分支，但是不能处理特征值为连续的情况。在ID3中，每次根据“最大信息熵增益”选取当前最佳的特征来分割数据，并按照该特征的所有取值来切分，也就是说如果一个特征有4种取值，数据将被切分4份，一旦按某特征切分后，该特征在之后的算法执行中，将不再起作用，所以...

代码星球 ·2020-09-20

Python机器学习（十九）决策树之系列二—C4.5原理与代码实现

它一般会优先选择有较多属性值的Feature，因为属性值多的特征会有相对较大的信息增益，信息增益反映的是，在给定一个条件以后，不确定性减少的程度，这必然是分得越细的数据集确定性更高，也就是条件熵越小，信息增益越大。为了解决这个问题，C4.5就应运而生，它采用信息增益率来作为选择分支的准则。信息增益率定义为： ...

代码星球 ·2020-09-20

Python机器学习（十八）决策树之系列一ID3原理与代码实现

你是否玩过二十个问题的游戏，游戏的规则很简单：参与游戏的一方在脑海里想某个事物，其他参与者向他提问题，只允许提20个问题，问题的答案也只能用对或错回答。问问题的人通过推断分解，逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似，用户输人一系列数据，然后给出游戏的答案。如下表假如我告诉你，我有一个海洋生物，它不浮...

代码星球 ·2020-09-20

Python机器学习（十七）AdaBoost原理与代码实现

Adaboost体现的是“三个臭皮匠，胜过一个诸葛亮”，它是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器（强分类器）。训练过程如下（参考Andy的机器学习--浅析Adaboost算法，他说得非常形象，贴切。）&nbs...

代码星球 ·2020-09-20

Python机器学习（十六）KNN原理与代码实现

KNN（k-NearestNeighbour）：K-近邻算法，主要思想可以归结为一个成语：物以类聚1.1工作原理给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的k（k<=20）个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。https://www.cnblogs.com/ybj...

代码星球 ·2020-09-20