51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#机器学习
吴裕雄--天生自然python机器学习:支持向量机SVM
基于最大间隔分隔数据 importmatplotlibimportmatplotlib.pyplotaspltfromnumpyimport*xcord0=[]ycord0=[]xcord1=[]ycord1=[]markers=[]colors=[]fr=open('F:\machi...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:使用Logistic回归从疝气病症预测病马的死亡率
,除了部分指标主观和难以测量外,该数据还存在一个问题,数据集中有30%的值是缺失的。下面将首先介绍如何处理数据集中的数据缺失问题,然后再利用Logistic回归和随机梯度上升算法来预测病马的生死。准备数据:处理被据中的缺失值因为有时候数据相当昂贵,...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:Logistic回归
假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的做法就是寻找最佳拟合参数...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:使用朴素贝叶斯过滤垃圾邮件
使用朴素贝叶斯解决一些现实生活中的问题时,需要先从文本内容得到字符串列表,然后生成词向量。准备数据:切分文本测试算法:使用朴素贝叶斯进行交叉验证文件解析及完整的垃圾邮件测试函数defcreateVocabList(dataSet):vocabSet=set([])#createemptysetfordocumentin...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:朴素贝叶斯算法
分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。概率论是许多机器学习算法的基础在计算特征值取某个值的概率时涉及了一些概率知识,在那里我们先统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,就得到了特征取该值的概率。首先从一个最简单的概率分类器开始,然后...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:使用决策树预测隐形眼镜类型
解决策树如何预测患者需要佩戴的隐形眼镜类型。使用小数据集,我们就可以利用决策树学到很多知识:眼科医生是如何判断患者需要佩戴的镜片类型;一旦理解了决策树的工作原理,我们甚至也可以帮助人们判断需要佩戴的镜片类型。 隐形眼镜数据集是非常著名的数据集,它包含很多患者眼部状况的观察条...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:决策树算法
我们经常使用决策树处理分类问题’近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。 K-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据的内在含义,决策树的主要优势就在于数据形式非常容易...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:KNN-近邻算法在手写识别系统上的应用
需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小®:宽髙是32像素*32像素的黑白图像。尽管采用文本格式存储图像不能有效地利用内存空间,但是为了方便理解,我们还是将图像转换为文本格式。 准备数据:将图像转换为测试向量每个数字大约有200个样本;目录中包...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:使用K-近邻算法改进约会网站的配对效果
在约会网站使用K-近邻算法 准备数据:从文本文件中解析数据海伦收集约会数据巳经有了一段时间,她把这些数据存放在文本文件(1如1^及抓比加中,每个样本数据占据一行,总共有1000行。海伦的样本主要包含以下3种特征:每年获得的飞行常客里程数玩视频游戏所耗时间百分比每周消费的冰淇淋公升数将文...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:K-近邻算法介绍
k-近邻算法概述简单地说,谷近邻算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关...
代码星球
·
2020-05-23
吴裕雄
天生
自然
python
机器
吴裕雄--天生自然python机器学习:机器学习简介
除却一些无关紧要的情况,人们很难直接从原始数据本身获得所需信息。例如,对于垃圾邮件的检测,侦测一个单词是否存在并没有太大的作用,然而当某几个特定单词同时出现时,再辅以考察邮件长度及其他因素,人们就可以更准确地判定该邮件是否为垃圾邮件。简单地说,机器学习就是把无序的数据转换成有用的信息。机器学习横跨计算机科学、工程技术和...
代码星球
·
2020-05-23
机器
学习
吴裕雄
天生
自然
从了解机器学习开始
一、什么是机器学习 1、简单的说,机器学习就是把无序的数据转换成有用的信息 机器学习横跨计算机科学,工程技术和统计学等多个学科,需要多学科的专业知识,它可以作为实际工具应用于从政治到地质学的多个领域,解决其中的很多问题,甚至可以说,机器学习对于任何需要解释并操作数据的领域有所作为。二、传感器和海量数据 1、虽然我...
代码星球
·
2020-05-17
了解
机器
学习
开始
AI-人工智能/机器学习 seetafaceJNI
基于中科院seetaface2进行封装的JAVA人脸识别库,支持人脸识别、1:1比对、1:N比对。项目介绍基于中科院seetaface2进行封装的JAVA人脸识别算法库,支持人脸识别、1:1比对、1:N比对。seetaface2:https://github.com/seetaface/SeetaFaceEngine2...
代码星球
·
2020-05-17
AI-
人工智能
机器
学习
seetafaceJNI
使用SGD(Stochastic Gradient Descent)进行大规模机器学习
原贴地址:http://fuliang.iteye.com/blog/1482002 其它参考资料:http://en.wikipedia.org/wiki/Stochastic_gradient_descent 1.基于梯度下降的学习 ...
代码星球
·
2020-05-14
使用
SGD
Stochastic
Gradient
Descent
C#.NET开源项目、机器学习、商务智能
所以原谅我,不能把所有的都发上来,太杂了,反而不好。 这个组件很小,主要是对时间日期,特别是处理时间间隔以及时间范围非常方便。虽然.NET自带了时间日期的部分功能,但可能还不强大。这个组件就是增强版本。详细功能可以看项目主页的介绍。在CodeProject: &n...
代码星球
·
2020-05-13
C#.NET
开源
项目
机器
学习
首页
上一页
...
17
18
19
20
21
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他