#新机器

吴裕雄--天生自然python机器学习:支持向量机SVM

基于最大间隔分隔数据   importmatplotlibimportmatplotlib.pyplotaspltfromnumpyimport*xcord0=[]ycord0=[]xcord1=[]ycord1=[]markers=[]colors=[]fr=open('F:\machi...

吴裕雄--天生自然python机器学习:使用Logistic回归从疝气病症预测病马的死亡率

      ,除了部分指标主观和难以测量外,该数据还存在一个问题,数据集中有30%的值是缺失的。下面将首先介绍如何处理数据集中的数据缺失问题,然后再利用Logistic回归和随机梯度上升算法来预测病马的生死。准备数据:处理被据中的缺失值因为有时候数据相当昂贵,...

吴裕雄--天生自然python机器学习:Logistic回归

假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的做法就是寻找最佳拟合参数...

吴裕雄--天生自然python机器学习:使用朴素贝叶斯过滤垃圾邮件

使用朴素贝叶斯解决一些现实生活中的问题时,需要先从文本内容得到字符串列表,然后生成词向量。准备数据:切分文本测试算法:使用朴素贝叶斯进行交叉验证文件解析及完整的垃圾邮件测试函数defcreateVocabList(dataSet):vocabSet=set([])#createemptysetfordocumentin...

吴裕雄--天生自然python机器学习:朴素贝叶斯算法

分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。概率论是许多机器学习算法的基础在计算特征值取某个值的概率时涉及了一些概率知识,在那里我们先统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,就得到了特征取该值的概率。首先从一个最简单的概率分类器开始,然后...

吴裕雄--天生自然python机器学习:使用决策树预测隐形眼镜类型

解决策树如何预测患者需要佩戴的隐形眼镜类型。使用小数据集,我们就可以利用决策树学到很多知识:眼科医生是如何判断患者需要佩戴的镜片类型;一旦理解了决策树的工作原理,我们甚至也可以帮助人们判断需要佩戴的镜片类型。    隐形眼镜数据集是非常著名的数据集,它包含很多患者眼部状况的观察条...

吴裕雄--天生自然python机器学习:决策树算法

我们经常使用决策树处理分类问题’近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。 K-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据的内在含义,决策树的主要优势就在于数据形式非常容易...

吴裕雄--天生自然python机器学习:KNN-近邻算法在手写识别系统上的应用

需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小®:宽髙是32像素*32像素的黑白图像。尽管采用文本格式存储图像不能有效地利用内存空间,但是为了方便理解,我们还是将图像转换为文本格式。    准备数据:将图像转换为测试向量每个数字大约有200个样本;目录中包...

吴裕雄--天生自然python机器学习:使用K-近邻算法改进约会网站的配对效果

在约会网站使用K-近邻算法   准备数据:从文本文件中解析数据海伦收集约会数据巳经有了一段时间,她把这些数据存放在文本文件(1如1^及抓比加中,每个样本数据占据一行,总共有1000行。海伦的样本主要包含以下3种特征:每年获得的飞行常客里程数玩视频游戏所耗时间百分比每周消费的冰淇淋公升数将文...

吴裕雄--天生自然python机器学习:K-近邻算法介绍

k-近邻算法概述简单地说,谷近邻算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关...

吴裕雄--天生自然python机器学习:机器学习简介

除却一些无关紧要的情况,人们很难直接从原始数据本身获得所需信息。例如,对于垃圾邮件的检测,侦测一个单词是否存在并没有太大的作用,然而当某几个特定单词同时出现时,再辅以考察邮件长度及其他因素,人们就可以更准确地判定该邮件是否为垃圾邮件。简单地说,机器学习就是把无序的数据转换成有用的信息。机器学习横跨计算机科学、工程技术和...

用canvas绘制android机器人

直接上代码:<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>用canvas绘制android机器人</title></head><body><...

window下在同一台机器上安装多个版本jdk,修改环境变量不生效问题处理办法

(2014-05-1911:34:44)转载▼ 我最后还是卸载了jdk1.6,重新配置环境变量用jdkwindow下在同一台机器上安装多个版本jdk,修改环境变量不生效问题处理办法 本机已经安装了jdk1.7,而比较早期的项目需要依赖jdk1.6,于是同时在本机安装了jdk1.6和jdk1.7.&n...

从了解机器学习开始

一、什么是机器学习  1、简单的说,机器学习就是把无序的数据转换成有用的信息  机器学习横跨计算机科学,工程技术和统计学等多个学科,需要多学科的专业知识,它可以作为实际工具应用于从政治到地质学的多个领域,解决其中的很多问题,甚至可以说,机器学习对于任何需要解释并操作数据的领域有所作为。二、传感器和海量数据  1、虽然我...
代码星球 ·2020-05-17

AI-人工智能/机器学习 seetafaceJNI

基于中科院seetaface2进行封装的JAVA人脸识别库,支持人脸识别、1:1比对、1:N比对。项目介绍基于中科院seetaface2进行封装的JAVA人脸识别算法库,支持人脸识别、1:1比对、1:N比对。seetaface2:https://github.com/seetaface/SeetaFaceEngine2...
首页上一页...2223242526...下一页尾页