#机器学习

数据归一化Scaler-机器学习算法

//2019.08.03下午#机器学习算法的数据归一化(featurescaling)1、数据归一化的必要性:对于机器学习算法的基础训练数据,由于数据类型的不同,其单位及其量纲也是不一样的,而也正是因为如此,有时它会使得训练集中每个样本的不同列数据大小差异较大,即数量级相差比较大,这会导致在机器学习算法中不同列数据的权...

机器学习算法的整体流程(非常易懂)

1、机器学习算法的整体使用步骤如下:(1)从scikitlearn库中调用相应的机器学习算法模块;(2)输入相应的算法参数定义一个新的算法;(3)输入基础训练数据集利用scaler对其进行数据归一化处理(4)对于归一化的数据集进行机器学习算法的训练fit过程;(5)输入测试数据集对其结果进行预测predict;(6)将...

机器学习算法中的网格搜索GridSearch实现(以k-近邻算法参数寻最优为例)

机器学习算法参数的网格搜索实现://2019.08.031、scikitlearn库中调用网格搜索的方法为:Gridsearch,它的搜索方式比较统一简单,其对于算法批判的标准比较复杂,是一种复合交叉批判方式,不仅仅是准确率。其具体的实现方式如下(以KNN算法的三大常用超参数为例):#使用scikitlearn中的gr...

k-近邻算法原理入门-机器学习

//2019.08.01下午机器学习算法1——k近邻算法1、k近邻算法是学习机器学习算法最为经典和简单的算法,它是机器学习算法入门最好的算法之一,可以非常好并且快速地理解机器学习的算法的框架与应用。2、kNN机器学习算法具有以下的特点:(1)思想极度简单(2)应用的数学知识非常少(3)解决相关问...

python机器学习基本概念快速入门

 //2019.08.01机器学习基础入门1-21、半监督学习的数据特征在于其数据集一部分带有一定的"标记"和或者"答案",而另一部分数据没有特定的标记,而更常见的半监督学习数据集产生的原因是各种原因引起的数据缺失。2、半监督学习的数据集处理方式大多采用:先用无监督学习算法对数据进行相关的处理,再利用监督学习...

机器学习入门介绍(非常易懂)

机器学习入门介绍(非常易懂)//2019.07.31早上机器学习基本概念介绍1、机器学习的含义在于让机器去学习,其核心在于学习。2、最早的机器学习应用是在垃圾邮件的分辨,它开启了机器学习的领域和时代3、机器学习的典型应用主要体现在以下几个方面:(1)图像识别(2)语音识别(3)数字识别(4)......4、机器学习算法...

pyhton机器学习入门基础(机器学习与决策树)

//2019.07.26#scikit-learn数据挖掘工具包1、Scikitlearn是基于python的数据挖掘和机器学习的工具包,方便实现数据的数据分析与高级操作,是数据分析里面非常重要的工具包。2、ScikitLearn是数据挖掘重要的工具包,其官网为http://scikit-learn.org,可以方便地...

机器学习评价指标

  metrics.png  wiki.pngTP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断成了正向FN:预测为负向(N),实际...
代码星球 ·2020-06-16

机器学习 Matplotlib库入门

2017-07-2115:22:05Matplotlib库是一个优秀的python的数据可视化的第三方类库,其中的pyplot支持了类似matlab的图像输出操作。matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。importmatplotlib.pyplotasplt#plt是一个别名...

机器学习 Numpy库入门

2017-06-2813:56:25Numpy提供了一个强大的N维数组对象ndarray,提供了线性代数,傅里叶变换和随机数生成等的基本功能,可以说Numpy是Scipy,Pandas等科学计算库的基础。使用前需要引入numpy包,一般会给他起个别名为np。importnumpyasnp一、ndarray的元素类型nd...
代码星球 ·2020-06-13

机器学习基础

2017-06-2520:53:07一、机器学习的定义TomMitchell:机器学习是对能通过经验自动改进的计算机算法的研究。机器学习可以彰显数据背后真正的含义。二、机器学习的分类(1)监督学习supervisedlearning所谓监督学习,就是指在学习过程中会有一组标准答案提供,监督学习从给定的训练集中学习出一个...
代码星球 ·2020-06-13

百面机器学习读书笔记

P002----零均值归一化,思考,为什么归一化公式要除以标准差σ? 首先,了解标准差的定义:方差的平方根,那方差又是什么?方差描述了随机变量X与期望值的偏离程度,目的是为了展示随机变量X取值的离散程度。那什么是随机变量?它与变量的区别在哪里?个人理解如下:简单地说,随机变量是指随机事件的数量表现...

吴裕雄--天生自然python机器学习实战:K-NN算法约会网站好友喜好预测以及手写数字预测分类实验

    实验设备与软件环境硬件环境:内存ddr34G及以上的x86架构主机一部系统环境:windows软件环境:Anaconda2(64位),python3.5,jupyter内核版本:window10.0实验内容和原理(1)实验内容:使用k近邻算法改进约会网站的配对效果。海伦使...

吴裕雄--天生自然python机器学习:基于支持向量机SVM的手写数字识别

    fromnumpyimport*defimg2vector(filename):returnVect=zeros((1,1024))fr=open(filename)foriinrange(32):lineStr=fr.readline()forjinrange(32):...
首页上一页...1617181920...下一页尾页