#机器学习

机器学习--决策树之分类树

决策树是机器学习的常见算法,分为分类树和回归树。当对一个样本的分类进行预测时使用分类树,当对样本的某一个值进行预测时使用回归树。本文是有关决策树的第一部分,主要介绍分类树的几种构建方法,以及如何使用分类树测试分类。目录如下:1、分类树的基本概念2、采用数据集说明3、划分数据集的几种方式4、构造分类树5、使用分类树测试分...

初探机器学习之使用讯飞TTS服务实现在线语音合成

最近在调研使用各个云平台提供的AI服务,有个语音合成的需求因此就使用了一下科大讯飞的TTS服务,也用.NETCore写了一个小示例,下面就是这个小示例及其相关背景知识的介绍。    将文字信息转化为声音信息,给应用配上“嘴巴”,这就是语音合成。Note:语音合成和语音识别技术是实现人机语音通信,...

机器学习之正则化(Regularization)

通过最近的几篇文章,我们不难发现,无论是线性回归问题还是逻辑回归问题都可以通过构造多项式来解决。但是,你将逐渐发现其实还有更为强大的非线性分类器可以用来解决多项式回归问题。下篇文章中,我们将会讨论。...

机器学习中各种熵的定义及理解

机器学习领域有一个十分有魅力的词:熵。然而究竟什么是熵,相信多数人都能说出一二,但又不能清晰的表达出来。而笔者对熵的理解是:“拒绝学习、拒绝提升的人是没有未来的,也只有努力才能变成自己想成为的人”。下图是对熵的一个简单描述:熵可以理解为是一种对无序状态的度量方式。那么熵又是如何被用在机器学习中呢...

python机器学习实战 getA()函数详解

在机器学习实战一书的第五章中出现了getA()这个函数logRegres.plotBestFit(weight.getA())当输入下下代码时logRegres.plotBestFit(weight)会出现错误,原因在于下面这一段代码中len(x)=60,而len(y)=1x=arange(-3.0,3.0,0.1)y...

图解机器学习

 每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的LiHui的这篇博客,讲述了如何选择机器学习的各种方法。另外,Scikit-learn也提供了一幅清晰的路线图给大家选择:&nbs...
代码星球 ·2020-04-17

【机器学习】正则化的线性回归 —— 岭回归与Lasso回归

注:正则化是用来防止过拟合的方法。在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数。但是一直也无法对其基本原理有一个透彻、直观的理解。直到最近再次接触到这个概念,经过一番苦思冥想后终于有了我自己的理解。 0.正则化(Regularization )前面使用多项...

初探机器学习之使用百度EasyDL定制化模型

  一般来说,各大云服务厂商只会提供一些最常见通用的AI服务,针对具体场景的AI应用则需要在云服务厂商提供的服务之上进行定制。例如,通常的图像识别只能做到分析照片的主题内容,而我的需求是给定指定场景的图片,能够分析出其中的各个物体,并指出他们是什么,以便我后期能够给出相似的图片内容实现猜你喜欢及拍照识图并进行相关物品的...

机器学习算法总结(一)——支持向量机

  自学机器学习三个月,接触到了各种算法,然而很多知其然而不知其所以然,因此想对过往所学的知识做个总结,该系列的文章不会有过多的算法推导。  我们知道较早的分类模型——感知机(1957年)是二类分类的线性分类模型,也是后来神经网络和支持向量机的基础。支持向量机(Supportvectormach...

机器学习经典算法之朴素贝叶斯分类

很多人都听说过贝叶斯原理,在哪听说过?基本上是在学概率统计的时候知道的。有些人可能会说,我记不住这些概率论的公式,没关系,我尽量用通俗易懂的语言进行讲解。/*请尊重作者劳动成果,转载请标明原文链接:*//* https://www.cnblogs.com/jpcflyer/p/11069659.html&nb...

机器学习模型评估指标汇总

在使用机器学习算法过程中,针对不同的问题需要不用的模型评估标准,这里统一汇总。主要以两大类分类与回归分别阐述。一、分类问题混淆矩阵是监督学习中的一种可视化工具,主要用于比较分类结果和实例的真实信息。矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。      真正(TruePositive,TP):被模型预测...

机器学习 —— 概率图模型(贝叶斯网络)

  概率图模型(PGM)是一种对现实情况进行描述的模型。其核心是条件概率,本质上是利用先验知识,确立一个随机变量之间的关联约束关系,最终达成方便求取条件概率的目的。  这个世界都是随机变量。  第一,世界是未知的,是有多种可能性的。  第二,世界上一切都是相互联系的。  第三,随机变量是一种映射,把观测到的样本映射成数...

机器学习十大算法系列

1.线性回归(LinearRegression)2.逻辑回归(LogisticRegression)3.决策树(DecisionTree)4.支持向量机(SVM)5.朴素贝叶斯(NaiveBayes)6.K邻近算法(KNN)7.K-均值算法(K-means)8.随机森林(RandomForest)9.降低维度算法(Di...

李宏毅机器学习笔记01(regression)

1、首先,什么是regression(回归)2、然后,实现回归的步骤(机器学习的步骤)  step1、model(确定一个模型)——线性模型  step2、goodnessoffunction(确定评价函数)——损失函数  step3、bestfunction(找出最好的...

[机器学习]信息&熵&信息增益

关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要是在决策树里用到的概念,因为在利用特征来分类的时候会对特征选取顺序的选择,这几个概念比较抽象,我也花了好长时间去理解(自己认为的理解),废话不多说,接下来开始对这几个概念解释,防止自己忘记的同时,望对其他人有个借鉴的作用,如有错误还请指出。1、...
代码星球 ·2020-04-14
首页上一页...1920212223...下一页尾页