#有监督学习

【机器学习PAI实践二】人口普查统计

感谢大家关注玩转数据系列文章,我们希望通过在阿里云机器学习平台上提供demo数据并搭建相关的实验流程的方式来帮助大家学习怎样通过算法来挖掘数据中的价值。本系列文章包括具体的实验流程以及相关的文档教程,欢迎大家进入spm=a2c0j.7906235.header.11.I2EEKW">阿里云数加机器学习平台体验。实验案例...

【TensorFlow】学习笔记

name_scope是给op_name加前缀variable_scope是给get_variable()创建的变量的名字加前缀。tf.train.Saver函数用于保存模型,以后再用就可以直接导入模型进行计算tf.global_variables_initializer()将所有全局变量的初始化器汇总,并对其进行初始化...
代码星球 ·2020-04-06

【论文笔记】多任务学习(Multi-Task Learning)

1.前言  多任务学习(Multi-tasklearning)是和单任务学习(single-tasklearning)相对的一种机器学习方法。在机器学习领域,标准的算法理论是一次学习一个任务,也就是系统的输出为实数的情况。复杂的学习问题先被分解成理论上独立的子问题,然后分别对每个子问题进行学习,最后通过对子问题学习结果...

Python学习笔记:Flask-Migrate基于model做upgrade的基本原理

 1)flask-migrate的官网:https://flask-migrate.readthedocs.io/en/latest/ 2)获取帮助,在pycharm的控制台中输入flaskdb --help,或者flaskdbmigrate --help,这样就可以了解各个命令...

20180821 Python学习笔记:如何获取当前程序路径

20180821Python学习笔记:如何获取当前程序路径启动的脚本的路径为:D:WORKgitbaseShenzhenHouseInfoCrawlermain.py当前脚本的路径为:D:WORKgitbaseShenzhenHouseInfoCrawlersrcNewHouseMonitor.pyos.getcwd(...

【深度学习】词的向量化表示

  在CNN模型中,卷积就是拿**kernel**在图像上到处移动,每移动一次提取一次特征,组成featuremap,这个提取特征的过程,就是卷积。  接下来,我们看看YoonKim的paper:[ConvolutionalNeuralNetworksforSentenceClassification]([1408.5...
代码星球 ·2020-04-06

【深度学习】理解dropout

  dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。注意是暂时,对于随机梯度下降来说,由于是随机丢弃,故而每一个mini-batch都在训练不同的网络。  dropout是CNN中防止过拟合提高效果的一个大杀器。Dropout如何工作Dropout以概率p舍弃神经元并...
代码星球 ·2020-04-06

【论文笔记】如何理解深度学习中的End to End

Endtoend:指的是输入原始数据,输出的是最后结果,应用在特征学习融入算法,无需单独处理。end-to-end(端对端)的方法,一端输入我的原始数据,一端输出我想得到的结果。只关心输入和输出,中间的步骤全部都不管。  端到端指的是输入是原始数据,输出是最后的结果,原来输入端不是直接的原始数据,而是在原始数据中提取的...

【机器学习】粗糙集属性约简算法与mRMR算法的本质区别

1.粗糙集属性约简算法仅仅选出属性重要度大的条件加入约减中,没有考虑约简中条件属性相互之间的冗余性,得到的约简往往不是都必要的,即含有冗余属性。2.mRMR算法则除了考虑特征与类别之间的相关性,还考虑特征与特征之间的冗余度,约束特征与类别最大相关,特征与特征最小冗余。3.根据mRMR算法,将粗糙集约简算法改进为最小相关...

【机器学习】DBSCAN Algorithms基于密度的聚类算法

        DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,...

【机器学习】EM的算法

EM的算法流程:初始化分布参数θ;重复以下步骤直到收敛:       E步骤:根据参数初始值或上一次迭代的模型参数来计算出隐性变量的后验概率,其实就是隐性变量的期望。作为隐藏变量的现估计值:    ...
代码星球 ·2020-04-06

【机器学习】K-means聚类算法与EM算法

  将样本分成K个类,其实说白了就是求一个样本例的隐含类别y,然后利用隐含类别将x归类。由于我们事先不知道类别y,那么我们首先可以对每个样例假定一个y吧,但是怎么知道假定的对不对呢?怎样评价假定的好不好呢?  我们使用样本的极大似然估计来度量,这里就是x和y的联合分布P(x,y)了。如果找到的y能够使P(x,y)最大,...

【机器学习】判别模型和生成模型

 判别式模型(discriminativemodel)产生式模型(generativemodel) 特点寻找不同类别之间的最优分类面,反映的是异类数据之间的差异对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度区别(假定输入x, 类别标签y)估计的是条件概率分布(...

【机器学习】主成分分析PCA(Principal components analysis)

真实的训练数据总是存在各种各样的问题:  1、比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。  2、拿到一个数学系的本科生期末考试成绩单,里面有三列,一列是对数学的兴趣程度,一列是复习时间...

【机器学习】粗糙集属性约简—Attribute Reduction

  RoughSets算法是一种比较新颖的算法,粗糙集理论对于数据的挖掘方面提供了一个新的概念和研究方法。本篇文章我不会去介绍令人厌烦的学术概念,就是简单的聊聊RoughSets算法的作用,直观上做一个了解。此算法的应用场景是,面对一个庞大的数据库系统,如何从里面分析出有效的信息,如果一database中有几十个字段,...
首页上一页...263264265266267...下一页尾页