#百面机器学习

【机器学习】DBSCAN Algorithms基于密度的聚类算法

        DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,...

【机器学习】EM的算法

EM的算法流程:初始化分布参数θ;重复以下步骤直到收敛:       E步骤:根据参数初始值或上一次迭代的模型参数来计算出隐性变量的后验概率,其实就是隐性变量的期望。作为隐藏变量的现估计值:    ...
代码星球 ·2020-04-06

【机器学习】K-means聚类算法与EM算法

  将样本分成K个类,其实说白了就是求一个样本例的隐含类别y,然后利用隐含类别将x归类。由于我们事先不知道类别y,那么我们首先可以对每个样例假定一个y吧,但是怎么知道假定的对不对呢?怎样评价假定的好不好呢?  我们使用样本的极大似然估计来度量,这里就是x和y的联合分布P(x,y)了。如果找到的y能够使P(x,y)最大,...

【机器学习】判别模型和生成模型

 判别式模型(discriminativemodel)产生式模型(generativemodel) 特点寻找不同类别之间的最优分类面,反映的是异类数据之间的差异对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度区别(假定输入x, 类别标签y)估计的是条件概率分布(...

【机器学习】主成分分析PCA(Principal components analysis)

真实的训练数据总是存在各种各样的问题:  1、比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。  2、拿到一个数学系的本科生期末考试成绩单,里面有三列,一列是对数学的兴趣程度,一列是复习时间...

【机器学习】粗糙集属性约简—Attribute Reduction

  RoughSets算法是一种比较新颖的算法,粗糙集理论对于数据的挖掘方面提供了一个新的概念和研究方法。本篇文章我不会去介绍令人厌烦的学术概念,就是简单的聊聊RoughSets算法的作用,直观上做一个了解。此算法的应用场景是,面对一个庞大的数据库系统,如何从里面分析出有效的信息,如果一database中有几十个字段,...

【机器学习】粗糙集(Rough Set Approach)

粗糙集理论是一种研究不精确,不确定性知识的数学工具。粗糙集理论的知识表达方式一般采用信息表或称为信息系统的形式,它可以表现为四元有序组K=(U,A,V,P)。其中U为对象的全体,即论域;A是属性全体;V是属性的值域;P为一个信息函数,反映了对象x在K中的完全信息。粗糙集的思想为:  一种类别对应一个概念(类别可以用集合...

【机器学习】随机森林(Random Forest)

随机森林是一个最近比较火的算法它有很多的优点:在数据集上表现良好在当前的很多数据集上,相对其他算法有着很大的优势它能够处理很高维度(feature很多)的数据,并且不用做特征选择在训练完后,它能够给出哪些feature比较重要在创建随机森林的时候,对generlizationerror使用的是无偏估计训练速度快在训练过...

【机器学习】K近邻算法——多分类问题

  给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该类输入实例分为这个类。KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常...

【机器学习】Softmax 和Logistic Regression回归Sigmod

  在logistic回归中,我们的训练集由  个已标记的样本构成: ,其中输入特征。(我们对符号的约定如下:特征向量  的维度为 ,其中  对应截距项。)由于logistic回归是针对二分类问题的,因此类标记 。假设函数(hyp...

【机器学习】K-Means算法

   K-Means算法是一种clusteranalysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。问题K-Means算法主要解决的问题如下图所示。我们可以看到,在图的左边有一些点,我们用肉眼可以看出来有四个点群,但是我们怎么通过计算机程序找出这几个点群来呢?于是就出现了...
代码星球 ·2020-04-06

android:第十章,后台的默默劳动者——服务,学习笔记

一、多线程1)本章首先介绍了安卓的多线程编程,说明在子线程中如果要修改UI,必须通过Handler,Message,MessageQueue,Looper来实现,但是这样毕竟太麻烦了。 2)然后紧接着就给出了AsyncTask,通过继承这个类,就可以在他的里面直接修改UI元素,方便很多;二、服务1)首先给出服...

深度学习中的batch_size,iterations,epochs等概念的理解

在自己完成的几个有关深度学习的Demo中,几乎都出现了batch_size,iterations,epochs这些字眼,刚开始我也没在意,觉得Demo能运行就OK了,但随着学习的深入,我就觉得不弄懂这几个基本的概念,对整个深度学习框架理解的自然就不够透彻,所以今天让我们一起了解一下这三个概念。1.batch_size深...

log4j学习总结

一直使用log4j来记录日志,但是一直以来没有深入研究过log4j,最近研究了下log4j,下面总结一下:log4j配置:1.配置根Logger,其语法为: log4j.rootLogger=[level],appenderName1,appenderName2,…其中,level是日志记录的优...
代码星球 ·2020-04-06

RPC(Remote Procedure Call Protocol)——远程过程调用协议 学习总结

  首先了解什么叫RPC,为什么要RPC,RPC是指远程过程调用,也就是说两台服务器A,B,一个应用部署在A服务器上,想要调用B服务器上应用提供的函数/方法,由于不在一个内存空间,不能直接调用,需要通过网络来表达调用的语义和传达调用的数据。比如说,一个方法可能是这样定义的:EmployeegetEm...
首页上一页...270271272273274...下一页尾页