#增益

信息,熵,联合熵,条件熵,互信息(信息增益),交叉熵,相对熵(KL散度)

自信息I表示概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。如下图:对数以2为底,单位是比特(bit)对数以e为底,单位是纳特(nat)如英语有26个字母,假设在文章中出现的概率相等,每个字母的自信息量(也称作编码长...

信息、熵、信息增益

关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要是在决策树里用到的概念,因为在利用特征来分类的时候会对特征选取顺序的选择,这几个概念比较抽象,我也花了好长时间去理解(自己认为的理解),废话不多说,接下来开始对这几个概念解释,防止自己忘记的同时,望对其他人有个借鉴的作用,如有错误还请指出。这个...
代码星球 ·2021-02-20

[机器学习]信息&熵&信息增益

关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要是在决策树里用到的概念,因为在利用特征来分类的时候会对特征选取顺序的选择,这几个概念比较抽象,我也花了好长时间去理解(自己认为的理解),废话不多说,接下来开始对这几个概念解释,防止自己忘记的同时,望对其他人有个借鉴的作用,如有错误还请指出。1、...
代码星球 ·2020-04-14