#特征

特征工程

1特征工程是什么?2数据预处理  2.1无量纲化    2.1.1标准化    2.1.2区间缩放法    2.1.3标准化与归一化的区别  2.2对定量特征二值化  2.3对定性特征哑编码  2.4缺失值计算  2.5数据变换  2.6回顾3特征选择  3.1Filter    3.1.1方差选择法    3.1.2...
代码星球 ·2021-02-23

python离散特征编码

离散特征编码分两种,特征具有大小意义,特征不具有大小意义。1、特征不具备大小意义的直接独热编码2、特征有大小意义的采用映射编码[python] viewplain copy import pandas as pd   df&nbs...
代码星球 ·2021-02-23

特征工程:特征生成,特征选择(三)

特征工程中引入的新特征,需要验证它确实能提高预测得准确度,而不是加入一个无用的特征增加算法运算的复杂度。1.时间戳处理时间戳属性通常需要分离成多个维度比如年、月、日、小时、分钟、秒钟。但是在很多的应用中,大量的信息是不需要的。比如在一个监督系统中,尝试利用一个’位置+时间‘的函数预测一个城市的交通故障程度,这个实例中,...
代码星球 ·2021-02-23

特征重要性--feature_importance

/Thereareindeedseveralwaystogetfeature"importances".Asoften,thereisnostrictconsensusaboutwhatthiswordmeans.Inscikit-learn,weimplementtheimportanceasdescribedin[...

守护进程之守护进程的特征

先来看一些常用的系统守护进程,以及它们怎样和http://www.cnblogs.com/nufangrensheng/p/3513323.html、http://www.cnblogs.com/nufangrensheng/p/3513400.html、http://www.cnblogs.com/nufangren...
代码星球 ·2021-02-21

信号之其他特征

依赖于实现的信号的其他特征。1、信号名字某些系统提供数组externchar*sys_siglist[];数组下标是信号编号,给出一个指向信号字符串名字的指针。这些系统通常也提供函数psignal。#include<signal.h>voidpsignal(intsigno,constchar*msg);字...
代码星球 ·2021-02-21

特征工程之分箱--Best-KS分箱

KS(Kolmogorov-Smirnov)用于模型风险区分能力进行评估,指标衡量的是好坏样本累计部分之间的差距。KS值越大,表示该变量越能将正,负客户的区分程度越大。通常来说,KS>0.2即表示特征有较好的准确率。强调一下,这里的KS值是变量的KS值,而不是模型的KS值。(后面的模型评估里会重点讲解模型的KS值...

特征工程中的IV和WOE详解

IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自变量中挑选一些出来,放进模型...
代码星球 ·2021-02-20

特征工程之分箱--卡方分箱

分箱就是将连续变量离散化,将多状态的离散变量合并成少状态。离散特征的增加和减少都很容易,易于模型的快速迭代;稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展;列表内容离散化后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大...
代码星球 ·2021-02-20

《百面机器学习》拾贝----第一章:特征工程

>>>前言人工智能技术正在对社会结构、职场、教育等带来革命性的变化。未来几年是人工智能技术全面普及化的时期,也是该技术的相关人才最为稀缺的时期。人工智能泛指让机器具有人的智力的技术。这项技术的目的是使机器像人一样感知、思考、做事、解决问题。人工智能是一个宽泛的技术领域,包括自然语言理解、计算机视觉、机...

事务四大特征:原子性,一致性,隔离性和持久性(ACID)

一.事务       定义:所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。       准备工作:为了说明事务的ACID原理,我们使用银...

GBDT基本理论及利用GBDT组合特征的具体方法(收集的资料)

最近两天在学习GBDT,看了一些资料,了解到GBDT由很多回归树构成,每一棵新回归树都是建立在上一棵回归树的损失函数梯度降低的方向。以下为自己的理解,以及收集到的觉着特别好的学习资料。 1、GBDT可用于回归任务和分类任务。GBDT做回归任务时,每一棵子树的构建过程与cart回归树的建立过程相同,使用最小化均...

经验之谈:Swing的开发工作会非常的累,而且这项技术正在走向没落。避免从事有这种特征的工作。

 经验之谈:Swing的开发工作会非常的累,而且这项技术正在走向没落。避免从事有这种特征的工作。AWT也即将被取代。Module8—Module11所使用的技术都将被JSF技术所取代。JSF是服务器端的Swing:目前技术已经成熟,但是开发环境(工具)还不成熟。Module12的Applet技术也将被WebS...

面向对象三大特征(三)--多态

多态:一个对象具备多种形态。说白点就是:父类的引用类型变量指向子类的对象或者接口的引用类型变量指向了接口实现类的对象。多态的前提:必须存在集成或实现的关系。多态注意的细节:   1、多态情况下,子父类存在同名的成员变量时,访问的是父类的成员变量。   2、多态...

面向对象三大特征(二)--继承

了解继承之前先了解一下显示生活中事物与事物之间存在的两种关系:1、整体与部分的关系--hasa关系;例如:球队和球员的关系。代码示例如下:1//球员2classPlayer{3intnum;4Stringname;5publicPlayer(intnum,Stringname){6this.num=num;7this....
首页上一页12345...下一页尾页