#挖掘

金融数据分析与挖掘具体实现方法 -1

有人让我写一下关于数据挖掘在金融方面的应用,再加上现在金融对数据方面的要求不断提高,准备用两篇随笔来做个入门总结。首先,在看这篇随笔以前稍微补充一点金融方面的知识,因为我不是金融专业的,以下补充知识来自互联网与个人整理,欢迎批评指正并补充说明。通常狭义的金融市场特指有价证券(股票、债券)发行和流通的场所。股票、债券是用...

R文本挖掘之jiebaR包

library(jiebaRD)library(jiebaR) ##调入分词的库cutter<-worker()mydata=read.csv(file.choose(),fileEncoding='UTF-8',stringsAsFactors=FALSE,header=FALSE)##读入数据(特别...
代码星球 ·2020-04-14

吴裕雄 数据挖掘与分析案例实战(5)——python数据可视化

#饼图的绘制#导入第三方模块importmatplotlibimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['Simhei']plt.rcParams['axes.unicode_minus']=Falseziti=matplotlib.font...

数据挖掘一般过程

目录1.数据集选取2.数据预处理(1)数据清理(2)数据集成(3)数据归约(4)数据变换和数据离散化3.数据分析算法4.分析总结改进   这学期提前选课学习了Data Mining,最近提交了论文已经彻底结了。想来想去还是写点东西记一下,假如以后能用上呢?仅供参考哈参考书:《数据...
代码星球 ·2020-04-13

12款常用的数据挖掘工具推荐

数据挖掘工具是使用数据挖掘技术从大型数据集中发现并识别模式的计算机软件。数据在当今世界中就意味着金钱,但是因为大多数数据都是非结构化的。因此,拥有数据挖掘工具将成为帮助您获得正确数据的一种方法。下面为大家介绍12款常用的数据挖掘工具。 常用的数据挖掘工具 1.R R是一套完整的数据处理、计...

数据挖掘——聚类分析总结

聚类分析一、概念  聚类分析是按照个体的特征将他们分类,让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大的差异性  聚类分析属于无监督学习  聚类对象可以分为Q型聚类和R型聚类    Q型聚类:样本/记录聚类  以距离为相似性指标 (欧氏距离、欧氏平方距离、马氏距离、明式距离...

数据挖掘专业术语

术语或简写备忘(按字母顺序)A/aactivationfunction 激活函数artificialneutron:perceptron(以前),sigmoidneutron(如今的模型)B/bbackpropagation 反向传播betaversion   &nbs...
代码星球 ·2020-04-11

R数据挖掘 第四篇:OLS回归分析

变量之间存在着相关关系,比如,人的身高和体重之间存在着关系,一般来说,人高一些,体重要重一些,身高和体重之间存在的是不确定性的相关关系。回归分析是研究相关关系的一种数学工具,它能帮助我们从一个变量的取值区估计另一个变量的取值。OLS(最小二乘法)主要用于线性回归的参数估计,它的思路很简单,就是求一些使得实际值和模型估值...

1032. 挖掘机技术哪家强(20)

为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛。现请你根据比赛结果统计出技术最强的那个学校。输入格式:输入在第1行给出不超过105的正整数N,即参赛人数。随后N行,每行给出一位参赛者的信息和成绩,包括其所代表的学校的编号(从1开始连续编号)、及其比赛成绩(百分制),中间以空格分隔。输出格式:在一行中...
代码星球 ·2020-04-08

数据挖掘书籍

http://blog.csdn.net/dream_angel_z/article/details/44773801...
代码星球 ·2020-04-08

数据挖掘 ---支持度和置信度的用法

如果客户买了xx物品,那么他可能买YY物品  规则常用的方法,支持度和置信度 支持度是指规则的应验次数置信度就是应验次数所占的比例  直接上代码#面包,牛奶,奶酪,苹果,香蕉fromcollectionsimportOrderedDictimportnumpyasnpf...

渗透测试(信息挖掘)

1、httrack使用方法    概念介绍:  httrack是一看网站镜像程序,也叫做扒皮工具。使用者可以直接把互联网上的网站下载到本地计算机上,在默认的设置下,httrack对网站的下载方式是按照原站点子昂对的链接结构在组织的。httrack使用网络爬虫下...
代码星球 ·2020-04-07

《SAS编程与数据挖掘商业案例》学习笔记之十八

接着曾经的《SAS编程与数据挖掘商业案例》,之前全是sas的基础知识,如今開始进入数据挖掘方面笔记,本文主要介绍数据挖掘基本流程以及应用方向,并以logistic回归为例说明。一:数据挖掘综述衡量一个数据挖掘模型价值的唯一标准就是商业目标,为达到一个商业目标。有非常多种方法。仅仅有高效解决商业目标的方法才...

(6)文本挖掘(三)——文本特征TFIDF权重计算及文本向量空间VSM表示

建立文本数据数学描写叙述的过程分为三个步骤:文本预处理、建立向量空间模型和优化文本向量。文本预处理主要採用分词、停用词过滤等技术将原始的文本字符串转化为词条串或者特点的符号串。文本预处理之后,每个文本的词条串被进一步转换为一个文本向量,向量的每一维相应一个词条,其值反映的是这个词条与这个文本之间的类似度。类似度有非常多...

使用excel进行数据挖掘(2)----分析关键影响因素

 使用excel进行数据挖掘(2)----分析关键影响因素 在配置环境后,能够使用excel进行数据挖掘。环境配置问题可參阅:http://blog.csdn.net/xinxing__8185/article/details/46445435例子 DMAddins_SampleData....
首页上一页123下一页尾页