51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#数据实验室
数据挖掘相关概念
1.过度拟合overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据。此时我们就叫这个假设出现了overfitting的现象。出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少。而解决overfit的方法主要有两种:提前停止树的增长...
IT猿
·
2020-03-28
数据挖掘
相关
概念
sqoop数据导出导入命令
1.将mysql中的数据导入到hive中sqoopimport--connectjdbc:mysql://localhost:3306/sqoop--direct--usernameroot--password123456--tabletb1--hive-tabletb1--hive-import-m1其中--tabl...
IT猿
·
2020-03-28
sqoop
数据
导出
导入
命令
python数据分析第二版:数据加载,存储和格式
一:读取数据的函数 1.读取csv文件 importnumpyasnpimportpandasaspddata=pd.read_csv("C:\Users\Administrator\Desktop\result.csv",encoding="utf-8")#这里需要注意路径必须用\斜杠,斜杠显示...
IT猿
·
2020-03-28
python
数据分析
第二
数据
加载
python数据分析第二版:pandas
一:pandas两种数据结构:series和dataframe series:索引(索引自动生成)和标签(人为定义)组成---返回一个对象obj=pd.Series([1,2,3,4])obj#结果01122334dtype:int64obj=pd.Series(["姓名","年龄","身高","体重"])obj#结...
IT猿
·
2020-03-28
python
数据分析
第二
pandas
爬虫技术:数据处理josn和pickle模块
一:json模块json模块的作用就是讲json字符串("{"a":1,"b":1}")和python能够识别的字典进行相互转换。importjsonimportpicklea="""{'a'::1,'c':2}"""ret=json.loads(a)print(ret)#结果json.decoder.JSONDeco...
IT猿
·
2020-03-28
爬虫
技术
数据处理
josn
pickle
python数据分析第二版:numpy
一:Numpy#数组和列表的效率问题,谁优谁劣#1.循环遍历importnumpyasnpimporttimemy_arr=np.arange(1000000)my_list=list(range(1000000))defarr_time(array):s=time.time()for_inarray:_*2e=tim...
IT猿
·
2020-03-28
python
数据分析
第二
numpy
爬虫技术:爬取淘宝美食数据:崔庆才思路
#TODOselenium已经被检测出来 importrandomimportreimporttimefromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromselenium.webdriver.support.uiimpo...
IT猿
·
2020-03-28
爬虫
技术
爬取
淘宝
美食
爬虫技术:爬取今日头条数据-崔庆才思路
一.urllib库中将字典转化为url的查询参数二.请求异常的处理,以及内部的判断逻辑 1.返回的json数据为空:原因是requests的请求对象没有加请求头和cookiesimportrequestsfromurllib.parseimporturlencodedefget_page_index():data={...
IT猿
·
2020-03-28
爬虫
技术
爬取
今日
头条
七步爬取淘宝天猫bra销售数据,分析中国女性胸部大小分布比例
这是一个有趣的项目,关于bra销售数据分析的。是网络爬虫和数据分析的综合应用项目。从淘宝抓取bra销售数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后通过SQL语句、Pandas和Matplotlib对数据进行数据可视化分析。我们从分析结果中可以得出很多有的结果,例如,中国女性胸部标准尺寸是多少;...
开发笔记
·
2020-03-28
七步
爬取
淘宝天
bra
销售
xpath的数据和节点类型以及XPath中节点匹配的基本方法
XPath数据类型 XPath可分为四种数据类型: 节点集(node-set) 节点集是通过路径匹配返回的符合条件的一组节点的集合。其它类型的数据不能转换为节点集。 布尔值(boolean) 由函数或布尔表达式返回的条件匹配值,与一般语言中的布尔值相...
IT猿
·
2020-03-28
节点
xpath
数据
类型
以及
WPF MVVM(Caliburn.Micro) 数据验证
书接前文前文中仅是WPF验证中的一种,我们暂且称之为View端的验证(因为其验证规是写在Xaml文件中的)。还有一种我们称之为Model端验证,Model通过继承IDataErrorInfo接口来实现,这个还没研究透,后面补上。WPFMVVMModel端验证-待续今天的主要内容是MVVM下的数据验证,主要使用View端...
IT猿
·
2020-03-28
WPF
MVVM
Caliburn.Micro
数据
验证
WPF中的数据验证
WPF的Binding使得数据能够在数据源和目标之间流通,在数据流通的中间,便能够对数据做一些处理。数据转换和数据验证便是在数据从源到目标or从目标到源的时候对数据的验证和转换。ValidationRule验证规则WPF中提供了一个抽象类ValidationRule,我们自定义的验证规则都需要继承它,然后实现它的抽象方...
IT猿
·
2020-03-28
WPF
中的
数据
验证
MVC+LINQToSQL的Repository模式之(二)数据基类
namespaceData.TEST{ ///<summary> ///数据操作基类 ///</summary> publicabstractclassTEST...
IT猿
·
2020-03-28
MVC+LINQToSQL
Repository
模式
数据
基类
MVC+LINQToSQL的Repository模式之(一)数据工厂 DataContext绑定线程
namespaceData{ ///<summary> ///数据库建立工厂 ///CreatedBy:张占岭 ///CreatedDate:2011-10-14 ...
IT猿
·
2020-03-28
MVC+LINQToSQL
Repository
模式
数据
工厂
idea中mybatis generator自动生成代码配置 数据库是sqlserver
好长时间没有写博客了,最近公司要用java语言,开始学习java,属于初学者,今天主要记录一下mybatisgenerator自动生成代码,首先在如下图的目录中新建两个文件,如下图 generatorConfig.xmland jdbc.properties都要放在resource根目录下具体gen...
IT猿
·
2020-03-28
idea
mybatis
generator
自动生成
代码
首页
上一页
...
396
397
398
399
400
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他