#数据实验室

数据挖掘相关概念

1.过度拟合overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据。此时我们就叫这个假设出现了overfitting的现象。出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少。而解决overfit的方法主要有两种:提前停止树的增长...

sqoop数据导出导入命令

1.将mysql中的数据导入到hive中sqoopimport--connectjdbc:mysql://localhost:3306/sqoop--direct--usernameroot--password123456--tabletb1--hive-tabletb1--hive-import-m1其中--tabl...

python数据分析第二版:数据加载,存储和格式

一:读取数据的函数  1.读取csv文件 importnumpyasnpimportpandasaspddata=pd.read_csv("C:\Users\Administrator\Desktop\result.csv",encoding="utf-8")#这里需要注意路径必须用\斜杠,斜杠显示...

python数据分析第二版:pandas

一:pandas两种数据结构:series和dataframe  series:索引(索引自动生成)和标签(人为定义)组成---返回一个对象obj=pd.Series([1,2,3,4])obj#结果01122334dtype:int64obj=pd.Series(["姓名","年龄","身高","体重"])obj#结...

爬虫技术:数据处理josn和pickle模块

一:json模块json模块的作用就是讲json字符串("{"a":1,"b":1}")和python能够识别的字典进行相互转换。importjsonimportpicklea="""{'a'::1,'c':2}"""ret=json.loads(a)print(ret)#结果json.decoder.JSONDeco...

python数据分析第二版:numpy

一:Numpy#数组和列表的效率问题,谁优谁劣#1.循环遍历importnumpyasnpimporttimemy_arr=np.arange(1000000)my_list=list(range(1000000))defarr_time(array):s=time.time()for_inarray:_*2e=tim...

爬虫技术:爬取淘宝美食数据:崔庆才思路

#TODOselenium已经被检测出来 importrandomimportreimporttimefromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromselenium.webdriver.support.uiimpo...

爬虫技术:爬取今日头条数据-崔庆才思路

一.urllib库中将字典转化为url的查询参数二.请求异常的处理,以及内部的判断逻辑  1.返回的json数据为空:原因是requests的请求对象没有加请求头和cookiesimportrequestsfromurllib.parseimporturlencodedefget_page_index():data={...

七步爬取淘宝天猫bra销售数据,分析中国女性胸部大小分布比例

这是一个有趣的项目,关于bra销售数据分析的。是网络爬虫和数据分析的综合应用项目。从淘宝抓取bra销售数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后通过SQL语句、Pandas和Matplotlib对数据进行数据可视化分析。我们从分析结果中可以得出很多有的结果,例如,中国女性胸部标准尺寸是多少;...

xpath的数据和节点类型以及XPath中节点匹配的基本方法

XPath数据类型   XPath可分为四种数据类型:   节点集(node-set)   节点集是通过路径匹配返回的符合条件的一组节点的集合。其它类型的数据不能转换为节点集。   布尔值(boolean)   由函数或布尔表达式返回的条件匹配值,与一般语言中的布尔值相...

WPF MVVM(Caliburn.Micro) 数据验证

书接前文前文中仅是WPF验证中的一种,我们暂且称之为View端的验证(因为其验证规是写在Xaml文件中的)。还有一种我们称之为Model端验证,Model通过继承IDataErrorInfo接口来实现,这个还没研究透,后面补上。WPFMVVMModel端验证-待续今天的主要内容是MVVM下的数据验证,主要使用View端...

WPF中的数据验证

WPF的Binding使得数据能够在数据源和目标之间流通,在数据流通的中间,便能够对数据做一些处理。数据转换和数据验证便是在数据从源到目标or从目标到源的时候对数据的验证和转换。ValidationRule验证规则WPF中提供了一个抽象类ValidationRule,我们自定义的验证规则都需要继承它,然后实现它的抽象方...

MVC+LINQToSQL的Repository模式之(二)数据基类

namespaceData.TEST{   ///<summary>   ///数据操作基类   ///</summary>   publicabstractclassTEST...

MVC+LINQToSQL的Repository模式之(一)数据工厂 DataContext绑定线程

namespaceData{   ///<summary>   ///数据库建立工厂   ///CreatedBy:张占岭   ///CreatedDate:2011-10-14 ...

idea中mybatis generator自动生成代码配置 数据库是sqlserver

好长时间没有写博客了,最近公司要用java语言,开始学习java,属于初学者,今天主要记录一下mybatisgenerator自动生成代码,首先在如下图的目录中新建两个文件,如下图 generatorConfig.xmland jdbc.properties都要放在resource根目录下具体gen...
首页上一页...396397398399400...下一页尾页