#数据实验室

数据结构和算法

数据结构:数据之间存在某种关系;算法:对问题求解的步骤描述,在计算机中表现为一些列指令和操作算法五个特性:输入(输入参数),输出(得到的结果),确定性(步骤是有意义的无歧义的),可行性(每个步骤都是可行的)正确性(除前面的特性外,还还具有反映出问题的需求并得到正确的答案) 算法效率度量:事后计算:测试方法和算...
IT猿 IT猿·2020-03-28

自定义标签&JSON数据处理

最近几日去参加一些面试,多多少少有一些收获。现将遇到的一些面试题,做一下分析和总结。 1、使用原生JS,不能使用递归,查找dom中所有以“<com-”开头的自定义标签tagName。1<!DOCTYPEhtml>2<htmllang="zh">34<...

echarts 点击方法总结,点任意一点获取点击数据,举例说明:在多图联动中点击绘制标线

关于点击(包括左击,双击,右击等)echarts图形任意一点,获取相关的图形数据,尤其是多图,我想部分人遇到这个问题一直很头大。下面我用举例说明,如何在多图联动基础上,我们点击任意一个图上任意一点,在点击处绘制一条标注线。多图联动的用法,我就不详细解释,不明白或者感兴趣的同学可以看我上一篇:http://www.cnb...

PL/SQL简单实现数据库的连接

通常我们都会去选择通过修改配置文件去实现数据库链接,方法如下:找到你orale安装下的文件:instantclient_11_2etworkadmin修改的主要有三个地方:上面的命名随便起,而ip地址,端口和数据库sid名都需要配置这些配置好之后,就能在登陆界面找到你的命名的选项。当然还有更简单的方法:直接在登陆页面配...

如何用perl将表格中不同列的数据进行拼凑,然后将拼凑后的数据用“|”连接在一起

最近写了一个perl脚本,实现的功能是将表格中其中两列的数据进行拼凑,然后将拼凑后的数据用“|”连接在一起。表格内容如下:员工号码员工姓名职位入职日期1001张三销售1980/12/170:00:001002李四财务1981/02/200:00:001003王五经理1981/02/220:00:...

如何用Excel直接查询Oracle中的数据

将Oracle中查询的数据保存为Excel文件,通常使用的是PL/SQLDeveloper。其实,Excel可直接写SQL语句查询Oracle中数据,在这里,用到ODBC驱动。详细步骤如下:一、配置ODBC数据源开始->控制面板->系统和安全->管理工具->ODBC数据源(可根据自己的情况选择3...

数据挖掘相关概念

1.过度拟合overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据。此时我们就叫这个假设出现了overfitting的现象。出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少。而解决overfit的方法主要有两种:提前停止树的增长...

sqoop数据导出导入命令

1.将mysql中的数据导入到hive中sqoopimport--connectjdbc:mysql://localhost:3306/sqoop--direct--usernameroot--password123456--tabletb1--hive-tabletb1--hive-import-m1其中--tabl...

python数据分析第二版:数据加载,存储和格式

一:读取数据的函数  1.读取csv文件 importnumpyasnpimportpandasaspddata=pd.read_csv("C:\Users\Administrator\Desktop\result.csv",encoding="utf-8")#这里需要注意路径必须用\斜杠,斜杠显示...

python数据分析第二版:pandas

一:pandas两种数据结构:series和dataframe  series:索引(索引自动生成)和标签(人为定义)组成---返回一个对象obj=pd.Series([1,2,3,4])obj#结果01122334dtype:int64obj=pd.Series(["姓名","年龄","身高","体重"])obj#结...

爬虫技术:数据处理josn和pickle模块

一:json模块json模块的作用就是讲json字符串("{"a":1,"b":1}")和python能够识别的字典进行相互转换。importjsonimportpicklea="""{'a'::1,'c':2}"""ret=json.loads(a)print(ret)#结果json.decoder.JSONDeco...

python数据分析第二版:numpy

一:Numpy#数组和列表的效率问题,谁优谁劣#1.循环遍历importnumpyasnpimporttimemy_arr=np.arange(1000000)my_list=list(range(1000000))defarr_time(array):s=time.time()for_inarray:_*2e=tim...

爬虫技术:爬取淘宝美食数据:崔庆才思路

#TODOselenium已经被检测出来 importrandomimportreimporttimefromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromselenium.webdriver.support.uiimpo...

爬虫技术:爬取今日头条数据-崔庆才思路

一.urllib库中将字典转化为url的查询参数二.请求异常的处理,以及内部的判断逻辑  1.返回的json数据为空:原因是requests的请求对象没有加请求头和cookiesimportrequestsfromurllib.parseimporturlencodedefget_page_index():data={...

七步爬取淘宝天猫bra销售数据,分析中国女性胸部大小分布比例

这是一个有趣的项目,关于bra销售数据分析的。是网络爬虫和数据分析的综合应用项目。从淘宝抓取bra销售数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后通过SQL语句、Pandas和Matplotlib对数据进行数据可视化分析。我们从分析结果中可以得出很多有的结果,例如,中国女性胸部标准尺寸是多少;...
首页上一页...395396397398399...下一页尾页