51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#数据可视化
Flashtext:大规模数据清洗的利器
在这篇文章中,我们将介绍一种新的关键字搜索和替换的算法:Flashtext算法。Flashtext算法是一个高效的字符搜索和替换算法。该算法的时间复杂度不依赖于搜索或替换的字符的数量。比如,对于一个文档有N个字符,和一个有M个词的关键词库,那么时间复杂度就是 O(N) 。这个算法比我们一...
IT猿
·
2020-03-27
Flashtext
大规模
数据
清洗
利器
2017数据科学报告:机器学习工程师年薪最高,Python最常用
2017-11-0311:05数据平台Kaggle近日发布了2017机器学习及数据科学调查报告,针对最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等进行深度调查。此次调查共收到16000余份回复。以下「AI脑力波」小编对该报告数据进行了梳理编译,供大家参考。年龄从全球范围来...
IT猿
·
2020-03-27
2017
数据
科学
报告
机器
大数据等最核心的关键技术:32个算法
大数据等最核心的关键技术:32个算法转载2016年12月11日22:24:05A*搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的最佳路径,并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此,A*搜索算法是最佳优先搜索的范...
IT猿
·
2020-03-27
数据
核心
关键
技术
32个
美团点评数据库高可用架构的演进与设想
金龙 ·2017-06-2920:11本文介绍最近几年美团点评MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新。同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望。在2015年之前,美团点评(点评侧)长期使用MMM(Master-...
IT猿
·
2020-03-27
美团
点评
数据库
高可用
可用
change可以重命名列名,也可能修改列的类型和约束,而modify只能修改列的数据类型。
change可以重命名列名,也可能修改列的数据类型,而modify只能修改列的数据类型。change比modify功能多,如果要用change修改字段类型和约束,要加上新字段名,新字段名可以和原来一样。...
IT猿
·
2020-03-27
修改
类型
change
可以
重命名
前后端交互如何确保数据安全性?
前后端分离的开发方式,我们以接口为标准来进行推动,定义好接口,各自开发自己的功能,最后进行联调整合。无论是开发原生的APP还是webapp还是PC端的软件,只要是前后端分离的模式,就避免不了调用后端提供的接口来进行业务交互。网页或者app,只要抓下包就可以清楚的知道这个请求获取到的数据,这样的接口对爬虫工程...
IT猿
·
2020-03-27
后端
交互
如何
确保
数据
云可视化工具
Yang 发布于2015-07-09分类:WEB前端阅读(1927)评论(0)如果你正在寻找一些词云发电机,你可以用它来映射数据,那么你是在正确的地方。在这里,我们提出9最惊人的词云生成器,你可以用它来映射视觉魅力的方式就像单词和标签数据。云词被用作词频的图形表示,并在许多网站正在使用。有很多词云...
IT猿
·
2020-03-27
可视化
工具
用emoji表情包来可视化北京市历史天气状况!
最近有了一个突如其来的想法,主要是看到了R社区有大神做了emoji表情包,并已经打通了ggplot的链接,所以想用ggplot结合emoji表情做一期天气可视化!library(RCurl)library(XML)library(dplyr)library(stringr)library(tidyr)lib...
IT猿
·
2020-03-27
emoji
表情
可视化
北京市
历史
Excel 批量快速合并相同的单元格:数据透视表、宏代码、分类汇总
在制作Excel表格的时候,为了使得自己制作的报表更加简洁明了,方便查阅,经常需要合并很多相同的单元格,如果有几千几万条记录需要合并的话,真的会让人发疯。怎样可以最快地实现合并功能呢? 1打开需要合并单元格的excel表格。(这里是以excel200...
IT猿
·
2020-03-27
Excel
批量
快速
合并
相同
数据仓库的一些建议
0x01请理解数据仓库和数据平台的区别当你开始建设数据仓库之前,需要明白数据仓库和数据平台是两个不同的概念,不要把搭建一套Hadoop+Hive的平台叫数据仓库,这是数据平台的范畴。我们常说的数据仓库不仅仅是指数据接入、数据存储和数据计算,它也要包括数据治理、数据建模和数据挖掘。比如元数据管理、维度建模和O...
IT猿
·
2020-03-27
数据
仓库
一些
建议
大数据征信的应用和启示:ZestFinance的基于大数据的信用评估技术
http://www.d1net.com/bigdata/news/325426.html2014年11月,本文作者有机会和ZestFinance的创始人和首席执行官梅里尔(DouglasC.Merill)先生进行了面对面的交流。这位普林斯顿的认知学博士阐述了ZestFinance利用大数据进行信用风险管理的基本框架。...
IT猿
·
2020-03-27
数据
征信
应用
启示
ZestFinance
Django1.6版本的PG数据库定义手动升级
Django1.7以后添加了migration功能,数据库定义的升级完全实现自动化,之前是通过一个叫south的app来做的。这篇文章谈一下1.6下的手动更新升级。 1、tablecreate和tabledelete操作,万幸的是Django即便是旧版本,其table的添加...
IT猿
·
2020-03-27
Django1.6
版本
PG
数据库
定义
pg_restore数据库恢复指令
pg_restorerestoresaPostgreSQLdatabasefromanarchivecreatedbypg_dump.Usage: pg_restore[OPTION]...[FILE]Generaloptions: -d,--dbname=NAME  ...
IT猿
·
2020-03-27
pg
restore
数据库
恢复
指令
sqlite db数据的导出
sqlite的db数据一般是filename.db的格式,用普通文本编辑器打开是乱码,用sqlite名令操作比较麻烦,有时版本格式问题还会起阻扰,有一个GUI工具可以对sqlitedb格式数据进行管理和导出,sqliteexpert,下载链接:http://www.sql...
IT猿
·
2020-03-27
sqlite
db
数据
导出
Pycon 2017: Python可视化库大全
https://zhuanlan.zhihu.com/p/27346322 本文主要摘录自pycon2017大会的一个演讲,同时结合自己的一些理解。pycon2017的相关演讲主题是“ThePythonVisualizationLandscape”。先来一张全景图镇楼~~看完这张图是不...
IT猿
·
2020-03-27
Pycon
2017
Python
可视化
大全
首页
上一页
...
406
407
408
409
410
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他