#数据可视化

Flashtext:大规模数据清洗的利器

 在这篇文章中,我们将介绍一种新的关键字搜索和替换的算法:Flashtext算法。Flashtext算法是一个高效的字符搜索和替换算法。该算法的时间复杂度不依赖于搜索或替换的字符的数量。比如,对于一个文档有N个字符,和一个有M个词的关键词库,那么时间复杂度就是 O(N) 。这个算法比我们一...

2017数据科学报告:机器学习工程师年薪最高,Python最常用

  2017-11-0311:05数据平台Kaggle近日发布了2017机器学习及数据科学调查报告,针对最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等进行深度调查。此次调查共收到16000余份回复。以下「AI脑力波」小编对该报告数据进行了梳理编译,供大家参考。年龄从全球范围来...

大数据等最核心的关键技术:32个算法

大数据等最核心的关键技术:32个算法转载2016年12月11日22:24:05A*搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的最佳路径,并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此,A*搜索算法是最佳优先搜索的范...

美团点评数据库高可用架构的演进与设想

金龙 ·2017-06-2920:11本文介绍最近几年美团点评MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新。同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望。在2015年之前,美团点评(点评侧)长期使用MMM(Master-...

change可以重命名列名,也可能修改列的类型和约束,而modify只能修改列的数据类型。

change可以重命名列名,也可能修改列的数据类型,而modify只能修改列的数据类型。change比modify功能多,如果要用change修改字段类型和约束,要加上新字段名,新字段名可以和原来一样。...

前后端交互如何确保数据安全性?

 前后端分离的开发方式,我们以接口为标准来进行推动,定义好接口,各自开发自己的功能,最后进行联调整合。无论是开发原生的APP还是webapp还是PC端的软件,只要是前后端分离的模式,就避免不了调用后端提供的接口来进行业务交互。网页或者app,只要抓下包就可以清楚的知道这个请求获取到的数据,这样的接口对爬虫工程...

云可视化工具

 Yang 发布于2015-07-09分类:WEB前端阅读(1927)评论(0)如果你正在寻找一些词云发电机,你可以用它来映射数据,那么你是在正确的地方。在这里,我们提出9最惊人的词云生成器,你可以用它来映射视觉魅力的方式就像单词和标签数据。云词被用作词频的图形表示,并在许多网站正在使用。有很多词云...
IT猿 ·2020-03-27

用emoji表情包来可视化北京市历史天气状况!

 最近有了一个突如其来的想法,主要是看到了R社区有大神做了emoji表情包,并已经打通了ggplot的链接,所以想用ggplot结合emoji表情做一期天气可视化!library(RCurl)library(XML)library(dplyr)library(stringr)library(tidyr)lib...

Excel 批量快速合并相同的单元格:数据透视表、宏代码、分类汇总

  在制作Excel表格的时候,为了使得自己制作的报表更加简洁明了,方便查阅,经常需要合并很多相同的单元格,如果有几千几万条记录需要合并的话,真的会让人发疯。怎样可以最快地实现合并功能呢?    1打开需要合并单元格的excel表格。(这里是以excel200...

数据仓库的一些建议

 0x01请理解数据仓库和数据平台的区别当你开始建设数据仓库之前,需要明白数据仓库和数据平台是两个不同的概念,不要把搭建一套Hadoop+Hive的平台叫数据仓库,这是数据平台的范畴。我们常说的数据仓库不仅仅是指数据接入、数据存储和数据计算,它也要包括数据治理、数据建模和数据挖掘。比如元数据管理、维度建模和O...

大数据征信的应用和启示:ZestFinance的基于大数据的信用评估技术

http://www.d1net.com/bigdata/news/325426.html2014年11月,本文作者有机会和ZestFinance的创始人和首席执行官梅里尔(DouglasC.Merill)先生进行了面对面的交流。这位普林斯顿的认知学博士阐述了ZestFinance利用大数据进行信用风险管理的基本框架。...

Django1.6版本的PG数据库定义手动升级

  Django1.7以后添加了migration功能,数据库定义的升级完全实现自动化,之前是通过一个叫south的app来做的。这篇文章谈一下1.6下的手动更新升级。  1、tablecreate和tabledelete操作,万幸的是Django即便是旧版本,其table的添加...

pg_restore数据库恢复指令

pg_restorerestoresaPostgreSQLdatabasefromanarchivecreatedbypg_dump.Usage: pg_restore[OPTION]...[FILE]Generaloptions: -d,--dbname=NAME   ...

sqlite db数据的导出

    sqlite的db数据一般是filename.db的格式,用普通文本编辑器打开是乱码,用sqlite名令操作比较麻烦,有时版本格式问题还会起阻扰,有一个GUI工具可以对sqlitedb格式数据进行管理和导出,sqliteexpert,下载链接:http://www.sql...

Pycon 2017: Python可视化库大全

https://zhuanlan.zhihu.com/p/27346322 本文主要摘录自pycon2017大会的一个演讲,同时结合自己的一些理解。pycon2017的相关演讲主题是“ThePythonVisualizationLandscape”。先来一张全景图镇楼~~看完这张图是不...
首页上一页...406407408409410...下一页尾页