#数据实验室

大数据等最核心的关键技术:32个算法

大数据等最核心的关键技术:32个算法转载2016年12月11日22:24:05A*搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的最佳路径,并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此,A*搜索算法是最佳优先搜索的范...

美团点评数据库高可用架构的演进与设想

金龙 ·2017-06-2920:11本文介绍最近几年美团点评MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新。同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望。在2015年之前,美团点评(点评侧)长期使用MMM(Master-...

change可以重命名列名,也可能修改列的类型和约束,而modify只能修改列的数据类型。

change可以重命名列名,也可能修改列的数据类型,而modify只能修改列的数据类型。change比modify功能多,如果要用change修改字段类型和约束,要加上新字段名,新字段名可以和原来一样。...

前后端交互如何确保数据安全性?

 前后端分离的开发方式,我们以接口为标准来进行推动,定义好接口,各自开发自己的功能,最后进行联调整合。无论是开发原生的APP还是webapp还是PC端的软件,只要是前后端分离的模式,就避免不了调用后端提供的接口来进行业务交互。网页或者app,只要抓下包就可以清楚的知道这个请求获取到的数据,这样的接口对爬虫工程...

Excel 批量快速合并相同的单元格:数据透视表、宏代码、分类汇总

  在制作Excel表格的时候,为了使得自己制作的报表更加简洁明了,方便查阅,经常需要合并很多相同的单元格,如果有几千几万条记录需要合并的话,真的会让人发疯。怎样可以最快地实现合并功能呢?    1打开需要合并单元格的excel表格。(这里是以excel200...

数据仓库的一些建议

 0x01请理解数据仓库和数据平台的区别当你开始建设数据仓库之前,需要明白数据仓库和数据平台是两个不同的概念,不要把搭建一套Hadoop+Hive的平台叫数据仓库,这是数据平台的范畴。我们常说的数据仓库不仅仅是指数据接入、数据存储和数据计算,它也要包括数据治理、数据建模和数据挖掘。比如元数据管理、维度建模和O...

大数据征信的应用和启示:ZestFinance的基于大数据的信用评估技术

http://www.d1net.com/bigdata/news/325426.html2014年11月,本文作者有机会和ZestFinance的创始人和首席执行官梅里尔(DouglasC.Merill)先生进行了面对面的交流。这位普林斯顿的认知学博士阐述了ZestFinance利用大数据进行信用风险管理的基本框架。...

Django1.6版本的PG数据库定义手动升级

  Django1.7以后添加了migration功能,数据库定义的升级完全实现自动化,之前是通过一个叫south的app来做的。这篇文章谈一下1.6下的手动更新升级。  1、tablecreate和tabledelete操作,万幸的是Django即便是旧版本,其table的添加...

pg_restore数据库恢复指令

pg_restorerestoresaPostgreSQLdatabasefromanarchivecreatedbypg_dump.Usage: pg_restore[OPTION]...[FILE]Generaloptions: -d,--dbname=NAME   ...

sqlite db数据的导出

    sqlite的db数据一般是filename.db的格式,用普通文本编辑器打开是乱码,用sqlite名令操作比较麻烦,有时版本格式问题还会起阻扰,有一个GUI工具可以对sqlitedb格式数据进行管理和导出,sqliteexpert,下载链接:http://www.sql...

2017 Gartner数据科学魔力象限出炉,16位上榜公司花落谁家?

https://www.leiphone.com/news/201703/iZGuGfnER4Sv2zRe.html2017年Gartner数据科学平台(在2016年被称作“高级分析平台”)的魔力象限报告于近期出炉了。今年的报告对16个数据分析公司进行了15个标准的评估,并基于前瞻性(Compl...

Facebook提出DensePose数据集和网络架构:可实现实时的人体姿态估计

https://baijiahao.baidu.com/s?id=1591987712899539583选自arXiv作者:RzaAlpGüler,NataliaNeverova,IasonasKokkinos机器之心编译参与:Panda 实现从2D图像到3D表面的对应在很多方面都有极具价值的应用前...

网络数据包分析工具列表

   此列表内容主要来自于某书的附录部分。   1、WireShark,这方面神器级工具,不赘述,自己好好学吧。   2、tcpdump和windump,完全基于文本的数据包捕获和分析   3、Cai...

TimescaleDB比拼InfluxDB:如何选择合适的时序数据库?

https://www.itcodemonkey.com/article/9339.html时序数据已用于越来越多的应用中,包括物联网、DevOps、金融、零售、物流、石油天然气、制造业、汽车、太空、SaaS,乃至机器学习和人工智能。虽然当前时序数据库仅局限于采集度量和监控,但是软件开发人员已经逐渐明白,他们的确需要一...

Ceph剖析:数据分布之CRUSH算法与一致性Hash

https://www.cnblogs.com/shanno/p/3958298.html数据分布是分布式存储系统的一个重要部分,数据分布算法至少要考虑以下三个因素:1)故障域隔离。同份数据的不同副本分布在不同的故障域,降低数据损坏的风险;2)负载均衡。数据能够均匀地分布在磁盘容量不等的存储节点,避免部分节点空闲部分节...
首页上一页...400401402403404...下一页尾页