#数据实验室

数据标准化处理

引用自:http://blog.csdn.net/pipisorry/article/details/52247379   数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的...
代码星球 ·2020-04-11

python-数据库开发

1,数据库管理软件的由来①程序所有的组件就不可能运行在一台机器上因为这台机器一旦挂掉则意味着整个软件的崩溃,并且程序的执行效率依赖于承载它的硬件,而一台机器的性能总归是有限的,受限于目前的硬件水平,就一台机器的性能垂直进行扩展是有极限的。于是我们只能通过水平扩展来增强我们系统的整体性能,这就需要我们将程序的各个组件分布...
代码星球 ·2020-04-11

大数据--论文读后感

 读了有关Goodle的File-System、MapReduce和Bigtable的论文。 其中File-System中的GFS是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统,它不仅满足了人们对内存的需求,而且该系统还将文件管理得有序不乱,该系统在现在的电脑中应用范围广泛,它也有许多的优...
代码星球 ·2020-04-11

springmvc(五) 数据回显与自定义异常处理器

      这章讲解一下springmvc的数据回显和自定义异常处理器的使用,两个都很简单                  --WZY一、数据回显技术      Springmvc默认支持对pojo类型的数据回显,默认不支持简单类型的数据回显      1.1、什么是数据回显?        在信息校验时,如果发生校...

springmvc(四) springmvc的数据校验的实现

      soeasy~              --WZY一、什么是数据校验?      这个比较好理解,就是用来验证客户输入的数据是否合法,比如客户登录时,用户名不能为空,或者不能超出指定长度等要求,这就叫做数据校验。      数据校验分为客户端校验和服务端校验        客户端校验:js校验      ...

数据结构(三) 用java实现七种排序算法。

      很多时候,听别人在讨论快速排序,选择排序,冒泡排序等,都觉得很牛逼,心想,卧槽,排序也分那么多种,就觉得别人很牛逼呀,其实不然,当我们自己去了解学习后发现,并没有想象中那么难,今天就一起总结一下各种排序的实现原理并加以实现。                        -WZY一、文章编写风格总览    ...

数据结构(一) 单链表的实现-JAVA

      数据结构还是很重要的,就算不是那种很牛逼的,但起码得知道基础的东西,这一系列就算是复习一下以前学过的数据结构和填补自己在这一块的知识的空缺。按照链表、栈、队列、排序、数组、树这种顺序来学习数据结构这门课程把。                            -WZY一、单链表的概念      链表是最...

[转载] 元数据与主数据管理

[转载自http://blog.itpub.net/13880072/viewspace-1121612/]  企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。本文将主要针对主数据、元数据的相关概念以及应用跟大家做一个探讨。 1.1 主数据和主数据管理的概念  企业主数据是用来描述企业核...
代码星球 ·2020-04-11

数据挖掘专业术语

术语或简写备忘(按字母顺序)A/aactivationfunction 激活函数artificialneutron:perceptron(以前),sigmoidneutron(如今的模型)B/bbackpropagation 反向传播betaversion   &nbs...
代码星球 ·2020-04-11

精通Web Analytics 2.0 (8) 第六章:使用定性数据解答”为什么“的谜团

  当我走进一家超市,我不希望员工会认出我或重新为我布置商店。然而,当我访问一个在线超市,我很郁闷的是在我第三次访问时,他们仍然不知道我住在加利福尼亚州,他们没有给我介绍在我的本地商店有售的商品。当人们在网上购物时,他们会有不同的一些期待。因此,您的WebAnalytics2.0策略必须包括至少几个积极地倾听客户的声音...

建模前的数据清洗/ETL(python)

1.读取数据data=open('e:/java_ws/scalademo/data/sample_naive_bayes_data.txt','r')2.把数据随机分割为training集和test集defSplitData(data,max,ind,seed):##seedisalwaysbe11Ltest=[]t...

分区复制数据

 今天遇到了个小问题:如何在分区表之间复制部分分区数据?--源分区表,分区为partCREATETABLEIFNOTEXISTSco_v2_test(a1string)partitionedby(partstring);insertoverwritetableco_v2_testpartition(part=...
代码星球 ·2020-04-11

Spark MLib 数据类型

 1. MLlib ApacheSpark'sscalablemachinelearninglibrary,withAPIsinJava,ScalaandPython.2. 数据类型本地向量,标注点,本地矩阵,分布式矩阵3.本地向量LocalVector稠密向量dense&nbs...
代码星球 ·2020-04-11

python 学习笔记6(数据库 sqlite)

26.SQLite轻量级的关系型数据库SQLite是python自带的数据库,可以搭配python存储数据,开发网站等。标准库中的 sqlite3 提供该数据库的接口。1.基本语法如下conn=sqlite3.connect("test.db")c=conn.cursor()c.execute("S...

如何实现大数据系统

经常有人问我有关“大数据”的问题,而且多半情况下我们似乎是在各种不同的抽象和理解级别进行交谈。实时 和高级分析 之类的词语频频现身,并且我们总是立即开始谈论产品,这通常并不是一个好主意。希望将类似本文的技术文章发送到您的收件箱吗?请订阅系统社区新闻快讯 &mdash...
代码星球 ·2020-04-11
首页上一页...330331332333334...下一页尾页