#数据实验室

大数据之sqoopCDH 备份

Sqoop课程笔记一、概述1、什么是sqoop?Hadoop的优势在于对数据的存储和处理,相比以前传统的数据库,在处理较较多的数据时,传统数据行业通过提升单机性能以提高处理性能,而且性价比随着性能提高越来越低,在场景下派生出的大数据行业。同样的数据处理,hadoop无论是处理的性能和成本都远低于传统通过单机处理,但是从...
代码星球 ·2020-04-08

大数据之sqoop

一、安装:1解压然后把mysql的驱动放在$SQOOP_HOME/lib目录中2.conf/sqoop-en.shexportHADOOP_COMMON_HOME=/home/hadoop/hadoop/hadoop-2.3.0exportHADOOP_MAPRED_HOME=/home/hadoop/hadoop/h...
代码星球 ·2020-04-08

大数据之pig 命令

1.pig与hive的区别pig和hive比较类似的,都是类sql的语言,底层都是依赖于hadoop   走的mapreduce任务。   pig和hive的区别就是,想要实现一个业务逻辑的话,使用pig需要一步一步操作   而使...
代码星球 ·2020-04-08

大数据之pig安装

大数据之pig安装 1.下载  pigdownload 2.解压安装mapreduce模式安装:1:设置HADOOP_HOME,如果pig所在节点不是集群中的节点,那就需要把集群中使用的hadoop的安装包拷贝过来一份。exportHADOOP_HOME=/usr/local/hadoop-2.6....
代码星球 ·2020-04-08

大数据之Ganglia安装1

0、前期准备修改主机名、ip、iptables关闭;时间同步:ntpdate-stime.windows.com;软件准备ganglia-3.7.1.tar.gz、ganglia-web-3.7.0.tar.gz地址:http://ganglia.info/?page_id=66confuse-2.7.tar.gz地址...
代码星球 ·2020-04-08

大数据之Ganglia

1.什么是ganglia一个开源集群监视项目;Ganglia可以做系统监控,但是,目前它不支持服务器异常或故障报警功能。2.Ganglia监控集群架构Ganglia集群主要是由gmond、gmetad、gweb这3个守护进程组成,其中gmetad进程相当于监控集群的master。而多个gmond进程可以进行分组,每个分...
代码星球 ·2020-04-08

数据挖掘书籍

http://blog.csdn.net/dream_angel_z/article/details/44773801...
代码星球 ·2020-04-08

大数据处理时用到maven的repository

 由于做数据处理时,经常遇到maven下载依赖包错误,下面我将自己下载好的repository分享下里边包含:Hadoop,storm,sprk,kafka,等压缩后500多M。 http://pan.baidu.com/s/1pJN2ScV 如有问题请联系:chaoren399@126....

大数据扫盲

大数据扫盲目录大数据扫盲    10.1.    大数据处理流程    10.2.    大数据处理技术架构    21.    数据分区与路由    21.1.    二级映射机制    31.1.1.    哈希分区    31.1.2.    虚拟桶(virtualbucket)    31.1.3.    一致...
代码星球 ·2020-04-08

数据科学家可能成为2015年最热门职业

数据科学家可能成为2015年最热门职业   腾讯科技讯1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌?  如果你拥有这样的技能集,那你就有可能当上数据科学家。而如果你当上了数据科学家,那你的日子就可以过得风风光光了——LinkedIn的最新投票结果显示,"统计分析和数据挖掘"是2014年最大的求职...

mysql 数据表中查找重复记录

以下sql语句可以实现查找出一个表中的所有重复的记录selectuser_name,count(*)ascountfromuser_tablegroupbyuser_namehavingcount>1;  ...

数据库比对脚本(PHP版)

$config=['hotfix'=>['host'=>'','port'=>'','account'=>'','password'=>'','database'=>'',],'release'=>['host'=>'','port'=>'','account'=&...
代码星球 ·2020-04-08

PHP MYSQL数据字典

<?php/***生成mysql数据字典*/header("Content-type:text/html;charset=utf-8");//配置数据库$dbserver="localhost:3306";$dbusername="root";$dbpassword="root";$database=isset(...
代码星球 ·2020-04-08

PHP使用纯真IP数据库

#纯真数据库调用函数(需要下载纯真数据库文件)functionconvertip($ip){$ip1num=0;$ip2num=0;$ipAddr1="";$ipAddr2="";$dat_path='./QQWry.Dat';//纯真数据库文件位置if(!preg_match("/^d{1,3}.d{1,3}.d{1...

vue中的组件,Component元素,自定义路由,异步数据获取

组件是Vue最强大的功能之一。组件是一组可被复用的具有一定功能,独立的完整的代码片段,这个代码片段可以渲染一个完整视图结构组件开发如何注册组件?第一步,在页面HTML标签中使用这个组件名称,像使用DOM元素一样。(通常是一个自定义元素)。<divid="app">  <my-component>...
首页上一页...342343344345346...下一页尾页