#op

推荐系统(协同过滤,slope one)

1.推荐系统中的算法:协同过滤:   基于用户user-cf    基于内容item–cfslopone 关联规则(Apriori算法,啤酒与尿布) 2.slopeone算法slopeone算法是基于不同物品之间的评分差的线性算法...

Hadoop 之Hbase命令

一、常用命令:(hbaseshell进入终端)1.创建表:create'users','user_id','address','info'表users,有三个列族user_id,address,info2.列出全部表list3.得到标的信息describe‘users’4.删除表disable'users'drop'u...
代码星球 代码星球·2020-04-08

大数据之sqoopCDH 备份

Sqoop课程笔记一、概述1、什么是sqoop?Hadoop的优势在于对数据的存储和处理,相比以前传统的数据库,在处理较较多的数据时,传统数据行业通过提升单机性能以提高处理性能,而且性价比随着性能提高越来越低,在场景下派生出的大数据行业。同样的数据处理,hadoop无论是处理的性能和成本都远低于传统通过单机处理,但是从...
代码星球 代码星球·2020-04-08

大数据之sqoop

一、安装:1解压然后把mysql的驱动放在$SQOOP_HOME/lib目录中2.conf/sqoop-en.shexportHADOOP_COMMON_HOME=/home/hadoop/hadoop/hadoop-2.3.0exportHADOOP_MAPRED_HOME=/home/hadoop/hadoop/h...
代码星球 代码星球·2020-04-08

hadoop 集群 加入一个新的存储节点和删除一个计算节点需要刷新集群状态命令

加入一个新的存储节点和删除一个计算节点需要刷新集群状态命令方式1:静态添加datanode,停止namenode方式1.停止namenode2.修改slaves文件,并更新到各个节点3.启动namenode4.执行hadoopbalance命令。(此项为balance集群使用,如果只是添加节点,则此步骤不需要)----...

Hadoop之Hive 安装_(hadoop 集群)

Hivemysql的metastore安装准备(***掌握***)在nameNode1机子上实践:把hive-0.12.0.tar.gz解压到/itcast/#tar-zxvfhive-0.12.0.tar.gz-C/itcast修改/etc/profile文件,将hive加入环境变量#vim/etc/profilee...

Hadoop 之Mong DB 之CentOS 6 使用 yum 安装MongoDB及服务器端配置

安装MongoDB的方法有很多种,可以源代码安装,在Centos也可以用yum源安装的方法。由于MongoDB更新得比较快,我比较喜欢用yum源安装的方法。64位Centos下的安装步骤如下:1、准备工作运行yum命令查看MongoDB的包信息[root@localhost~]#yuminfomongo-10gen(提...

Hadoop 之MongoDB

NoSql简介:  COUCHDBREDISMONGODBNEO4J  HBASEBIGTABLE    存储非结构化数据  索引多:单键,多键,数组,全文,2D。MonggoDB数据类型:  null,boolean,没有int型,内嵌文档,    secureCRT ...
代码星球 代码星球·2020-04-08

Hadoop 之Impala

 impala是基于hive的大数据实时分析查询引擎,直接使用Hive的元数据库metadata意味着impala元数据都存储在hive的metadstore中并且impala兼容hive的sql解析,实现了hive得sql语义子集,功能还在不断完善中。shell命令impala-shell命令用法:&Osl...
代码星球 代码星球·2020-04-08

Hadoop之Storm其他_pom

1.pom配置<dependency><groupId>org.apache.storm</groupId><artifactId>storm-core</artifactId><version>0.9.3</version></...
代码星球 代码星球·2020-04-08

Hadoop之Storm命令

Hadoop之Storm命令1.storm核心概念stream--->一列火车tuple--->一节车厢数据--->乘客spout--->始发站bolt--->中间站点bolt--->中间站点bolt--->终点topology(拓扑)...
代码星球 代码星球·2020-04-08

Hadoop之Storm安装

nimbus:主节点,负责分发代码,分配任务(只能有一个)supervisor:从节点,负责执行任务(可以有多个)jdkzookeeper(192.168.1.170/171/172)建议在zookeeper的节点上设置一个crontab定时任务,同步时间:*****/usr/sbin/ntpdatetime.nist...
代码星球 代码星球·2020-04-08

如何编译Apache Hadoop2.6.0源代码

如何编译ApacheHadoop2.6.0源代码1.安装CentOS我使用的是CentOS6.5,下载地址是http://mirror.neu.edu.cn/centos/6.5/isos/x86_64/,选择CentOS-6.5-x86_64-bin-DVD1.iso下载,注意是64位的,大小是4GB,需要下载一段时...

Hadoop 之面试题

颜色区别:蓝色:hive,橙色:Hbase。黑色hadoop 请简述hadoop怎样实现二级排序.你认为用Java,Streaming,pipe方式开发map/reduce,各有哪些优缺点:6.请列出在你以前工作中所使用过的开发map/reduce的语言java:scala:python:shell:7.当前...
代码星球 代码星球·2020-04-08

Hadoop 面试题redis

Hadoop面试题之十548.redis有什么特别之处,为什么用redis,用hbase不行么?答:redis是基于内存的数据库,速度快551.redis用什么版本?3.0以上才支持集群553.redis安装时候遇到什么问题?log日志文件不存在,需要自己创建才能成功。redis-server/redis.confre...
代码星球 代码星球·2020-04-08
首页上一页...269270271272273...下一页尾页