#oop

Ubuntu 12.04上安装Hadoop并运行

作者:凯鲁嘎吉-博客园 http://www.cnblogs.com/kailugaji/在官网上下载好四个文件在Ubuntu的/home/wrr/下创建一个文件夹java,将这四个文件拷到Ubuntu的/home/wrr/java/下,将eclipse、hadoop-2.7.6与jdk进行解压,将.iar文...

Hadoop源码解析之: TextInputFormat如何处理跨split的行

我们知道hadoop将数据给到map进行处理前会使用InputFormat对数据进行两方面的预处理: 对输入数据进行切分,生成一组split,一个split会分发给一个mapper进行处理。 针对每个split,再创建一个RecordReader读取Split内的数据,并按照<key,valu...

就没有我遇不到的报错!java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/filter/Filter

本来准备用HBase的Bulkload将HDFS的HFile文件导入到HBase的myuser2表中,用的是yarnjar的命令yarnjar/export/servers/hbase-1.2.0-cdh5.14.0/lib/hbase-server-1.2.0-cdh5.14.0.jarcompletebulkloa...

【HBase】HBase和Sqoop整合

目录需求一步骤一、修改sqoop配置文件二、在mysql中创建数据库和数据表并插入数据三、将mysql表中的数据导入到HBase表中四、在HBase表中查看数据需求二步骤一、创建hive外部表二、创建hive内部表并将外部表数据插入到内部表三、清空mysql表数据四、通过sqoop将hive内部表的数据导出到Mysql...
代码星球 ·2020-08-09

【Hadoop离线基础总结】Hadoop High AvailabilityHadoop基础环境增强

目录简单介绍HadoopHA概述集群搭建规划集群搭建第一步:停止服务第二步:启动所有节点的ZooKeeper第三步:更改配置文件第四步:启动服务简单介绍HadoopHA概述HA(HighAvailable)——高可用,是保证业务连续性的有效解决方案。一般有两个或两个以上的节点,分为活动节点(Active)及备用节点(S...

【Hadoop离线基础总结】oozie的安装部署与使用

目录简单介绍概述架构安装部署1.修改core-site.xml2.上传oozie的安装包并解压3.解压hadooplibs到与oozie平行的目录4.创建libext目录,并拷贝依赖包到libext目录5.拷贝mysql的驱动包到libext目录下6.上传ext-2.2.zip压缩包到libext目录下7.修改oozi...

【Hadoop离线基础总结】Hue与oozie集成

目录1.停止oozie与hue的进程2.修改oozie的配置文件3.修改hue的配置文件4.启动hue与oozie的进程5.页面访问hue1.停止oozie与hue的进程bin/oozied.shstop2.修改oozie的配置文件(老版本的bug,新版本已经不需要了)这一步我们都不需要做了修改oozie-site.x...

【Hadoop离线基础总结】oozie定时任务设置

目录简介概述oozie定时任务设置1.拷贝定时任务的调度模板拷贝hello.sh脚本3.修改配置文件4.上传到hdfs对应路径5.运行定时任务简介概述在oozie当中,主要是通过Coordinator来实现任务的定时调度,与workflow类似。Coordinator这个模块也是主要通过xml来进行配置即可Coordi...

【Hadoop离线基础总结】oozie任务串联

目录需求1.准备工作目录2.准备调度文件3.开发调度的配置文件4.上传资源文件夹到hdfs对应路径5.执行调度任务需求执行shell脚本→执行MR程序→执行hive程序1.准备工作目录cd/export/servers/oozie-4.1.0-cdh5.14.0/oozie_worksmkdir-psereval-ac...

【Hadoop离线基础总结】oozie调度MapReduce任务

目录1.准备MR执行的数据2.执行官方测试案例3.准备我们调度的资源4.修改配置文件5.上传调度任务到hdfs对应目录6.执行调度任务1.准备MR执行的数据MR的程序可以是自己写的,也可以是hadoop工程自带的。这里选用hadoop工程自带的MR程序来运行wordcount的示例准备以下数据上传到HDFS的/oozi...

【Hadoop离线基础总结】oozie调度hive

目录1.拷贝hive的案例模板2.编辑hive模板3.上传工作文件到hdfs4.执行oozie的调度5.查看调度结果1.拷贝hive的案例模板cd/export/servers/oozie-4.1.0-cdh5.14.0cp-raexamples/apps/hive2/oozie_works/2.编辑hive模板这里使...

【Hadoop离线基础总结】oozie调度shell脚本

目录1.解压官方提供的调度案例2.创建工作目录3.拷贝任务模板到工作目录当中去4.随意准备一个shell脚本5.修改模板下的配置文件6.上传调度任务到hdfs上面去7.执行调度任务1.解压官方提供的调度案例cd/export/servers/oozie-4.1.0-cdh5.14.0tar-zxfoozie-examp...

【Hadoop离线基础总结】Hue的简单介绍和安装部署

目录Hue的简单介绍概述核心功能安装部署下载Hue的压缩包并上传到linux解压编译安装启动启动Hue进程hue与其他框架的集成Hue与Hadoop集成Hue与Hive集成Hue与Impala集成Hue与Mysql集成Hue与oozie集成Hue的简单介绍概述CDHHue官方帮助文档:http://archive.cl...

【Hadoop离线基础总结】Hue与Mysql集成

1.修改hue.ini配置文件这里要去掉#,打开mysql注释,大概在1547行[[[mysql]]]nice_name="MySQLDB"engine=mysqlhost=node03.hadoop.comport=3306user=rootpassword=1234562.启动hue进程,查看Hive是否与Mysq...

【Hadoop离线基础总结】Hue与Impala集成

1.修改hue.ini配置文件[impala]server_host=node03server_port=21050impala_conf_dir=/etc/impala/conf2.启动hue进程,查看Hive是否与Hue集成成功cd/export/servers/hue-3.9.0-cdh5.14.0/build/...
首页上一页...1617181920...下一页尾页