51dev.com IT技术开发者社区

51dev.com 技术开发者社区

【Kafka】数据分区策略

【Kafka】数据分区策略

四种策略一、指定分区号,数据会直接发送到所指定的分区二、没有指定分区号,指定了数据的key,可以通过key获取hashCode决定数据发送到哪个分区三、都没有指定的话,会采取round-robinfashion,是kafka的轮询策略四、还可以自定义分区策略四种策略的Java实现其他的代码都不需要变...

【Kafka】自定义分区策略

【Kafka】自定义分区策略

思路Command+Option+shift+N调出查询页面,找到producer包的Partitioner接口Partitioner下有一个DefaultPartitioner实现类这里就有之前提到kafka数据分区策略自定义分区策略创建一个MyPartitioner类,继承并重新定义上面的Par...

【Kafka】Kafka简单介绍

【Kafka】Kafka简单介绍

目录基本介绍概述优点主要应用场景Kafka的架构四大核心API架构内部细节基本介绍概述Kafka官网网站:http://kafka.apache.org/Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。该项目的目标是为处理实时数据提供一个统一、高吞吐、低延迟...

【Kafka】Kafka集群基础操作!新手上路必备~

【Kafka】Kafka集群基础操作!新手上路必备~

目录bin目录Topic命令概览创建Topic查看Topic描述TopicProducer生产数据Consumer消费数据增加topic分区数增加配置删除配置删除Topic所有操作都要cd到/export/servers/kafka_2.11-1.0.0安装包下操作 bin目录bin目录下有很多sh...

【Kafka】Kafka集群环境搭建

【Kafka】Kafka集群环境搭建

目录一、初始环境准备二、下载安装包并上传解压三、修改配置文件四、启动ZooKeeper五、启动Kafka集群一、初始环境准备必须安装了JDK和ZooKeeper,并保证Zookeeper服务正常启动二、下载安装包并上传解压下载tar包地址:http://archive.apache.org/dist...

【Kafka】消息队列相关知识

【Kafka】消息队列相关知识

目录概述常用消息队列常用消息队列对比应用场景消息队列的两种模式概述消息(Message)是指在应用系统之间传递的数据。消息可以非常简单,比如只包含文本字符串,也可以更复杂,可能包含嵌入对象。消息队列(MessageQueue)是一种应用间的通信方式,也可以说是消息队列形成的模型,先进先出。消息一经发...

【Hadoop离线基础总结】oozie的安装部署与使用

【Hadoop离线基础总结】oozie的安装部署与使用

目录简单介绍概述架构安装部署1.修改core-site.xml2.上传oozie的安装包并解压3.解压hadooplibs到与oozie平行的目录4.创建libext目录,并拷贝依赖包到libext目录5.拷贝mysql的驱动包到libext目录下6.上传ext-2.2.zip压缩包到libext目...

【Hadoop离线基础总结】Hue与oozie集成

【Hadoop离线基础总结】Hue与oozie集成

目录1.停止oozie与hue的进程2.修改oozie的配置文件3.修改hue的配置文件4.启动hue与oozie的进程5.页面访问hue1.停止oozie与hue的进程bin/oozied.shstop2.修改oozie的配置文件(老版本的bug,新版本已经不需要了)这一步我们都不需要做了修改oo...

【Hadoop离线基础总结】oozie定时任务设置

【Hadoop离线基础总结】oozie定时任务设置

目录简介概述oozie定时任务设置1.拷贝定时任务的调度模板拷贝hello.sh脚本3.修改配置文件4.上传到hdfs对应路径5.运行定时任务简介概述在oozie当中,主要是通过Coordinator来实现任务的定时调度,与workflow类似。Coordinator这个模块也是主要通过xml来进行...

【Hadoop离线基础总结】oozie任务串联

【Hadoop离线基础总结】oozie任务串联

目录需求1.准备工作目录2.准备调度文件3.开发调度的配置文件4.上传资源文件夹到hdfs对应路径5.执行调度任务需求执行shell脚本→执行MR程序→执行hive程序1.准备工作目录cd/export/servers/oozie-4.1.0-cdh5.14.0/oozie_worksmkdir-p...

【Hadoop离线基础总结】oozie调度hive

【Hadoop离线基础总结】oozie调度hive

目录1.拷贝hive的案例模板2.编辑hive模板3.上传工作文件到hdfs4.执行oozie的调度5.查看调度结果1.拷贝hive的案例模板cd/export/servers/oozie-4.1.0-cdh5.14.0cp-raexamples/apps/hive2/oozie_works/2.编...

【Hadoop离线基础总结】oozie调度MapReduce任务

【Hadoop离线基础总结】oozie调度MapReduce任务

目录1.准备MR执行的数据2.执行官方测试案例3.准备我们调度的资源4.修改配置文件5.上传调度任务到hdfs对应目录6.执行调度任务1.准备MR执行的数据MR的程序可以是自己写的,也可以是hadoop工程自带的。这里选用hadoop工程自带的MR程序来运行wordcount的示例准备以下数据上传到...

【Hadoop离线基础总结】oozie调度shell脚本

【Hadoop离线基础总结】oozie调度shell脚本

目录1.解压官方提供的调度案例2.创建工作目录3.拷贝任务模板到工作目录当中去4.随意准备一个shell脚本5.修改模板下的配置文件6.上传调度任务到hdfs上面去7.执行调度任务1.解压官方提供的调度案例cd/export/servers/oozie-4.1.0-cdh5.14.0tar-zxfo...

【Hadoop离线基础总结】Hue的简单介绍和安装部署

【Hadoop离线基础总结】Hue的简单介绍和安装部署

目录Hue的简单介绍概述核心功能安装部署下载Hue的压缩包并上传到linux解压编译安装启动启动Hue进程hue与其他框架的集成Hue与Hadoop集成Hue与Hive集成Hue与Impala集成Hue与Mysql集成Hue与oozie集成Hue的简单介绍概述CDHHue官方帮助文档:http://...

【Hadoop离线基础总结】Hue与Mysql集成

【Hadoop离线基础总结】Hue与Mysql集成

1.修改hue.ini配置文件这里要去掉#,打开mysql注释,大概在1547行[[[mysql]]]nice_name="MySQLDB"engine=mysqlhost=node03.hadoop.comport=3306user=rootpassword=1234562.启动hue进程,查看H...