#ha

Hadoop资源调度器

hadoop调度器的作用是将系统中空闲的资源按一定策略分配给作业。调度器是一个可插拔的模块,用户可以根据自己的实际应用要求设计调度器。Hadoop中常见的调度器有三种,分别为:1.基于队列的FIFO(先进先出)  hadoop默认的资源调度器。优点:简单明了。缺点:忽略了不同作业的需求差异。2.计算能力调度器Capac...
代码星球 ·2020-03-30

配置hadoop集群的lzo压缩

MR-Job中使用lzop详见MR案例:Job中使用Lzo压缩1).配置前的环境准备#yum-yinstalllzo-develzlib-develgccautoconfautomakelibtool2).(all)在集群的所有节点上安装Lzo库 下载、解压,然后编译。并将/usr/local/hadoop/lzo-2...

解读:hadoop压缩格式

Hadoop中用得比较多的4种压缩格式:lzo,gzip,snappy,bzip2。它们的优缺点和应用场景如下:1).gzip压缩优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip格式的文件就和直接处理文本一样;有hadoopnative库;大部分linux系统都自带gzip命令...
代码星球 ·2020-03-30

解读:Hadoop Archive

hdfs并不擅长存储小文件,因为每个文件最少一个block,每个block的元数据都会在NameNode中占用150byte内存。如果存储大量的小文件,它们会吃掉NameNode节点的大量内存。MR案例:小文件处理方案HadoopArchive或者HAR,是一个高效地将小文件放入HDFS块中的文件存档工具。它能将多个小...
代码星球 ·2020-03-30

hadoop2对应的eclipse插件使用

1.eclipse插件安装步骤:a).把插件复制到eclipse安装目录plugins文件夹下b).打开eclipse的Window---Preference---HadoopM/R---指向hadoop-2.2.0安装目录:只要在Windows上将hadoop-2.2.0.tar.gz解压即可c).Window---...

hadoop随手笔记

1.HadoopStreaming是为了方便不太熟悉java用户编写MR程序的工具。用户可以将任何可执行文件(C++)或者脚本(python,ruby)作为Mapper/Reducer,提高了效率。HadoopSteaming要求用户编写的Mapper/Reducer从【标准输入】中读取数据,并将结果写到【标准输出】中...
代码星球 ·2020-03-30

MR案例:链式ChainMapper

类似于Linux管道重定向机制,前一个Map的输出直接作为下一个Map的输入,形成一个流水线。设想这样一个场景:在Map阶段,数据经过mapper01和mapper02处理;在Reduce阶段,数据经过sort和shuffle后,交给对应的reducer处理。reducer处理后并没有直接写入到Hdfs, 而...
代码星球 ·2020-03-29

解读:Hadoop序列化类

序列化(serialization)是指将结构化的对象转化字节流,以便在进程间通信或写入硬盘永久存储。反序列化(deserialization)是指将字节流转回到结构化对象的过程。需要注意的是,能够在网络上传输的只能是字节流。所以,Map的中间结果在不同主机间Shuffle洗牌时,结构化对象将经历序列化(map结果写入...
代码星球 ·2020-03-29

flask+layui+echarts实现前端动态图展示数据

效果图:该效果主要实现一个table展示数据,并在下方生成一个折线图。 实现方式:1、首先需要对表格进行一个数据加载,这里用到了layui的table.render,具体用法可以参考https://www.layui.com/doc/modules/table.htmlhtml部分:1<tablecla...

pycharm的安装与破解

    一、首先去Pycharm官网,或者直接输入网址:http://www.jetbrains.com/pycharm/download/#section=windows,下载PyCharm安装包,根据自己电脑的操作系统进行选择,对于windows系统选择下图的框框所包含的安装...
代码星球 ·2020-03-29

解决python3 UnicodeEncodeError: 'gbk' codec can't encode character 'xXX' in position XX

从网上抓了一些字节流,想打印出来结果发生了一下错误:UnicodeEncodeError:'gbk'codeccan'tencodecharacter'xbb'inposition8530:illegalmultibytesequence代码importurllib.requestres=urllib.request....

Error: webpack.optimize.UglifyJsPlugin has been removed, please use config.optimizat

按照教程上配置文件如下:varwebpack=require('webpack');varHtmlwebpackPlugin=require('html-webpack-plugin');varExtractTextPlugin=require('extract-text-webpack-plugin');varmer...

MySQL server has gone away和Maximum execution time of 120 seconds exceeded

今天在写采集时碰到两个问题1、MySQLserverhasgoneaway2、Maximumexecutiontimeof120secondsexceeded采集程序写好运行大概一分钟后出现MySQLserverhasgoneaway,发现mysql里面的max_allowed_packet=1M,这里改成了10M,运...

equals()和hashcode()

默认调用的情况:1.集合在存放对象时,首先判断hashcode(),再判断equals如果都是true,认为是相同的两个元素不进行存储。  删除对象时,将从hashcode指定位置查找再删除 2.在hashSet集合中的对象如果改变了对象的hashCode值将导致无法查找到以及无法删除集合...
IT猿 ·2020-03-28

mysql概要(三)having

1.运算符2.模糊查询(详解)%:表示0个或多个任意字符 _:表示一个任意字符SELECT*FROMuserWHEREu_nameLIKE'%三%'将会把u_name为“张三”,“张猫三”、“三脚猫”,“唐三藏”等...
IT猿 ·2020-03-28
首页上一页...296297298299300...下一页尾页