pre主题的文章列表，还有pre的技术要点_第53页

Python安装常见问题：zipimport.ZipImportError: can't decompress data; zlib not available 解决办法

centos7安装python3.7.2时，报错，解决如下yum-yinstallzlib* 参考：https://blog.csdn.net/u014749862/article/details/54430022https://www.cnblogs.com/kaid/p/7639107.htm...

代码星球 ·2020-08-09

/usr/bin/perl:bad interpreter:No such file or directory 的解决办法

yum-yinstallgccgcc-c++perlmakekernel-headerskernel-devel 可能会提示：Cannotfindavalidbaseurlforrepo:base/7/x86_6这是因为没有网！参考：https://blog.csdn.net/Hell...

代码星球 ·2020-08-09

解决错误 fatal error C1010: unexpected end of file while looking for precompiled head

在编译VS时候，出现fatalerrorC1010:unexpectedendoffilewhilelookingforprecompiledhead。问题详细解释：致命错误C1010，在寻找预编译指示头文件时，文件未预期结束。就是没有找到预编译指示信息的问文件。顾名思义就是预编译因...

代码星球 ·2020-08-09

【HBase】HBase与MapReduce集成——从HDFS的文件读取数据到HBase

目录需求步骤一、创建maven工程，导入jar包二、开发MapReduce程序三、结果需求将HDFS路径/hbase/input/user.txt文件的内容读取并写入到HBase表myuser2中首先在HDFS上准备些数据让我们用hdfsdfs-mkdir-p/hbase/inputcd/export/servers/...

代码星球 ·2020-08-09

【HBase】HBase与MapReduce的集成案例

目录需求步骤一、创建maven工程，导入jar包二、开发MapReduce程序三、运行结果HBase与MapReducer集成官方帮助文档：http://archive.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.14.0/book.html需求在HBase先创建一张表myuser...

代码星球 ·2020-08-09

【Hadoop离线基础总结】oozie调度MapReduce任务

目录1.准备MR执行的数据2.执行官方测试案例3.准备我们调度的资源4.修改配置文件5.上传调度任务到hdfs对应目录6.执行调度任务1.准备MR执行的数据MR的程序可以是自己写的，也可以是hadoop工程自带的。这里选用hadoop工程自带的MR程序来运行wordcount的示例准备以下数据上传到HDFS的/oozi...

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce参数优化

资源相关参数这些参数都需要在mapred-site.xml中配置mapreduce.map.memory.mb一个MapTask可使用的资源上限（单位:MB），默认为1024如果MapTask实际使用的资源量超过该值，则会被强制杀死。mapreduce.reduce.memory.mb一个ReduceTask可使用的资...

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce案例之自定义groupingComparator

求取Top1的数据需求求出每一个订单中成交金额最大的一笔交易订单id商品id成交金额Order_0000005Pdt_01222.8Order_0000005Pdt_0525.8Order_0000002Pdt_03322.8Order_0000002Pdt_04522.4Order_0000002Pdt_05822....

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce自定义InputFormat和OutputFormat案例

自定义InputFormat合并小文件需求无论hdfs还是mapreduce，存放小文件会占用元数据信息，白白浪费内存，实践中，又难免面临处理大量小文件的场景优化小文件的三种方式1.在数据采集的时候，就将小文件或小批数据合成大文件再上传HDFS2.在业务处理之前，在HDFS上使用mapreduce程序对小文件进行合并3...

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce倒排索引建立

求某些单词在文章中出现多少次有三个文档的内容，求hello,tom,jerry三个单词在其中各出现多少次hellotomhellojerryhellotomhellojerryhellojerrytomjerryhellojerryhellotomjava代码实现定义一个Mapper类packagecn.itcast....

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce 社交粉丝数据分析求出哪些人两两之间有共同好友，及他俩的共同好友都有谁？

求出哪些人两两之间有共同好友，及他俩的共同好友都有谁？用户及好友数据A:B,C,D,F,E,OB:A,C,E,KC:F,A,D,ID:A,E,F,LE:B,C,D,M,LF:A,B,C,D,E,O,MG:A,C,D,E,FH:A,C,D,E,OI:A,OJ:B,OK:A,C,DL:D,E,FM:E,F,GO:A,H,I...

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce增强（下）

MapTask运行机制详解以及MapTask的并行度MapTask运行流程第一步：读取数据组件InputFormat（默认TextInputFormat）会通过getSplits方法，对输入目录中的文件（输入目录也就是TextInputFormat的Path）进行逻辑切片得到splits。 ps.getSplit...

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce增强（上）

MapReduce的分区与reduceTask的数量概述MapReduce当中的分区：物以类聚，人以群分。相同key的数据，去往同一个reduce。ReduceTask的数量默认为一个，可以自己设定数量 job.setNumRudeceTasks(3)分区决定了我们的数据该去往哪一个ReduceTask里面去用代码实...

代码星球 ·2020-08-09

【Hadoop离线基础总结】MapReduce入门

Mapreduce思想概述MapReduce的思想核心是分而治之，适用于大量复杂的任务处理场景（大规模数据处理场景）。最主要的特点就是把一个大的问题，划分成很多小的子问题，并且每个小的子问题的求取思路与我们大问题的求取思路一样。最主要有两个阶段：一个map阶段，负责拆分；一个是reduce阶段，负责聚合。思想模型一个文...

代码星球 ·2020-08-09

XMLHttpRequest2.0的进步之处

varxhr=newXMLHttpRequest();xhr.open('GET','example.php');xhr.send();xhr.onreadystatechange=function(){if(xhr.readyState==4&&xhr.status==200){alert(xhr.r...

代码星球 ·2020-08-08

Python安装常见问题：zipimport.ZipImportError: can't decompress data; zlib not available 解决办法

/usr/bin/perl:bad interpreter:No such file or directory 的解决办法

解决错误 fatal error C1010: unexpected end of file while looking for precompiled head

【HBase】HBase与MapReduce集成——从HDFS的文件读取数据到HBase

【HBase】HBase与MapReduce的集成案例

【Hadoop离线基础总结】oozie调度MapReduce任务

【Hadoop离线基础总结】MapReduce参数优化

【Hadoop离线基础总结】MapReduce案例之自定义groupingComparator

【Hadoop离线基础总结】MapReduce自定义InputFormat和OutputFormat案例

【Hadoop离线基础总结】MapReduce倒排索引建立

【Hadoop离线基础总结】MapReduce 社交粉丝数据分析 求出哪些人两两之间有共同好友，及他俩的共同好友都有谁？

【Hadoop离线基础总结】MapReduce增强（下）

【Hadoop离线基础总结】MapReduce增强（上）

【Hadoop离线基础总结】MapReduce入门

XMLHttpRequest2.0的进步之处

【Hadoop离线基础总结】MapReduce 社交粉丝数据分析求出哪些人两两之间有共同好友，及他俩的共同好友都有谁？