#hadoop

spark使用hadoop native库

默认情况下,hadoop官方发布的二进制包是不包含native库的,native库是用C++实现的,用于进行一些CPU密集型计算,如压缩。比如apachekylin在进行预计算时为了减少预计算的数据占用的磁盘空间,可以配置使用压缩格式。默认情况下,启动spark-shell,会有无法加载native库的警告:19/02...
代码星球 ·2020-04-05

hadoop学习笔记系列(收藏)

https://www.cnblogs.com/edisonchou/category/542546.html...

hadoop1.2.1三种模式配置

1.本地模式本地模式的安装将hadoop安装包解压后不用任何配置就是默认的本地模式此时core-site.xml,hdfs-site.xml,marped.site.xml三个配置文件都为空此时没有hdfs文件系统,可以执行mapreducehadoopfs-ls/会列出本地的linux文件系统 2.伪分布式...

hadoop1.2.1 伪分布式配置

主要配置core-site.xml  hdfs-site.xml mapred-site.xml ...
代码星球 ·2020-04-05

Hadoop笔记

1.Hive支持行级别的查询,数据更新,不支持多行事务;2.Hive有两种数据库,Derby内置的mysql或其他  3.连接MySQL时,需要将mysql-jdbc的驱动包放入hive的lib目录下4.变量和属性 四种命名空间:  hivavar:用户自定义变量空间&...
代码星球 ·2020-04-05

hadoop 权限错误 Permission denied: user=root, access=WRITE, inode="/":hdfs:super

关于不能执行Hadoop命令 并报权限问题执行错误1、Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-xmkdir: Permission ...

Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS

为了方便新手入门,我们准备了两篇不同系统的Hadoop伪分布式配置教程。但其他Hadoop教程我们将不再区分,可同时适用于Ubuntu和CentOS/RedHat系统。例如本教程以Ubuntu系统为主要演示环境,但对Ubuntu/CentOS的不同配置之处、CentOS6.x与CentOS7的操作区别等都会尽量给出注明...

Hadoop安装教程_单机/伪分布式配置

本教程使用 CentOS6.432位 作为系统环境,请自行安装系统(可参考使用VirtualBox安装CentOS)。如果用的是Ubuntu系统,请查看相应的 Ubuntu安装Hadoop教程。本教程基于原生Hadoop2,在 Hadoop2.6.0(stable) 版...

Install hadoop on windows(non-virtual machine, such cygwin)

DownloadBeforestartingmakesureyouhavethistwosoftwaresHadoop2.7.1Java–Jdk1.7+ExtractdownloadedtarfileConfigurationStep1– Windowspathconfiguratio...

hadoop 2.5.1单机安装部署伪集群

环境:ubuntu14.04server64版本hadoop2.5.1jdk1.6部署的步骤主要参考了http://blog.csdn.net/greensurfer/article/details/39450369这篇文章。 1安装java,配置好环境变量JAVA_HOMECLASSPATH具体步骤参考网上...

hadoop wordcount程序缺陷

在wordcount程序的main函数中,没有读取运行环境中的各种参数的值,全靠hadoop系统的默认参数跑起来,这样做是有风险的,最突出的就是OOM错误。自己在刚刚学习hadoop编程时,就是模仿wordcount程序编写。在数据量很小,作为demo程序跑,不会有什么问题,但当数据量激增,变成以亿计算时,各种问题都会...

新手安装 hadoop、hive和hbase 笔记

系统是ubuntu12.04,hadoop版本是1.2.1,hive版本是0.12,hbase版本我忘记了,不好意思首先是配置好hostnamevi/etc/hosts写入你要配置的ip和它的hostname这里我写入了192.168.19.129ubuntu给要部署hadoop的机器都互相配置信任关系,具体怎么玩,自...

Hadoop学习笔记系列

   这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存...
代码星球 ·2020-04-03

Hadoop 原理总结

 一、Hadoop技术原理Hdfs主要模块:NameNode、DataNodeYarn主要模块:ResourceManager、NodeManager常用命令:1)用hadoopfs操作hdfs网盘,使用Uri的格式访问(URI格式:secheme://authority/path,默认是hdfs://nam...
代码星球 ·2020-04-03

hadoop进阶

 1、操作系统有两个容易混淆的概念,进程和线程。进程:一个计算机程序的运行实例,包含了需要执行的指令;有自己的独立地址空间,包含程序内容和数据;不同进程的地址空间是互相隔离的;进程拥有各种资源和状态信息,包括打开的文件、子进程和信号处理。线程:表示程序的执行流程,是CPU调度执行的基本单位;线程有自己的程序计...
代码星球 ·2020-04-03
首页上一页...2425262728下一页尾页