#oop

阿里巴巴飞天大数据架构体系与Hadoop生态系统

很多人问阿里的飞天大数据平台、云梯2、MaxCompute、实时计算到底是什么,和自建Hadoop平台有什么区别。先说HadoopHadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统,主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算,充分利用集群的威力进行高速运...

【Hadoop基础】hadoop fs 命令

1,hadoopfs–fs[local|<filesystemURI>]:声明hadoop使用的文件系统,如果不声明的话,使用当前配置文件配置的,按如下顺序查找:hadoopjar里的hadoop-default.xml->$HADOOP_CONF_DIR下的hadoop-default.xml-&g...

Using join buffer (Block Nested Loop)

Usingjoinbuffer(BlockNestedLoop)msyql的表连接算法走索引之后mysql>explainSELECTa.custid,b.score,b.xcreditscore,b.lrscoreFROM(SELECTDISTINCTcustidFROMsync.`credit_apply`W...

hadoop fs –stat 命令

当向HDFS上写文件时,可以通过设置dfs.blocksize配置项来设置文件的blocksize,这导致HDFS上不同文件的blocksize是不同的。有时候我们需要知道HDFS上某个文件的blocksize,比如想知道该该文件作为job的输入会创建几个map等。HadoopFSShell提供了一个-stat选项可以...
代码星球 ·2021-02-22

hadoop中的JournalNode

 1.在HADOOP扮演的角色JournalNode是在MR2也就是Yarn中新加的,journalNode的作用是存放EditLog的,在MR1中editlog是和fsimage存放在一起的然后SecondNamenode做定期合并,Yarn在这上面就不用SecondNamanode了. &nbs...
代码星球 ·2021-02-22

HADOOP HA 报错

 报错:  经过查看集群的jps如下:====================hadoop01jps===================2561FsShell1971ResourceManager2452NameNode2606Jps====================hadoop0...
代码星球 ·2021-02-22

hadoop的增删改查

1...
代码星球 ·2021-02-22

Hadoop的MR

1...
代码星球 ·2021-02-22

hadoop序列化

1.序列化    所谓的序列化,就是将结构化对象转化为字节流,以便在网络上传输或是写道磁盘进行永久存储。   反序列化,就是将字节流转化为结构化对象。   序列化在分布式数据处理的两大领域经常出现:进程间通信和永久存储。...
代码星球 ·2021-02-22

Snoopy.class.php使用手册

Snoopy-thePHPnetclientv1.2.4Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。Snoopy的特点:1、抓取网页的内容fetch2、抓取网页的文本内容(去除HTML标签)fetchtext3、抓取网页的链接,表单fetchlinksfetchform4、支持代理主机...
代码星球 ·2021-02-21

swiper在loop模式,当轮播到最后一张图时候,做其他事件

1、引入文件:<linkrel="stylesheet"href="css/swiper.min.css"><scriptsrc="js/swiper.min.js"></script>2、style样式:html,body{position:relative;height:100%...

spark为什么比hadoop的mr要快?

1.前言Spark是基于内存的计算,而Hadoop是基于磁盘的计算;Spark是一种内存计算技术。但是事实上,不光Spark是内存计算,Hadoop其实也是内存计算。Spark和Hadoop的根本差异是多个任务之间的数据通信问题:Spark多个任务之间数据通信是基于内存,而Hadoop是基于磁盘。SparkSQL比Ha...

hadoop namenode切换

hdfs haadmin -transitionToActive --forcemanual nn1将nn1强制转换为Activehdfshaadmin-transitionToStandby--forcemanualnn2将nn2强制转换为standby...
代码星球 ·2021-02-20

org.apache.hadoop.security.AccessControlException

Windows|Eclipse运行HDFS程序之后,报:org.apache.Hadoop.security.AccessControlException:Permissiondenied:user=WQbin,access=WRITE,inode="":hadoop:supergroup:rwxr-xr-x。或者Wi...

C#基础知识之OOP及OOP三大特性

在C#基础知识之类和结构体中我详细记录了类、类成员、重载、重写、继承等知识总结。这里就记录一下对面向对象和面向对象三大特性的广义理解。类是面向对象编程的基本单元,面向对象思想其实就是教给我们如何合理的运用类的规则去编写代码。封装就是通过给类及类中的成员变量、属性和方法设置不同的访问修饰符(public、protecte...
首页上一页12345...下一页尾页