#park

Spark 学习

环境:Ubuntu12.04,JDK1.6,scala 2.11.1,spark1.0.1,hadoop1.2.1一安装jdk这里不细说了,自行google吧。二安装scalascala官网:http://www.scala-lang.org/index.html,download下来解压tar-zxvf/m...
代码星球 代码星球·2020-04-05

Apache Spark 2.2.0 中文文档

 Geekhoo 关注    2017.09.2013:55* 字数2062 阅读13评论0喜欢1快速入门使用SparkShell进行交互式分析基础Dataset上的更多操作缓存独立的应用快速跳转本教程提供了如何使用Spark的快速入门介绍...

Dataflow编程模型和spark streaming结合

Dataflow编程模型和sparkstreaming结合 主要介绍一下Dataflow编程模型的基本思想,后面再简单比较一下Spark  streaming的编程模型 == 是什么 ==  为用户提供以流式或批量模式处理海量数据的能力,该...

Spark 的情感分析

本文描述了基于Spark如何构建一个文本情感分析系统。文章首先介绍文本情感分析基本概念和应用场景,其次描述采用Spark作为分析的基础技术平台的原因和本文使用到技术组件,然后介绍基于Spark如何构建文本情感分析系统,最后提出几种提高正确率的方法。9 评论   IBM公司在201...
代码星球 代码星球·2020-04-03

Spark Streaming实例

2015-02-0221:00 4343人阅读 评论(0) 收藏 举报 分类:spark(11) 转载地址:http://www.aboutyun.com/thread-8901-1-1.html这一章要讲Spark Streaming,讲之前首先回...
代码星球 代码星球·2020-04-03

史上最全的spark面试题——持续更新中

2018年09月09日16:34:10 为了九亿少女的期待 阅读数13696更多分类专栏: Spark 面试题 版权声明:本文为博主原创文章,遵循 CC4.0BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.c...

常见的七种Hadoop和Spark项目案例

有一句古老的格言是这样说的,如果你向某人提供你的全部支持和金融支持去做一些不同的和创新的事情,他们最终却会做别人正在做的事情。如比较火爆的Hadoop、Spark和Storm,每个人都认为他们正在做一些与这些新的大数据技术相关的事情,但它不需要很长的时间遇到相同的模式。具体的实施可能有所不同,但根据我的经验,它们是最常...

Flink及主流流框架spark,storm比较

 IT刊百家号17-05-2220:16引言随着大数据时代的来临,大数据产品层出不穷。我们最近也对一款业内非常火的大数据产品-ApacheFlink做了调研,今天与大家分享一下。ApacheFlink(以下简称flink)是一个旨在提供‘一站式’的分布式开源数据处理框架。是不是听起来很...

hadoop之Spark强有力竞争者Flink,Spark与Flink:对比与分析

hadoop之Spark强有力竞争者Flink,Spark与Flink:对比与分析Spark是一种快速、通用的计算集群系统,Spark提出的最主要抽象概念是弹性分布式数据集(RDD),它是一个元素集合,划分到集群的各个节点上,可以被并行操作。而Flink是可扩展的批处理和流式数据处理的数据处理平台。ApacheFlin...

Hadoop3.0新特性介绍,比Spark快10倍的Hadoop3.0新特性

Hadoop3.0新特性介绍,比Spark快10倍的Hadoop3.0新特性Apachehadoop项目组最新消息,hadoop3.x以后将会调整方案架构,将Mapreduce基于内存+io+磁盘,共同处理数据。其实最大改变的是hdfs,hdfs通过最近black块计算,根据最近计算原则,本地black块,加入到内存,...
首页上一页...1213141516下一页尾页