51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#Flink
flink入门到实战(9)Flink 作业问题分析和调优实践
1.原理剖析 2.性能定位 3.经典场景调优 4.内存调优 &n...
代码星球
·
2020-09-20
flink
入门
实战
Flink
作业
flink入门到实战(8)flink 有状态 udf引发的大坑一
场景最近在做一个画像的任务,sql实现的,其中有一个udf,会做很多事情,包括将从redis读出历史值加权,并将中间结果和加权后的结果更新到redis。大家都知道,flink是可以支持事件处理的,也就是可以没有时间的概念,那么在聚合,join等操作的时候,flink内部会维护一个状态,假如此时你也用redis维护了历史...
代码星球
·
2020-09-20
flink
入门
实战
状态
udf
flink入门到实战(7)flink checkpoint 在 window 操作下 全局配置失效的问题
flink版本号1.6.2flink集群模式flinkonyarn使用flink读取kafka数据简单处理之后使用自定义richWindowFunction处理数据的时候出现异常报错:AsynchronousException{java.lang.Exception:Couldnotmaterializec...
代码星球
·
2020-09-20
flink
入门
实战
checkpoint
window
大数据集群运维(23)Flink on yarn 常见错误
Flinkonyarn依赖hadoop集群,在没有启动hadoop之前,直接执行Flink启动命令./bin/yarn-session.sh-n1-jm1024-tm4096结果就是flink连不上ResourceManager,脚本一直卡在着进行重试2018-05-1914:36:08,062INFOorg.apac...
代码星球
·
2020-09-20
数据
集群
运维
Flink
on
实时数仓之(2)flink实时数仓从入门到实战
第一章、flink实时数仓入门一、依赖 <!--LicensedtotheApacheSoftwareFoundation(ASF)underoneormorecontributorlicenseagreements.SeetheNOTICEfiledistributedwiththisworkfora...
代码星球
·
2020-09-19
时数
仓之
flink
入门
实战
flink源码解析(1)透过源码看懂Flink核心框架的执行流程
Flink是大数据处理领域最近很火的一个开源的分布式、高性能的流式处理框架,其对数据的处理可以达到毫秒级别。本文以一个来自官网的WordCount例子为引,全面阐述flink的核心架构及执行流程,希望读者可以借此更加深入的理解Flink逻辑。本文跳过了一些基本概念,如果对相关概念感到迷惑,请参考官网文档。另外在本文写作...
代码星球
·
2020-09-05
源码
flink
解析
透过
看懂
flink入门到实战(6)flink批处理从0到1
介绍:flink提供了大量的已经实现好的source方法,你也可以自定义source通过实现sourceFunction接口来自定义无并行度的source,或者你也可以通过实现ParallelSourceFunction 接口or继承RichParallelSourceFunction 来自定义有并...
代码星球
·
2020-09-05
flink
入门
实战
批处理
flink入门到实战(4)flink基础篇
Flink面试--核心概念和基础考察1、简单介绍一下Flink2、Flink相比传统的SparkStreaming有什么区别?3、Flink的组件栈有哪些? 面试知识带你,分为以下几个部分: 第一部分:Flink中的核心概念和基础篇,包含了Flink的整体介绍、核...
代码星球
·
2020-09-05
flink
入门
实战
基础
flink入门到实战(3)flink进阶篇
Flink面试--进阶篇1、Flink是如何支持批流一体的?2、Flink是如何做到高效的数据交换的?3、Flink是如何做容错的?4、Flink分布式快照的原理是什么?5、Flink是如何保证Exactly-once语义的?6、Flink的kafka连接器有什么特别的地方?7、说说Flink的内存管理是如何做的?8、...
代码星球
·
2020-09-05
flink
入门
实战
进阶
flink源码阅读(2)
Flink面试--源码篇1、FlinkJob的提交流程?2、Flink所谓"三层图"结构是哪几个"图"?3、JobManger在集群中扮演了什么角色?4、JobManger在集群启动过程中起到什么作用?5、JobManger在集群启动过程中起到什么作用?6、JobManger在集群启动过程中起到什么作用?7、Flink...
代码星球
·
2020-09-05
flink
源码
阅读
flink入门到实战(2)flink优化总结
开启MicroBatch或MiniBatch(提升吞吐)MicroBatch和MiniBatch都是微批处理,只是微批的触发机制略有不同。原理同样是缓存一定的数据后再触发处理,以减少对State的访问,从而提升吞吐并减少数据的输出量。MiniBatch主要依靠在每个Task上注册的Timer线程来触发微批,需要消耗一定...
代码星球
·
2020-09-05
flink
入门
实战
优化
总结
flink入门到实战(1)入门学习
Flink学习笔记一.简介1.定义:针对流数据和批数据的分布式处理引擎。它主要是由Java代码实现。。2.应用场景:流数据:把所有任务当成流来处理,处理观察和分析连续事件产生的数据。3.重要角色:①Client:用来提交任务给JobManager。②JobManager:分发任务给TaskManager去执行。...
代码星球
·
2020-09-05
入门
flink
实战
学习
Flink消费Kafka数据并把实时计算的结果导入到Redis
1.完成的场景在很多大数据场景下,要求数据形成数据流的形式进行计算和存储。上篇博客介绍了Flink消费Kafka数据实现Wordcount计算,这篇博客需要完成的是将实时计算的结果写到redis。当kafka从其他端获取数据立刻到Flink计算,Flink计算完后结果写到Redis,整个过程就像流水一样形成了数据流的处...
代码星球
·
2020-09-02
Flink
消费
Kafka
数据
并把
Flink+kafka实现Wordcount实时计算
1.FlinkFlink介绍:Flink是一个针对流数据和批数据的分布式处理引擎。它主要是由Java代码实现。目前主要还是依靠开源社区的贡献而发展。对Flink而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。再换句话说,Flink会把所有任务当成流来处理,这也是其最大的特点。Flink可以支持...
代码星球
·
2020-09-02
Flink+kafka
实现
Wordcount
实时
计算
Apache Flink 开发环境搭建和应用的配置、部署及运行
https://mp.weixin.qq.com/s/noD2Jv6m-somEMtjWTJh3w本文是根据ApacheFlink系列直播课程整理而成,由阿里巴巴高级开发工程师沙晟阳分享,主要面向于初次接触Flink、或者对Flink有了解但是没有实际操作过的同学。希望帮助大家更顺利地上手使用Flink,并着手相关开发...
代码星球
·
2020-04-05
Apache
Flink
开发
环境
建和
首页
上一页
1
2
3
4
5
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他