#Flink

flink入门到实战(9)Flink 作业问题分析和调优实践

    1.原理剖析   2.性能定位   3.经典场景调优   4.内存调优         &n...

flink入门到实战(8)flink 有状态 udf引发的大坑一

场景最近在做一个画像的任务,sql实现的,其中有一个udf,会做很多事情,包括将从redis读出历史值加权,并将中间结果和加权后的结果更新到redis。大家都知道,flink是可以支持事件处理的,也就是可以没有时间的概念,那么在聚合,join等操作的时候,flink内部会维护一个状态,假如此时你也用redis维护了历史...

flink入门到实战(7)flink checkpoint 在 window 操作下 全局配置失效的问题

 flink版本号1.6.2flink集群模式flinkonyarn使用flink读取kafka数据简单处理之后使用自定义richWindowFunction处理数据的时候出现异常报错:AsynchronousException{java.lang.Exception:Couldnotmaterializec...

大数据集群运维(23)Flink on yarn 常见错误

Flinkonyarn依赖hadoop集群,在没有启动hadoop之前,直接执行Flink启动命令./bin/yarn-session.sh-n1-jm1024-tm4096结果就是flink连不上ResourceManager,脚本一直卡在着进行重试2018-05-1914:36:08,062INFOorg.apac...

实时数仓之(2)flink实时数仓从入门到实战

第一章、flink实时数仓入门一、依赖 <!--LicensedtotheApacheSoftwareFoundation(ASF)underoneormorecontributorlicenseagreements.SeetheNOTICEfiledistributedwiththisworkfora...

flink源码解析(1)透过源码看懂Flink核心框架的执行流程

Flink是大数据处理领域最近很火的一个开源的分布式、高性能的流式处理框架,其对数据的处理可以达到毫秒级别。本文以一个来自官网的WordCount例子为引,全面阐述flink的核心架构及执行流程,希望读者可以借此更加深入的理解Flink逻辑。本文跳过了一些基本概念,如果对相关概念感到迷惑,请参考官网文档。另外在本文写作...

flink入门到实战(6)flink批处理从0到1

介绍:flink提供了大量的已经实现好的source方法,你也可以自定义source通过实现sourceFunction接口来自定义无并行度的source,或者你也可以通过实现ParallelSourceFunction 接口or继承RichParallelSourceFunction 来自定义有并...
代码星球 ·2020-09-05

flink入门到实战(4)flink基础篇

Flink面试--核心概念和基础考察1、简单介绍一下Flink2、Flink相比传统的SparkStreaming有什么区别?3、Flink的组件栈有哪些?    面试知识带你,分为以下几个部分: 第一部分:Flink中的核心概念和基础篇,包含了Flink的整体介绍、核...
代码星球 ·2020-09-05

flink入门到实战(3)flink进阶篇

Flink面试--进阶篇1、Flink是如何支持批流一体的?2、Flink是如何做到高效的数据交换的?3、Flink是如何做容错的?4、Flink分布式快照的原理是什么?5、Flink是如何保证Exactly-once语义的?6、Flink的kafka连接器有什么特别的地方?7、说说Flink的内存管理是如何做的?8、...
代码星球 ·2020-09-05

flink源码阅读(2)

Flink面试--源码篇1、FlinkJob的提交流程?2、Flink所谓"三层图"结构是哪几个"图"?3、JobManger在集群中扮演了什么角色?4、JobManger在集群启动过程中起到什么作用?5、JobManger在集群启动过程中起到什么作用?6、JobManger在集群启动过程中起到什么作用?7、Flink...
代码星球 ·2020-09-05

flink入门到实战(2)flink优化总结

开启MicroBatch或MiniBatch(提升吞吐)MicroBatch和MiniBatch都是微批处理,只是微批的触发机制略有不同。原理同样是缓存一定的数据后再触发处理,以减少对State的访问,从而提升吞吐并减少数据的输出量。MiniBatch主要依靠在每个Task上注册的Timer线程来触发微批,需要消耗一定...

flink入门到实战(1)入门学习

Flink学习笔记一.简介1.定义:​针对流数据和批数据的分布式处理引擎。它主要是由Java代码实现。。2.应用场景:​流数据:把所有任务当成流来处理,处理观察和分析连续事件产生的数据。3.重要角色:​①Client:用来提交任务给JobManager。​②JobManager:分发任务给TaskManager去执行。...
代码星球 ·2020-09-05

Flink消费Kafka数据并把实时计算的结果导入到Redis

1.完成的场景在很多大数据场景下,要求数据形成数据流的形式进行计算和存储。上篇博客介绍了Flink消费Kafka数据实现Wordcount计算,这篇博客需要完成的是将实时计算的结果写到redis。当kafka从其他端获取数据立刻到Flink计算,Flink计算完后结果写到Redis,整个过程就像流水一样形成了数据流的处...

Flink+kafka实现Wordcount实时计算

1.FlinkFlink介绍:Flink是一个针对流数据和批数据的分布式处理引擎。它主要是由Java代码实现。目前主要还是依靠开源社区的贡献而发展。对Flink而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。再换句话说,Flink会把所有任务当成流来处理,这也是其最大的特点。Flink可以支持...

Apache Flink 开发环境搭建和应用的配置、部署及运行

https://mp.weixin.qq.com/s/noD2Jv6m-somEMtjWTJh3w本文是根据ApacheFlink系列直播课程整理而成,由阿里巴巴高级开发工程师沙晟阳分享,主要面向于初次接触Flink、或者对Flink有了解但是没有实际操作过的同学。希望帮助大家更顺利地上手使用Flink,并着手相关开发...
首页上一页12345下一页尾页