#累加器

累加器与广播变量

概述spark中的三大数据类型:RDD:分布式数据集累加器:分布式只写变量,可以支持多个分区同时向该RDD写入数据,并将数据返回广播变量:分布式只读变量 累加器示例程序如下:系统通过引用一个外部的自由变量sum,将多个分区的数据累加到sum上。defmain(args:Array[String]):Unit=...
代码星球 ·2020-10-20