【Spark入门（2）】SparkCore之RDD核心编程

￡神魔★判官ぃ 2022-09-17 04:24 195阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，195人围观）

还没有评论，来说两句吧...

相关阅读

相关 SparkCore之RDD序列化

SparkCore之RDD序列化 > 在SparkRDD编程中，初始化工作是在Driver端进行的，而实际运行程序是在Executor端进行的，涉及到了跨进程通信，是需要

Myth丶恋晨/ 2022年12月31日 06:24/ 0 赞/ 175 阅读

相关 SparkCore（四）：RDD基础编程

文章目录一、RDD行动算子 1.1 reduce 1.2 collect 1.3 count 1.4 fir

谁借莪１个温暖的怀抱￠/ 2022年12月13日 14:05/ 0 赞/ 187 阅读

相关 Spark Core入门2【RDD的实质与RDD编程API】

一、对RDD操作的本质 RDD的本质是一个函数,而RDD的变换不过是函数的嵌套.RDD有两类: 1. 输入的RDD: 典型如KafkaRDD、JDBCRDD 2.

﹏ヽ暗。殇╰゛Y/ 2022年10月02日 00:38/ 0 赞/ 154 阅读

相关【Spark入门（2）】SparkCore之RDD核心编程

【时间】2021.10.26 【题目】【Spark入门（2）】SparkCore之RDD核心编程一、引言本文是课程[尚硅谷大数据Spark教程][Sp

￡神魔★判官ぃ/ 2022年09月17日 04:24/ 0 赞/ 196 阅读

相关 Spark-核心编程（四）RDD行动算子

RDD行动算子转换算子是不会触发作业的执行的，只是定义作业需要怎么做，行动算子将会使作业（job）真正的执行。其底层job将会执行上下文对象的runJob方法，底层代码

﹏ヽ暗。殇╰゛Y/ 2022年09月02日 15:58/ 0 赞/ 208 阅读

相关 Spark核心编程之RDD持久化详解

RDD持久化原理 Spark非常重要的一个功能特性就是可以将RDD持久化在内存中。当对RDD执行持久化操作时，每个节点都会将自己操作的RDD的partition持久化到内

深碍√TFBOYSˉ_/ 2022年05月25日 09:46/ 0 赞/ 271 阅读

相关 Spark系列--SparkCore(三)RDD基本操作

前言 RDD的基本操作分为两种，一种是转换Transformation，一种是行动Action RDD中的所有转换都是延迟加载的，也就是说，它们并不会直接计算结果。相反

r囧r小猫/ 2022年05月20日 05:06/ 0 赞/ 227 阅读

相关 Spark系列--SparkCore(二)RDD创建方式

一、RDD的创建方式创建RDD的创建方式大概可以分为三种：从集合中创建RDD；从外部存储创建RDD；从其他RDD转换。 1.1 从集合中创

桃扇骨/ 2022年05月20日 05:04/ 0 赞/ 202 阅读

相关 Spark系列--SparkCore(一)RDD简介

前言 RDD是Spark的基石，是实现Spark数据处理的核心抽象。那么RDD为什么会产生呢？ Hadoop的MapReduce是一种基于数据集的工作模式，面向数据，这

怼烎@/ 2022年05月20日 04:55/ 0 赞/ 262 阅读

相关 Spark系列--SparkCore(六)RDD分区详解

转载自：[https://blog.csdn.net/jiangsanfeng1111/article/details/78191891][https_blog.csdn.ne

柔情只为你懂/ 2022年05月19日 03:44/ 0 赞/ 232 阅读