发表评论取消回复
相关阅读
相关 SparkCore RDD概述
1 RDD 概述 1.1 什么是 RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本...
相关 SparkCore之RDD序列化
SparkCore之RDD序列化 > 在SparkRDD编程中,初始化工作是在Driver端进行的,而实际运行程序是在Executor端进行的,涉及到了跨进程通信,是需要
相关 SparkCore(二):RDD基础
文章目录 一、什么是RDD 二、RDD核心属性 三、RDD执行原理 四、RDD创建 `Spark`计算框架为了能够进行高并发和高吞吐的数据处理,
相关 系统架构设计笔记(71)—— 信息系统概述
信息系统( Information System , IS )一般泛指收集 、 存储 、 处理和传播各种信息的具有完整功能的集合体。在这里,信息系统并没有强调收集 、 存储 、
相关 【Spark入门(1)】SparkCore之概述与运行环境
【时间】2021.10.15 【题目】【Spark入门(1)】SparkCore之概述与运行环境 一、引言 本文是课程[尚硅谷大数据Spark教程]
相关 SparkCore杂记二
这篇博客主要讲解Spark中任务shuffle与persistence, 首先来说说shuffle洗牌,学过hadoop的同学应该都了解mapreduce,每一个
相关 SparkCore杂记一
接触Spark也有一段时间了,最开始一直都是上网看一些博客,自己搭建个虚拟机倒腾,都是一些零散的学习,回头想想还是有必要系统性的学习、理解一遍,本系列博客将会
相关 SparkCore(一)
1.什么是RDD RDD分布式数据集,是Spark中最基础的数据抽象,代码中谁一个抽象类,它代表一不可变、可分区、元素可并行计算的集合。 1.2RDD的特点 分区
还没有评论,来说两句吧...