spark面试题

我不是女神ヾ 2022-05-27 12:07 152阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，152人围观）

还没有评论，来说两句吧...

相关阅读

相关 Spark面试题(持续更新)

文章目录 * * 1.RDD中reduceBykey与groupByKey哪个性能好，为什么？ * 2.Spark与MapReduce的区别 ...

逃离我推掉我的手/ 2024年04月19日 12:31/ 0 赞/ 77 阅读

相关 Spark面试，Spark面试题，Spark面试汇总

Table of Contents 1、你觉得spark 可以完全替代hadoop 么? 2、Spark消费 Kafka，分布式的情况下，如何保证消息的顺序? 3、对于

素颜马尾好姑娘i/ 2023年08月17日 17:05/ 0 赞/ 103 阅读

相关 spark面试题

1.spark中的RDD是什么，有哪些特性？答：RDD（Resilient Distributed Dataset）叫做分布式数据集，是spark中最基本的数据抽象，它代表

曾经终败给现在/ 2022年12月27日 01:42/ 0 赞/ 163 阅读

相关 Spark面试题(一)

参考文章：[Spark面试题(一)][Spark] [Spark 面试题系列-2][Spark _-2] [深入浅出Spark的Checkpoint机制][Spark_Ch

Love The Way You Lie/ 2022年10月29日 07:39/ 0 赞/ 268 阅读

相关 Spark必问面试题

1、spark的有几种部署模式，每种模式特点？（☆☆☆☆☆） 1）本地模式 Spark不一定非要跑在hadoop集群，可以在本地，起多个线程的方式来指定。将Spa

深碍√TFBOYSˉ_/ 2022年09月17日 04:28/ 0 赞/ 317 阅读

相关 Spark面试题

参考文章：[聊聊Spark中的宽依赖和窄依赖][Spark] 1. 关于"宽依赖"和"窄依赖" ![70][] > 判断窄依赖的依据：父类分区内的数

素颜马尾好姑娘i/ 2022年09月03日 02:30/ 0 赞/ 156 阅读

相关 Spark面试题（二）

> 本文首发于我的个人博客：[Spark面试题（二）][Spark] 1、Spark有哪两种算子？ Transformation（转化）算子和Action（执行）算子。

雨点打透心脏的1/2处/ 2022年08月28日 02:55/ 0 赞/ 164 阅读

相关 Spark面试题整理（三）

1、为什么要进行序列化序列化？可以减少数据的体积，减少存储空间，高效存储和传输数据，不好的是使用的时候要反序列化，非常消耗CPU。 2、Yarn中的containe

川长思鸟来/ 2022年08月28日 00:50/ 0 赞/ 187 阅读

相关 spark面试题

统计微博信息试题描述: 有一个数据文件，它包含如下格式的两列数据 1111111112743457 1111111116386587 1111111

我不是女神ヾ/ 2022年05月27日 12:07/ 0 赞/ 153 阅读

相关 spark面试题

Spark Core面试篇01 随着Spark技术在企业中应用越来越广泛，Spark成为大数据开发必须掌握的技能。前期分享了很多关于Spark的学习视频和文章，为了进

柔情只为你懂/ 2022年05月21日 07:12/ 0 赞/ 457 阅读