发表评论取消回复
相关阅读
相关 Spark面试题(持续更新)
文章目录 * * 1.RDD中reduceBykey与groupByKey哪个性能好,为什么? * 2.Spark与MapReduce的区别 ...
相关 Spark面试,Spark面试题,Spark面试汇总
Table of Contents 1、你觉得spark 可以完全替代hadoop 么? 2、Spark消费 Kafka,分布式的情况下,如何保证消息的顺序? 3、对于
相关 spark面试题
1.spark中的RDD是什么,有哪些特性? 答:RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表
相关 Spark面试题(一)
参考文章:[Spark面试题(一)][Spark] [Spark 面试题系列-2][Spark _-2] [深入浅出Spark的Checkpoint机制][Spark_Ch
相关 Spark必问面试题
1、spark的有几种部署模式,每种模式特点?(☆☆☆☆☆) 1)本地模式 Spark不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定。将Spa
相关 Spark面试题
参考文章:[聊聊Spark中的宽依赖和窄依赖][Spark] 1. 关于"宽依赖"和"窄依赖" ![70][] > 判断窄依赖的依据:父类分区内的数
相关 Spark面试题(二)
> 本文首发于我的个人博客:[Spark面试题(二)][Spark] 1、Spark有哪两种算子? Transformation(转化)算子和Action(执行)算子。
相关 Spark面试题整理(三)
1、为什么要进行序列化序列化? 可以减少数据的体积,减少存储空间,高效存储和传输数据,不好的是使用的时候要反序列化,非常消耗CPU。 2、Yarn中的containe
相关 spark面试题
统计微博信息 试题描述: 有一个数据文件,它包含如下格式的两列数据 1111111112743457 1111111116386587 1111111
相关 spark面试题
Spark Core面试篇01 随着Spark技术在企业中应用越来越广泛,Spark成为大数据开发必须掌握的技能。前期分享了很多关于Spark的学习视频和文章,为了进
还没有评论,来说两句吧...