发表评论取消回复
相关阅读
相关 Spark面试问题
Apache Spark是一种基于Hadoop和MapReduce技术的开源,闪电般的计算技术,支持各种计算技术,以实现快速高效的处理。Spark 以其内存中集群计算而闻名,这
相关 Spark面试:Spark on yarn 运行流程
一: Spark on YARN能让Spark计算模型在云梯YARN集群上运行,直接读取云梯上的数据,并充分享受云梯YARN集群丰富的计算资源。 二: 基于YARN
相关 面试篇spark(spark core,spark sql,spark 优化)
一:为什么学习spark? 相比较map-reduce框架,spark的框架执行效率更加高效。 mapreduce的执行框架示意图。 ![在这里插入图片描述][6
相关 Spark面试,Spark面试题,Spark面试汇总
Table of Contents 1、你觉得spark 可以完全替代hadoop 么? 2、Spark消费 Kafka,分布式的情况下,如何保证消息的顺序? 3、对于
相关 spark面试题
1.spark中的RDD是什么,有哪些特性? 答:RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表
相关 Spark面试题
参考文章:[聊聊Spark中的宽依赖和窄依赖][Spark] 1. 关于"宽依赖"和"窄依赖" ![70][] > 判断窄依赖的依据:父类分区内的数
相关 spark面试题
统计微博信息 试题描述: 有一个数据文件,它包含如下格式的两列数据 1111111112743457 1111111116386587 1111111
相关 spark面试题
Spark Core面试篇01 随着Spark技术在企业中应用越来越广泛,Spark成为大数据开发必须掌握的技能。前期分享了很多关于Spark的学习视频和文章,为了进
相关 spark面试
spark面试问题收集 spark面试问题 1、spark中的RDD是什么,有哪些特性 RDD(Resilient Distributed Datase
相关 [spark 面试]Spark解决数据倾斜问题
一、前述 数据倾斜问题是大数据中的头号问题,所以解决数据倾斜尤为重要,本文只针对几个常见的应用场景做些分析 。 二。具体方法 1、使用Hive ETL预处理
还没有评论,来说两句吧...