Spark-计算引擎

布满荆棘的人生 2022-12-23 06:26 172阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，172人围观）

还没有评论，来说两句吧...

相关阅读

相关实时计算引擎Spark笔试题:一些常见的比较总结

1 Spark repartition和coalesce的区别 1.1. repartition只是coalesce接口中shuffle为true的实现 1.2

桃扇骨/ 2023年10月06日 15:44/ 0 赞/ 30 阅读

相关实时计算引擎Spark笔试题:Spark 内存管理模型&动态内存管理

内存结构图![57b1deb3f2194c2fb10c4d233a61fe4c.png][] 动态内存管理 1.设定基本的存储内存和执行内存区域（spark.sto

我会带着你远行/ 2023年10月06日 15:44/ 0 赞/ 40 阅读

相关实时计算引擎Spark笔试题:Spark Shuffle 机制

说明:Spark是目前大数据中非常流行的运算框架,Spark的Shuffle机制是完成运算最重要的一环,面试时经常会被问到. 在Spark中，Shuffle分为map阶段和r

红太狼/ 2022年12月29日 00:08/ 0 赞/ 150 阅读

相关实时计算引擎Spark笔试题:Spark 内存管理模型&动态内存管理

内存结构图 ![1da8920e5afc9331b5bfc9a19eb0ede4.png][] 动态内存管理 1.设定基本的存储内存和执行内存区域（spark

一时失言乱红尘/ 2022年12月29日 00:08/ 0 赞/ 165 阅读

相关实时计算引擎Spark笔试题:Spark Streaming 反压机制(Back Pressure)

Spark Streaming 反压机制是1.5版本推出的特性，用来解决处理速度比摄入速度慢的情况，简单来讲就是做流量控制。当批处理时间(Batch Processing Ti

清疚/ 2022年12月28日 14:10/ 0 赞/ 223 阅读

相关实时计算引擎Spark笔试题:Spark Catalyst 查询优化器原理

这里我们讲解一下SparkSQL的优化器系统Catalyst，Catalyst本质就是一个SQL查询的优化器，而且和大多数当前的大数据SQL处理引擎设计基本相同（Impala

￡神魔★判官ぃ/ 2022年12月28日 14:10/ 0 赞/ 131 阅读

相关实时计算引擎Spark笔试题:一些常见的比较总结

1 Spark repartition和coalesce的区别 1.1. repartition只是coalesce接口中shuffle为true的实现 1.2

男娘i/ 2022年12月28日 14:09/ 0 赞/ 263 阅读

相关 Spark-计算引擎

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室

布满荆棘的人生/ 2022年12月23日 06:26/ 0 赞/ 173 阅读

相关 Flink及Storm、Spark主流计算引擎框架比较

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 Hadoop主要包括HDFS、MapReduce，以及数据仓库工具Hive，分布式数据库Hbase

雨点打透心脏的1/2处/ 2022年11月06日 01:49/ 0 赞/ 169 阅读

相关大数据学习笔记之spark及spark streaming----快速通用计算引擎

导语 spark 已经成为广告、报表以及推荐系统等大数据计算场景中首选系统，因效率高，易用以及通用性越来越得到大家的青睐，我自己最近半年在接触spark以及spark s

绝地灬酷狼/ 2022年04月16日 06:08/ 0 赞/ 201 阅读