各大公司大数据面试题

系统管理员 2021-12-16 07:43 482阅读 0赞

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zODIwMTkzNg_size_16_color_FFFFFF_t_70

大数据流处理技术各个的区别和联系
大数据批处理技术各个的区别和联系
Hive和HBase的存储区别
HDFS介绍、读写特性
Elasticsearch的介绍
ES和HDFS的区别
HDFS HA集群搭建过吗？是个什么架构？NN只有一个吗？SNN干嘛的？能接替NN吗？
如果让你设计一个分布式文件系统，需要考虑什么？你的设计有什么好处，有什么缺陷？
spark执行机制，RDD、DAG等
搜索引擎基本原理，倒排索引
spark内存模型，如何解决OOM问题？如何解决SOF问题？
HDFS DataNode死了怎么办，NameNode发生了什么变化？
大数据问题，10G的文件里面的数字排序
HA HDFS Zookeeper什么作用，为什么要Zookeeper？
Hadoop1.x和2.x之间的区别
HBase架构，为什么其随机查询很快？
ES如何调优？
ES查询机制？
分布式系统CAP理论，重点解释分区容错性的意义
HDFS读、写数据逻辑？
HDFS EditLog写入了，但是NameNode元信息没保存在内存中，数据不一致怎么办？
HDFS NN作用
Sqoop2的实现原理和架构？如果你用MapReduce程序实现数据迁移，Map任务怎么设计，
比如给你一张表要迁移
以wordcount为例，说明MR的执行机制
HBase整体架构
HBase和MySQL区别，取代的可能性，场景等
Hive和HBase区别，使用场景
HBase架构，ZooKeeper作用
HBase Region分裂，怎么分裂的，父Region是直接删掉了吗？
Spark RDD的理解
Spark map和flatMap区别
Spark在集群中怎么执行程序的？如果有聚合操作呢？
ES查询到很多数据（100万、200万），怎么返回？
数理统计与数值分析学过吗？写一下贝叶斯公式和大数定理？拿来做什么的？
hadoop有哪两大服务，hdfs有哪些数据结构（？DAG懂不懂
MapReduce出现数据倾斜怎么解决。给3种方法。
怎么对10亿个数字进行排序
Spark的Stage是怎么划分的，如何优化。宽窄依赖。
Spark的TaskScheduler是怎么分配task的，源码看过吗
Spark哪些部分可以优化
Hadoop生态体系，MapReduce工作流程
HDFS架构
HDFS的NameNode怎么知道它手下有多少DataNode的。容错机制。副本存放策略。
Yarn的架构

Yarn的Resource Manager, Node Manager,AppMaster等怎么工作的，

有任务来的时候的工作流程

出现数据倾斜怎么解决。
Spark的2种运行模式，standalone和cluster模式的区别，内部工作流程。
Spark生态体系.和优化
如何把多个Hadoop集群连接起来
RPC协议你懂对吧？你讲讲什么是RPC协议，怎么实现的？
hive、hadoop、kafka、hbase（hive问了很多基础知识；hadoop搭建方式：
单机、伪分布式、完全分布式、hadoop的三大组件

发表评论取消回复

表情：

评论列表（有 0 条评论，482人围观）

还没有评论，来说两句吧...

相关阅读

相关各大公司Java面试题超详细总结

> 以下Java面试题都是本人在面试的过程中收集的，本人抱着学习的态度找了下参考答案，有不足的地方还请指正，更多精彩内容可以关注我的微信公众号：Java团长 ThreadLo

╰半橙微兮°/ 2023年06月16日 02:21/ 0 赞/ 52 阅读

相关各大it公司面试题目

巨人网络java笔试基础题分享 http://www.coderarea.net/bbs/read.php?tid=834 百度笔试题 http://www.coderarea

超、凢脫俗/ 2022年06月10日 01:19/ 0 赞/ 280 阅读

相关各大公司Java后端开发面试题总结

本文属于转载。。。。。。 ThreadLocal(线程变量副本) Synchronized实现内存共享，ThreadLocal为每个线程维护一个本地变量。采用空间换

我就是我/ 2022年06月07日 04:55/ 0 赞/ 308 阅读

相关各大公司Java后端开发面试题总结

ThreadLocal(线程变量副本) Synchronized实现内存共享，ThreadLocal为每个线程维护一个本地变量。采用空间换时间，它用于线程间的数据隔离

一时失言乱红尘/ 2022年05月26日 09:08/ 0 赞/ 316 阅读

相关各大公司Java后端开发面试题总结

ThreadLocal(线程变量副本) Synchronized实现内存共享，ThreadLocal为每个线程维护一个本地变量。采用空间换时间，它用于线程间的数据隔离

╰半夏微凉°/ 2022年05月26日 08:55/ 0 赞/ 324 阅读

相关各大公司Java后端开发面试题总结

ThreadLocal(线程变量副本) Synchronized实现内存共享，ThreadLocal为每个线程维护一个本地变量。采用空间换时间，它用于线程间的数据隔离

朱雀/ 2022年05月26日 08:54/ 0 赞/ 325 阅读

相关各大公司Java面试题超详细总结

ThreadLocal(线程变量副本) Synchronized实现内存共享，ThreadLocal为每个线程维护一个本地变量。采用空间换时间，它用于线程间的数据隔离

ゞ浴缸里的玫瑰/ 2022年05月12日 01:40/ 0 赞/ 330 阅读

相关各大公司Java面试题超详细总结

[各大公司Java面试题超详细总结][Java] ThreadLocal(线程变量副本) Synchronized实现内存共享，ThreadLocal为每个线程维护一

秒速五厘米/ 2022年04月15日 02:51/ 0 赞/ 344 阅读

相关各大公司大数据面试题

![watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhp

系统管理员/ 2021年12月16日 07:43/ 0 赞/ 483 阅读

相关各大公司java面试资料

各大公司java面试资料，由[java攀登网][java]提供，该java的资料来源于网咯，仅限制于学习使用，具体的截图如下所示： ![format_png][]

客官°小女子只卖身不卖艺/ 2021年08月27日 18:59/ 0 赞/ 511 阅读