大数据技术整理
目录
一. Hadoop
Hadoop
Yarn
MapReduce
Hdfs
CDH|Cloudera Manager
二. 数据分析
Hive
Impala
三. 离线和实时数据处理
Flink
Spark
Storm
Kafka
四. OLAP分析平台
Kylin
五. 日志数据采集工具
Flume
ELK(Elasticsearch、Logstash、Kibana)
六. ETL工具
Sqoop
七. Nosql数据库
Hbase
Redis
Mongo
Cassandra
InfluxDB
OpenTSDB
八. 调度平台
Azkaban
九. RDBMS数据库
Mysql
一. Hadoop
Hadoop
Yarn
MapReduce
Hdfs
CDH|Cloudera Manager
二. 数据分析
Hive
hive数据倾斜优化策略
Hive的性能优化以及数据倾斜
Impala
三. 离线和实时数据处理
Flink
flink流处理访问mysql
Flink自定义DataSource之MysqlSource
批处理和流处理
Spark
批处理和流处理
Storm
批处理和流处理
Kafka
Kafka实践
四. OLAP分析平台
Kylin
大数据分析界的“神兽”Apache Kylin有多牛?
五. 日志数据采集工具
Flume
Flume学习之路系列
ELK(Elasticsearch、Logstash、Kibana)
六. ETL工具
Sqoop
七. Nosql数据库
Hbase
Hbase的应用场景、原理及架构分析
Hbase原理、基本概念、基本架构
HBase的RowKey设计
HBase学习之六: hbase的预分区设计
Rowkey设计
HBase RowKey散列和预分区
hbase建表时region预分区的方法
Hbase实践
Hbase实践之结合Spring
还没有评论,来说两句吧...