BIGDATA TUTORIAL
☕ BIGDATA TUTORIAL 是一个大数据教程。
☕ bigdata-tutorial 是一个大数据教程。
- 🔁 项目同步维护:Github (opens new window) | Gitee (opens new window)
- 📖 电子书阅读:Github Pages (opens new window) | Gitee Pages (opens new window)
说明:下面的内容清单中,凡是有 📚 标记的技术,都已整理成详细的教程。
# 📖 内容
# HDFS
HDFS 是一个分布式文件系统。
# HIVE
# HBASE
# ZooKeeper
ZooKeeper 是 Apache 的顶级项目。ZooKeeper 为分布式应用提供了高效且可靠的分布式协调服务,提供了诸如统一命名服务、配置管理和分布式锁等分布式的基础服务。在解决分布式数据一致性方面,ZooKeeper 并没有直接采用 Paxos 算法,而是采用了名为 ZAB 的一致性协议。
ZooKeeper 主要用来解决分布式集群中应用系统的一致性问题,它能提供基于类似于文件系统的目录节点树方式的数据存储。但是 ZooKeeper 并不是用来专门存储数据的,它的作用主要是用来维护和监控存储数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。
很多大名鼎鼎的框架都基于 ZooKeeper 来实现分布式高可用,如:Dubbo、Kafka 等。
# Kafka
Kafka 是一个分布式流处理平台,此外,它也被广泛应用于消息队列。
# Flink
# 其他
# 📚 资料
- 《Hadoop 权威指南(第四版)》 (opens new window)
- 《Spark 技术内幕 深入解析 Spark 内核架构设计与实现原理》 (opens new window)
- 《Spark.The.Definitive.Guide》 (opens new window)
- 《HBase 权威指南》 (opens new window)
- 《Hive 编程指南》 (opens new window)
- BigData-Notes (opens new window)
- ZooKeeper
- 官方
- 书籍
- 文章
- 分布式服务框架 ZooKeeper -- 管理分布式环境中的数据 (opens new window)
- ZooKeeper 的功能以及工作原理 (opens new window)
- ZooKeeper 简介及核心概念 (opens new window)
- 详解分布式协调服务 ZooKeeper (opens new window)
- 深入浅出 Zookeeper(一) Zookeeper 架构及 FastLeaderElection 机制 (opens new window)
- Introduction to Apache ZooKeeper (opens new window)
- Zookeeper 的优缺点 (opens new window)
- Kafka
- 官方
- 书籍
- 教程
- 文章
# 🚪 传送
◾ 🏠 BIGDATA-TUTORIAL 首页 (opens new window) ◾ 🎯 我的博客 (opens new window) ◾