YARN
YARN 的目标是解决 MapReduce 的缺陷。
MapReduce 的缺陷(Hadoop 1.x)
- 身兼两职:计算框架 + 资源管理框架
- JobTracker
- 既做资源管理,又做任务调度
- 任务太重,开销过大
- 存在单点故障
- 资源描述模型过于简单,资源利用率较低
- 仅把 Task 数量看作资源,没有考虑 CPU 和内存
- 强制把资源分成 Map Task Slot 和 Reduce Task Slot
- 扩展性较差,集群规模上限 4K
- 源码难于理解,升级维护困难
...大约 4 分钟