《极客时间教程 - 大规模数据处理实战》笔记
00 丨开篇词丨从这里开始,带你走上硅谷一线系统架构师之路
01 丨为什么 MapReduce 会被硅谷一线公司淘汰?
高昂的维护成本
时间性能“达不到”用户的期待
02 | MapReduce 后谁主沉浮:怎样设计下一代数据处理技术?
03 | 大规模数据处理初体验:怎样实现大型电商热销榜?
不同量级 TOP K 算法的解决方案不同:
小规模:Hash 即可
大规模:由于单机的处理量不足以处理全量数据,势必分而治之:分片统计,然后聚合(即先 map 后 reduce)