大数据系统——Apache Hadoop YARN: Yet Another Resource Negotiator论文分享
1.背景ApacheHadoop最开始设计是考虑运行大量MapReduce任务来处理网络爬虫数据,但是随着应用日益广泛,Hadoop成为了数据存放和计算的主要地方。日益广泛的使用范围超出了最初设计的考虑,暴露出了两个主要的缺点:(1)对于特定编程语言的紧耦合使得开发者滥用MapReduce编程模型;(2)集中处理作业控制流造成无休止的调度程序扩展问题。YARN的定位是下一代Hadoop的计算平台。