为什么需要分布式,什么是分布式,hadoop简介

 Unix出现的时候,我们觉得计算机太快了,于是使用了多用户多终端很多人很多任务来分享一台计算机。后来,数据越来越多,芯片的速度也越来越快,但后者的增长速度总是赶不上前者的需求速度,再说,CUP的时钟频率是有上限的,OK,多核、多CPU、巨型机。在看看数据,从K、M到G、T、甚至P级别。像百度收录网页数量超过10亿,如果用一台PC来爬行(只是爬行,不算处理索引)需要300年,如果用现在最快的巨型机来需要多少时间我就没有算过了,但是如果用2W台PC喃?古代人们用一头牛拉东西,当有一天东西更大,一头牛拉不动的时候,人们不是想办法把牛养的更大,而是多用几头牛。.......未完待续(感冒咳嗽厉害啊...悲催...)

你可能感兴趣的:(hadoop,unix,任务,百度,终端,hadoop)