• 推荐课程/班级
  • 暂无推荐内容
0
分享
收藏

视频中老师和大家简述了Hadoop的发展史:
- 起源于Apache Nutch项目(一个网页爬取工具和搜索引擎系统,后来遇到大数据量的网页存储问题)
- 2003年,谷歌发表的一篇论文(描述的是“谷歌分布式文件系统”,简称GFS),给了Apache Nutch项目的开发者灵感
- 2004年,Nutch的开发者开始着手NDFS(Nutch的分布式文件系统)
- 2004年,谷歌又发表了一篇介绍MapReduce系统的论文
- 2005年,Nutch项目实现了一个MapReduce系统
- 2006年,开发人员将NDFS和MapReduce移出Nutch项目,形成一个子项目,命名Hadoop
- 2008年,Hadoop已成为Apache的顶级项目
- 2008年4月,Hadoop打破世界纪录,成为最快排序1TB数据的系统,排序时间为209秒
- 2009年,Hadoop把1TB数据的排序时间缩短到62秒,从此名声大噪
- 现在很多公司都在使用,如雅虎、last.fm、Facebook、纽约时报等

评论(0)
你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!