Nutch的发展历程

jopen 9年前

nutch   是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。是一个应用程序,可以以 Lucene 为基础实现搜索引擎应用。Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人

下面是Nutch的发展历程:

20028Doug Cutting发起,托管于Sourceforge,之后发布了0.40.50.6三个版本

2004年9月Oregon State University俄勒冈州立大学)采用Nutch

2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务

20051加入Apache的孵化器

2005年6月孵化结束成为Lucene的子项目

20058月发布版本0.7Apache Lucene sub-project

2005年10月发布版本0.7.1

2006年3月发布版本0.7.2

2006年7月发布版本0.8全新的架构,基于Hadoop0.4 Hadoop诞生

2006年9月发布版本0.8.1

2007年4月发布版本0.9

2009年3月发布版本1.0Tika诞生,0.1-incubating

2010年4月Nutch成为Apache顶级项目

2010年6月发布版本1.1

2010年9月发布版本1.2

2011年6月发布版本1.3从搜索引擎到网络爬虫

2011年11发布版本1.4

2012年6月发布版本1.5

2012年7月发布版本2.02.X  Gora诞生,table-based architecture

2012年7月发布版本1.5.1

2012年8月Nutch诞生十周年

201210月发布版本2.1 2.X开始支持elastic search 

2012年12发布版本1.6

2013年6月发布版本2.2crawler-commons 诞生

2013年6月发布版本1.7crawler-commons 诞生

2013年7发布版本2.2.1

2014年3月发布版本1.8

2014年8月发布版本1.9

2015年1月发布版本2.3

来自:http://my.oschina.net/apdplat/blog/397151