检索爬虫框架:heyDr

jopen 11年前

检索爬虫框架:heyDr

heyDr是一款基于java的轻量级开源多线程垂直检索爬虫框架,遵循GNU GPL V3协议。

用户可以通过heyDr构建自己的垂直资源爬虫,用于搭建垂直搜索引擎前期的数据准备。

项目主页:http://www.open-open.com/lib/view/home/1367732433074