Arachnid

Arachnid:是一个基于Java的web spider框架.它包含一个简单的HTML剖析器能够分析包含HTML内容的输入流.通过实现Arachnid的子类就能够开发一个简单的Web spiders并能够在Web站上的每个页面被解析之后增加几行代码调用。 Arachnid的下载包中包含两个spider应用程序例子用于演示如何使用该框架。

该项目主页:http://arachnid.sourceforge.net/

本页【Web爬虫】其它开源项目



 


Email:pe_mail2006 AT 163.com 闽ICP备05011699号 友情链接