Web-Harvest

Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作。

该项目主页:http://web-harvest.sourceforge.net

本页【Web爬虫】其它开源项目



 


Email:pe_mail2006 AT 163.com 闽ICP备05011699号 友情链接