Java Web爬虫 - ItSucks

jopen 11年前

stormy.png
ItSucks是一个Java Web爬虫开源项目。可灵活定制,支持通过下载模板和正则表达式来定义下载规则。提供一个控制台和Swing GUI操作界面。

功能特性:
  • 多线程
  • 正则表达式
  • 保存/载入的下载工作
  • 在线帮助
  • HTTP/HTTPS 支持
  • HTTP 代理 支持
  •  HTTP身份验证
  • Cookie 支持
  • 可配置的User Agent
  •  连接限制
  • 配置HTTP响应代码的行为
  • 带宽限制
  • Gzip压缩

Java Web爬虫 - ItSucks

Java Web爬虫 - ItSucks

项目主页:http://www.open-open.com/lib/view/home/1350028633541

</div>