Arale,一个 Java Web 爬虫

jopen 11年前

Arale能够下载整个网站或来自网站的某一特定资源。Arale还能够把动态页面渲染成静态页面。

特性:

  • 下载并扫描用户定义的文件类型。
  • 重命名动态资源。将查询参数编码进文件名
  • 设置并发连接数。
  • 最小和最大文件大小的选项。
  • 域的深度支持。

项目主页:http://www.open-open.com/lib/view/home/1349861066400