用scrapy来进行网页抓取,对于pythoner来说它用起来非常方便,详细文档在这里:http://doc.scrapy.org/en/0.14/index.html 要想利用scrapy来抓取网页信息,需要先新建一个工程
基于HTML5的纯JS的,网页Galgame引擎 可以让你利用浏览器这个平台,制作出各种精美,而且跨平台的Galgame 项目主页: http://www.open-open.co
playfish是一个采用java技术,综合应用多个开源java组件实现的网页抓取工具,通过XML配置文件实现高度可定制性与可扩展性的网页抓取工具 应用开源jar包包括httpclient(内容读取)
annyang 是一个极小的 Javascript 库,允许网页的访问者使用声音命令来控制你的网页。annyang 支持多种语言,不需要依赖其他库,整个部件大小只有 2 kb !