基于Scrapy的Pixiv热榜爬虫:pixiv_crawl

f2xc 8年前

基于Scrapy 的 PIXIV爬虫,功能简单(简陋),实现了简单的页面信息抽取,JSON API信息抽取,IMAGE存储等功能。基于Scrapy的配置文件进行灵活配置(包含某些福利选项),并通过Cookie Middleware实现模拟登录等功能。

用户配置信息:

  • IMAGES_STORE 配置图片存储的地址
  • PIXIV_USER_NAME 配置你的PIXIV用户名
  • PIXIV_USER_PASS 配置你的PIXIV密码
  • START_DATE 抓取的时间
  • SELECT_MODE_IDX 热榜模式选择

项目主页:http://www.open-open.com/lib/view/home/1443670623283