node-digger - 实现简单的node爬虫工具

jopen 8年前

node爬虫

实现简单的node爬虫工具

执行

终端下执行:

node demo-1.js

原理

  1. 模拟浏览器访问
  2. 截取指定内容
  3. 按规则写入本地

所需技能

  • 基本逻辑分析
  • Javascript & 基本正则
  • Node.js (Buffer, fs, path, URL, http[s])

目录

  • demo-1 抓取首页文件
  • demo-2 抓取整站
  • demo-3 指定内容抓取(开发中)

项目地址: https://github.com/zhuowenli/node-digger