开源项目,开源代码,开源文档,开源新闻,开源社区

爬虫关键步骤都围绕在于请求、获取数据、处理数据，当然还有应对一些反爬虫的策略，比如伪造headers，ip代理等等，下文就主要围绕nodejs我常用的模块和经验谈起请求和获取数据模块

AnyaUJVI 2016-10-31 13125 0

Node.js Node.js 开发

let urls = await api.get_index_urls(); for (let i = 0; i < urls.length; i++) { await helper.wait_seconds(1);

t554in32 2016-10-31 31134 0

TypeScript mongoose

3、Downloader（下载器）下载器的主要职责是抓取网页并将网页内容返还给蜘蛛( Spiders)。 4、Spiders（蜘蛛）蜘蛛是有Scrapy用户自己定义用来解析网页并抓取制定URL返回的内容的类，每个

jopen 2013-07-29 18131 0

Scrapy 网络爬虫

Another Simple Crawler 又一个网络爬虫，可以支持代理服务器的科学上网爬取。 1.数据存在mysql当中。 2.使用时，先修改web-inf/config.ini的数据链接相关信息，主要是数据库名和用户名和密码

yne7 2015-03-30 17739 0

网络爬虫 kamike.collect

Pholcus（幽灵蛛）是一款纯Go语言编写的重量级爬虫软件，清新的GUI界面，优雅的爬虫规则、可控的高并发、任意的批量任务、多种输出方式、大量Demo，支持横纵向两种抓取模式，支持模拟登录和任务取消等，并且考虑了支持分布式布局。

6d6d 2015-07-14 7054 0

Pholcus

P23

通过本文，读者可以了解 Heritrix 的相关特点以及在 Eclipse 中的配置运行，能够从零开始构建特定站点的专有爬虫，从而为网站增加全文检索服务。背景随着网站内容的增加，为其添加搜索功能是一个常见的需求，搜索引

sunhaiyang 2011-09-19 527 0

网络爬虫

filter:样式表滤镜; Alpha:透明滤镜, opacity:不透明度100(0~100); style:样式2(0~3), rules="none"不显示内框" 多媒体文件标识属性: SRC="

yzb_1314 2013-07-11 3915 0

前端技术

网页常用代码收藏（一） 1. 防止被欠入 2.永远都会带着框架

zhangxiangxiang 2012-11-24 2295 0

前端技术

OperaDriver 可让浏览器对web网页进行各种不同测试，包括链接点击、文本输入、表单提交等动作，并对测试的结果进行报告。项目主页： http://www.open-open.

openkk 2012-05-16 28852 0

测试工具 Web开发工具

PaintWeb 是一个 Web 应用程序，可以让你直接在浏览器上进行绘图

fmms 2012-02-08 41284 0

HTML5 图形/图像处理

URL(source).openStream(), "test.jpg"); mDrawable.setBounds(0, 0, mDrawable.getIntrinsicWidth(), mDrawable.getIntrinsicHeight());

jopen 2014-08-28 17176 0

TextView Android开发移动开发

这是一个网页解谜开发框架，可以通过此框架快速开发属于自己的网页解谜游戏。页面结构参考了 Arthur's Online Riddle 。目前用此框架开发过的网页解谜游戏有创软网页解谜。目前共有两种通关种类：a

jopen 2015-12-06 7542 0

puzzle 前端技术

如果你是一名网页设计师，相信你一定对 Sketch 这个软件不陌生了。作为一个交互设计师，UI设计乃一核心内容。以前常使用 Photoshop 进行 P 图，但总觉的其实在是比较冗余。于是转而运用 Sketch

jopen 2016-01-09 21975 0

HTML 前端技术

图形的基本概念和在 HTML5 中的使用。学习绘制、过滤器、渐变、文本和将 SVG XML 添加到网页。简介可缩放矢量图形 (SVG) 是基于矢量的图形家族的一部分。它们与基于光栅的图形不同，

cf4s45ddd 2016-01-24 23922 0

SVG 前端技术

image = robot.createScreenCapture(new Rectangle(0, 0, width,height)); BufferedImage bi = new BufferedImage(width

c6g3 2015-02-15 9359 1

Java

Android AsyncTask异步处理抓取网页 /** * * @author yanggang * @see http://blog.csdn.net/sunboy_2050 */ public

cwf8 2015-03-25 2666 0

Android

Printf("%v\n", err.Error()) return } items := doc.Find("a") dir := localDir if !strings.HasSuffix(url, "/")

fefet 2015-07-29 5759 0

Golang

用scrapy来进行网页抓取,对于pythoner来说它用起来非常方便,详细文档在这里:http://doc.scrapy.org/en/0.14/index.html 要想利用scrapy来抓取网页信息,需要先新建一个工程

jopen 2013-07-29 24394 0

网络爬虫 Scrapy

基于HTML5的纯JS的,网页Galgame引擎可以让你利用浏览器这个平台,制作出各种精美,而且跨平台的Galgame 项目主页： http://www.open-open.co

jopen 2013-05-26 29601 0

Reitsuki 游戏开发

playfish是一个采用java技术，综合应用多个开源java组件实现的网页抓取工具，通过XML配置文件实现高度可定制性与可扩展性的网页抓取工具应用开源jar包包括httpclient(内容读取)

jopen 2012-10-12 79279 0

Java 网络爬虫

php网页爬虫'A=0 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Android HTML5 Java HTML 测试工具移动开发游戏开发 Node.js SVG 前端技术 Web开发工具 TypeScript Golang Pholcus Scrapy Android开发 mongoose 图形/图像处理网络爬虫 Node.js 开发 Reitsuki TextView puzzle kamike.collect

nodejs 爬虫相关模块小整合经验

用TypeScript开发爬虫程序经验

爬虫Scrapy的架构介绍经验

Java网络爬虫：kamike.collect 经验

Pholcus 0.4.8 发布，Go 爬虫软件资讯

Heritrix Web爬虫配置使用文档

网页制作常用代码文档

网页常用代码收藏（一）文档

Web网页测试工具 OperaDriver 经验

在网页中进行画图 PaintWeb 经验

使用TextView显示网页中的图片经验

网页解谜框架：puzzle 经验

如何用 Sketch 进行网页设计经验

在网页中使用SVG技术经验

Java实现网页截屏代码段

Android AsyncTask异步处理抓取网页代码段

Golang网页下载示例代码段

用scrapy进行网页抓取经验

网页Galgame引擎：Reitsuki 经验

Java网页抓取工具 PlayFish 经验

php网页爬虫'A=0 的相关搜索

关键词

nodejs 爬虫相关模块小整合 经验

用TypeScript开发爬虫程序 经验

爬虫Scrapy的架构介绍 经验

Java网络爬虫：kamike.collect 经验

Pholcus 0.4.8 发布，Go 爬虫软件 资讯

Heritrix Web爬虫配置使用 文档

网页制作常用代码 文档

网页常用代码收藏（一） 文档

Web网页测试工具 OperaDriver 经验

在网页中进行画图 PaintWeb 经验

使用TextView显示网页中的图片 经验

网页解谜框架：puzzle 经验

如何用 Sketch 进行网页设计 经验

在网页中使用SVG技术 经验

Java实现网页截屏 代码段

Android AsyncTask异步处理抓取网页 代码段

Golang网页下载示例 代码段

用scrapy进行网页抓取 经验

网页Galgame引擎：Reitsuki 经验

Java网页抓取工具 PlayFish 经验

php网页爬虫'A=0 的相关搜索

关键词

nodejs 爬虫相关模块小整合经验

用TypeScript开发爬虫程序经验

爬虫Scrapy的架构介绍经验

Pholcus 0.4.8 发布，Go 爬虫软件资讯

Heritrix Web爬虫配置使用文档

网页制作常用代码文档

网页常用代码收藏（一）文档

使用TextView显示网页中的图片经验

如何用 Sketch 进行网页设计经验

在网页中使用SVG技术经验

Java实现网页截屏代码段

Android AsyncTask异步处理抓取网页代码段

Golang网页下载示例代码段

用scrapy进行网页抓取经验