开源项目,开源代码,开源文档,开源新闻,开源社区

0x01 常见的反爬虫这几天在爬一个网站，网站做了很多反爬虫工作，爬起来有些艰难，花了一些时间才绕过反爬虫。在这里把我写爬虫以来遇到的各种反爬虫策略和应对的方法总结一下。从功能上来讲，爬虫一般分为

saiboa 2016-01-22 15843 0

Ajax 网络爬虫

发送请求的过程打开 Chrome 浏览器的调试功能，选择 Network 菜单，观察到获取微博数据的的接口是 https://m.weibo.cn/api/container/getIndex

chauxiang 2017-08-29 42595 0

Python Python开发

sina_weibo_crawler 基于urlib2及beautifulSoup实现的微博爬虫系统。数据库采用mongodb，原始关系以txt文件存储，原始内容以csv形式存储，后期直接插入mongodb数据库

jopen 2015-07-29 42546 0

网络爬虫 beautifulsoup

这一段时间，一直在折腾Python爬虫。已有的文件记录显示，折腾爬虫大概个把月了吧。但是断断续续，一会儿鼓捣python、一会学习sql儿、一会调试OpenCV，结果什么都没学好。前几天，终于耐下心来

jopen 2015-11-17 87081 0

Python3 网络爬虫

心血来潮 , 想要了解一下爬虫的基本原理 , 本着目的驱动的原则 , 想要把某美剧下载网站上的聚集下载链接都爬下来 , 个人收藏 ; 第一次写, 不是什么教程,只是记录一下自己的思路和一些留着以后深入的点

jopen 2016-01-06 25917 0

网络爬虫

RowsExceededException; public class ExportData { /** *//** * 导出数据为XLS格式 * @param fileName 文件的名称，可以设为绝对路径，也可以设为相对路径

jopen 2014-01-13 57246 0

jxl Office文档处理

首先介绍几种java导出word方案 1、Jacob是Java-COM Bridge的缩写，它在Java与微软的COM组件之间构建一座桥梁。使用Jacob自带的DLL动态链接库，并通过JNI的方式

openkk 2012-08-15 110138 0

Office文档处理 FreeMarker

call(new Date) "[object Date]" 所以，从上面的内容就可以知道，下面的这段代码的结果会是调用到 toString 方法(因为 valueOf 方法的返回并不是原始的数据类型): > 1

JanWadswort 2017-01-06 11622 0

JavaScript开发 JavaScript

installed 3 [OK] 拉取镜像 root@eddy:~# docker pull -help Warning: '-help' is deprecated

落失柒染 2016-01-24 59470 0

Docker

Date()测试,并用通过date.getMonth(),和date.getDay()获取,不过后来发现这两个访求是jdk1.1版本的,现在已经不用了,而且结果也不正确. Calendar rightNow

jopen 2014-12-09 24252 0

Calendar Java开发

本文将介绍如何获取当前设备和应用基本信息！创建一个android应用（AndroidTest），所需权限如下（AndroidManifest.xml文件）：

jopen 2015-02-13 33855 0

Android Android开发移动开发

OS中通过Core Location框架进行定位操作。Core Location自身可以单独使用，和地图开发框架MapKit完全是独立的，但是往往地图开发要配合定位框架使用。在Core Locatio

jopen 2015-07-18 86775 0

IOS iOS开发移动开发

外卖订单爬虫：美团，饿了么，百度这个程序是用来抓取外卖平台（美团，饿了么，百度）的商户订单开发，并不是一个通用库，而是为这个特定场景进行开发的。适用场景：餐饮企业拥有多家外卖门店，订单量非常大，有对订单进行数据分析的需求。

AstridPolan 2017-03-13 54996 0

美团网饿了么百度外卖网络爬虫

那篇入门教程，下面我简单总结一下Scrapy爬虫过程： 1、在Item中定义自己要抓取的数据： movie_name就像是字典中的“键”，爬到的数据就像似字典中的“值”。在继承了BaseSpider的类中会用到：

jopen 2015-05-28 47485 0

Scrapy 网络爬虫

备份指定用户的全部饭否消息和相册照片，可选备份好友资料列表，备份数据格式为SQLite/Html/Markdown/Txt四种，推荐保存Html格式安装和使用 Windows 从百度云或Github下载，解压运行

jopen 2015-08-20 27018 0

工具

net/projects/phpexcelreader 获取最新版的源码。下载之后解压，主要用到excel文件夹里面的两个文件reader.php和oleread.inc。导入Xls处理流程：选

jopen 2015-04-22 40318 0

PHP PHP开发

Region(0,(short)0,1,(short)0)); 重点注意事项： 1.单元格CELL和ROW对象下标都是从0开始的。 2.单元格合并时Region(1,2,3,4)第1个值的行号必须

jopen 2014-12-04 365336 0

Office文档处理 POI

cqlkit 是一个CLI工具用于将Cassandra查询导出成CSV和JSON格式。 Here is a simple some examples. Export JSON for the system

jopen 2015-07-30 41786 0

CQLKIT NoSQL数据库

{ Toast.makeText(BusRouteSysActivity.this, "抱歉，未找到结果", Toast.LENGTH_LONG).show(); return; } String allStations

jopen 2012-05-22 41217 0

Android Android开发移动开发

scrape 是一个使用 Go 语言开发的简单高级Web 爬虫。示例代码： package main import ( "fmt" "net/http" "github.com/yhat/scrape"

jopen 2015-05-24 15210 0

scrape 网络爬虫

爬取百度地图搜索结果和坐标系导出的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

PHP Oracle 搜索引擎移动开发 Node.js JMeter NodeJS ElasticSearch PHP开发 Scrapy gevent Android开发 iOS开发安卓开发 Office文档处理 C/C++开发 Python开发性能测试和优化数据库服务器网络爬虫 Node.js 开发 Python2 Scrappy 网页爬虫 iOS convertView NLPPaperCrawler DynamicLib

常见的反爬虫和应对方法经验

用Python爬取微博数据生成词云图片经验

利用urllib2加beautifulsoup爬取新浪微博经验

使用Python3.5爬取豆瓣电影Top250 经验

用python爬取某美剧网站的下载链接(一) 经验

jxl导出Excel 经验

FreeMarker + xml 导出word 经验

JS的{} + {}与{} + []的结果是什么？经验

docker镜像的获取和推送经验

Java Calendar获取时间的月和日经验

Android获取设备和应用信息经验

iOS定位和位置信息获取经验

爬虫开源：抓取外卖平台（美团，饿了么，百度）的商户订单经验

Scrapy安装、爬虫入门教程、爬虫实例（豆瓣电影爬虫经验

Python开发的饭否数据备份和导出工具经验

使用PHP导入Excel和导出数据为Excel文件经验

poi操作excel（主要为合并单元格和导出excel）经验

将Cassandra查询导出成CSV和JSON格式的工具：CQLKIT 经验

Android百度地图-获取一条公交上的所有站点获取两站直接的线路经验

Web 爬虫：scrape 经验

爬取百度地图搜索结果和坐标系导出的相关搜索

关键词

常见的反爬虫和应对方法 经验

用Python爬取微博数据生成词云图片 经验

利用urllib2加beautifulsoup爬取新浪微博 经验

使用Python3.5爬取豆瓣电影Top250 经验

用python爬取某美剧网站的下载链接(一) 经验

jxl导出Excel 经验

FreeMarker + xml 导出word 经验

JS的{} + {}与{} + []的结果是什么？ 经验

docker镜像的获取和推送 经验

Java Calendar获取时间的月和日 经验

Android获取设备和应用信息 经验

iOS定位和位置信息获取 经验

爬虫开源：抓取外卖平台（美团，饿了么，百度）的商户订单 经验

Scrapy安装、爬虫入门教程、爬虫实例（豆瓣电影爬虫 经验

Python开发的饭否数据备份和导出工具 经验

使用PHP导入Excel和导出数据为Excel文件 经验

poi操作excel（主要为合并单元格和导出excel） 经验

将Cassandra查询导出成CSV和JSON格式的工具：CQLKIT 经验

Android百度地图-获取一条公交上的所有站点 获取两站直接的线路 经验

Web 爬虫：scrape 经验

爬取百度地图搜索结果和坐标系导出 的相关搜索

关键词

常见的反爬虫和应对方法经验

用Python爬取微博数据生成词云图片经验

利用urllib2加beautifulsoup爬取新浪微博经验

JS的{} + {}与{} + []的结果是什么？经验

docker镜像的获取和推送经验

Java Calendar获取时间的月和日经验

Android获取设备和应用信息经验

iOS定位和位置信息获取经验

爬虫开源：抓取外卖平台（美团，饿了么，百度）的商户订单经验

Scrapy安装、爬虫入门教程、爬虫实例（豆瓣电影爬虫经验

Python开发的饭否数据备份和导出工具经验

使用PHP导入Excel和导出数据为Excel文件经验

poi操作excel（主要为合并单元格和导出excel）经验

Android百度地图-获取一条公交上的所有站点获取两站直接的线路经验

爬取百度地图搜索结果和坐标系导出的相关搜索