常见的反应对方法 经验

0x01 常见的反虫 这几天在一个网站,网站做了很多反虫工作,起来有些艰难,花了一些时间才绕过反虫。在这里把我写虫以来遇到的各种反虫策略应对的方法总结一下。 从功能上来讲,虫一般分为

saiboa 2016-01-22   15843   0

用Python微博数据生成词云图片 经验

发送请求的过程 打开 Chrome 浏览器的调试功能,选择 Network 菜单,观察到获微博数据的的接口是 https://m.weibo.cn/api/container/getIndex

chauxiang 2017-08-29   42595   0

利用urllib2加beautifulsoup新浪微博 经验

sina_weibo_crawler 基于urlib2及beautifulSoup实现的微博虫系统。 数据库采用mongodb,原始关系以txt文件存储,原始内容以csv形式存储,后期直接插入mongodb数据库

jopen 2015-07-29   42546   0

使用Python3.5豆瓣电影Top250 经验

这一段时间,一直在折腾Python虫。已有的文件记录显示,折腾虫大概个把月了吧。但是断断续续,一会儿鼓捣python、一会学习sql儿、一会 调试OpenCV,结果什么都没学好。前几天,终于耐下心来

jopen 2015-11-17   87081   0

用python某美剧网站的下载链接(一) 经验

心血来潮 , 想要了解一下虫的基本原理 , 本着目的驱动的原则 , 想要把某美剧下载网站上的聚集下载链接都下来 , 个人收藏 ;  第一次写, 不是什么教程,只是记录一下自己的思路一些留着以后深入的点

jopen 2016-01-06   25917   0

jxl导出Excel 经验

RowsExceededException; public class ExportData { /** *//** * 导出数据为XLS格式 * @param fileName 文件的名称,可以设为绝对路径,也可以设为相对路径

jopen 2014-01-13   57246   0

FreeMarker + xml 导出word 经验

首先介绍几种java导出word方案 1、Jacob是Java-COM Bridge的缩写,它在Java与微软的COM组件之间构建一座桥梁。使用Jacob自带的DLL动态链接库,并通过JNI的方式

openkk 2012-08-15   110138   0

JS的{} + {}与{} + []的结果是什么? 经验

call(new Date) "[object Date]" 所以,从上面的内容就可以知道,下面的这段代码的结果会是调用到 toString 方法(因为 valueOf 方法的返回并不是原始的数据类型): > 1

JanWadswort 2017-01-06   11622   0

docker镜像的获推送 经验

 installed            3                    [OK] 拉镜像 root@eddy:~# docker pull -help Warning: '-help' is deprecated

落失柒染 2016-01-24   59470   0
Docker  

Java Calendar获时间的月 经验

Date()测试,并用通过date.getMonth(),date.getDay()获,不过后来发现这两个访求是jdk1.1版本的,现在已经不用了,而且结果也不正确. Calendar rightNow

jopen 2014-12-09   24252   0

Android获设备应用信息 经验

本文将介绍如何获当前设备应用基本信息! 创建一个android应用(AndroidTest),所需权限如下(AndroidManifest.xml文件):

jopen 2015-02-13   33855   0

iOS定位位置信息获 经验

OS中通过Core Location框架进行定位操作。Core Location自身可以单独使用,地图开发框架MapKit完全是独立的,但是往往地图开发要配合定位框架使用。在Core Locatio

jopen 2015-07-18   86775   0

虫开源:抓取外卖平台(美团,饿了么,百度)的商户订单 经验

外卖订单虫:美团,饿了么,百度 这个程序是用来抓取外卖平台(美团,饿了么,百度)的商户订单开发,并不是一个通用库,而是为这个 特定场景进行开发的。 适用场景:餐饮企业拥有多家外卖门店,订单量非常大,有对订单进行数据分析的需求。

AstridPolan 2017-03-13   54996   0

Scrapy安装、虫入门教程、虫实例(豆瓣电影 经验

那篇入门教程,下面我简单总结一下Scrapy虫过程: 1、在Item中定义自己要抓取的数据 : movie_name就像是字典中的“键”,到的数据就像似字典中的“值”。 在继承了BaseSpider的类中会用到:

jopen 2015-05-28   47485   0

Python开发的饭否数据备份导出工具 经验

备份指定用户的全部饭否消息相册照片,可选备份好友资料列表,备份数据格式为SQLite/Html/Markdown/Txt四种,推荐保存Html格式 安装使用 Windows 从 百度云 或Github下载,解压运行

jopen 2015-08-20   27018   0
工具  

使用PHP导入Excel导出数据为Excel文件 经验

net/projects/phpexcelreader 获最新版的源码。下载之后解压,主要用到excel文件夹里面的两个文件reader.phpoleread.inc。 导入Xls处理流程:选

jopen 2015-04-22   40318   0
PHP   PHP开发  

poi操作excel(主要为合并单元格导出excel) 经验

Region(0,(short)0,1,(short)0)); 重点注意事项: 1.单元格CELLROW对象下标都是从0开始的。 2.单元格合并时Region(1,2,3,4)第1个值的行号必须

jopen 2014-12-04   365336   0

将Cassandra查询导出成CSVJSON格式的工具:CQLKIT 经验

cqlkit 是一个CLI工具用于将Cassandra查询导出成CSVJSON格式。 Here is a simple some examples. Export JSON for the system

jopen 2015-07-30   41786   0

Android百度地图-获一条公交上的所有站点 获两站直接的线路 经验

{ Toast.makeText(BusRouteSysActivity.this, "抱歉,未找到结果", Toast.LENGTH_LONG).show(); return; } String allStations

jopen 2012-05-22   41217   0

Web 虫:scrape 经验

scrape 是一个使用 Go 语言开发的简单高级Web 虫。 示例代码: package main import ( "fmt" "net/http" "github.com/yhat/scrape"

jopen 2015-05-24   15210   0
1 2 3 4 5 6 7 8 9 10