python-qrcode :Python 生成二维条形码 经验

python-qrcode 使用 Python Imaging Library (PIL) 来生成二维条形码。 示例代码: import qrcode qr = qrcode.QRCode( version=1

jopen 2012-07-24   45682   0

Python 2 到 3 代码自动转换器:python-modernize 经验

The python-modernize command works like 2to3 . Here's how you'd rewrite a single file: python-modernize

jopen 2014-10-30   19794   0
P8

  Python入门教程 超详细1小时学会Python 文档

Python入门教程 超详细1小时学会Python 本文适合有经验的程序员尽快进入Python世界.特别地,如果你掌握Java和Javascript,不用1小时你就可以用Python快速流畅地写有用的Python程序

linda8421 2012-06-10   7598   0

Python之父:为什么Python的索引从零开始? 资讯

刚开始学习Python语言的时候,并不是很理解为什么Python列表的索引值是从0开始的,不过却很喜欢列表切片的语法,非常简单、优雅。而最近在翻阅Python之父Guido老爹的Google+发文时,看到了他自己对这个问题的解释。

jopen 2016-01-17   18944   0
Python  

python-minidb 1.1 发布,采用SQLite3存储python对象 资讯

minidb 是一个Python模块,采用SQLite3数据库来存储和检索的Python对象。它利用Python的__slots__机制确定列名,使用类名与表名对应。数据总是以文本的形式存储在数据库中

jopen 2012-11-28   9205   0
Python  
P7

  如何用C#语言构造蜘蛛程序(网络爬虫实现) 文档

[转]如何用C#语言构造蜘蛛程序(网络爬虫实现)   "蜘蛛"(Spider)是Internet上一种很有用的程序,搜索引擎利用蜘蛛程序将Web页面收集到数据库,企业利用蜘蛛程序监视竞争对手的网站并

yyt1987 2011-10-28   621   0

爬虫入门到精通-headers的详细讲解(模拟登录知乎) 经验

本次我们实现如何模拟登陆知乎。

zhousiruo 2017-04-19   47598   0

爬虫开源:抓取外卖平台(美团,饿了么,百度)的商户订单 经验

外卖订单爬虫:美团,饿了么,百度 这个程序是用来抓取外卖平台(美团,饿了么,百度)的商户订单开发,并不是一个通用库,而是为这个 特定场景进行开发的。 适用场景:餐饮企业拥有多家外卖门店,订单量非常大,有对订单进行数据分析的需求。

AstridPolan 2017-03-13   54996   0

基于简单脚本的下一代开源爬虫框架 - Creeper 经验

About Creeper is a next-generation crawler which fetches web page by creeper script. As a cross-platform embedded crawler, you can use it for your news app, subscribe program, etc. Warning:At present

fjlvjie 2017-02-17   31504   0

PHP爬虫:百万级别知乎用户数据爬取与分析 经验

求,这类似于linux系统中一个进程开多条线程执行的功能。下面是使用curl_multi实现多线程爬虫的示例: $mh = curl_multi_init(); //返回一个新cURL批处理句柄 for

haifengwzf 2016-01-20   30330   0

搜狗输入法收集用户隐私信息,未屏蔽爬虫 资讯

搜狗移动输入法 被发现 将用户隐私数据如图片、视频、音频上传到云端,由于网站安全设计问题,它没有屏蔽搜索爬虫的索引,导致许多用户的私人消息泄露,安全研究人员从搜狗的 pinyin.cn 网站上发现了身份证、裸体照,甚至检举信。目前

jopen 2013-06-05   8877   0
搜狗  

程序员发现疑似苹果官方网络爬虫活动踪迹 资讯

源自苹果公司的网络爬虫踪迹显现,一位名为 Jan Moesen 软件工程师近日公布了他的发现,称他发现了用 Go 语言编译的苹果网络爬虫的抓取网页数据的活动证据。可以追溯至 10 月 15 日他发现来

jopen 2014-11-07   6216   0

养一只Node.js爬虫溜达中国证券网 经验

爬虫的世界如同武林,派别繁多,其中Python 一派简单易学,深受各位小伙伴的喜爱。现在做大数据(呵呵),不写几个爬虫都不好意思了,甚至数据分析R语言也被大牛们插上翅膀,开始在Web上溜达,寻觅着数据分析的原料。

FVIPrecious 2017-02-09   12659   0

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎 经验

网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,

jopen 2014-09-01   86773   0

一个敏捷的,分布式的Java爬虫框架:SeimiCrawler 经验

最好用最实用的爬虫框架。 简介 SeimiCrawler是一个敏捷的,支持分布式的爬虫开发框架,希望能在最大程度上降低新手开发一个可用性高且性能不差的爬虫系统的门槛,以及提升开发爬虫系统的开发效率

jopen 2015-11-10   57705   0

php判断来访者是否是搜索引擎的爬虫 代码段

Google 爬虫 'Baiduspider', // 百度爬虫 'Yahoo! Slurp', // 雅虎爬虫 'YodaoBot', // 有道爬虫 'msnbot' // Bing爬虫 // 更多爬虫关键字

phpw34 2015-04-21   2911   0
PHP  

SeimiCrawler一个敏捷强大的Java爬虫框架 — SeimiCrawler 0.2.6 文档 经验

SeimiCrawler一个敏捷强大的Java爬虫框架 ¶ An agile,powerful,standalone,distributed crawler framework. SeimiC

jopen 2016-01-14   39785   0

使用爬虫技术实现 Web 页面资源可用性检测 经验

显然,要确保网站中的所有链接都具有可访问性,通过人工进行检测肯定是不现实的,常用的做法是使用爬虫技术定期对网站进行资源爬取,及时发现访问异常的链接。 对于网络爬虫,当前市面上已经存在大量的开源项目和技术讨论的文章。不过,感觉大

B6m4g7p55 2018-05-27   38275   0
P

python中文手册v2.4 文档

python是一种容易学习的强大语言。它包括了高效的高级数据结构,提供了一个简单但很有效的方式进行面向对象编程。Python 优雅的语法,动态类型,以及它天然的解释能力,使其成为了大多数平台上应用于各领域理想的脚本语言以及开发环境。 <br> 这个手册介绍了一些 Python 语言及其系统的基本知识与概念。这有助于读者对 Python 有一个基本的认识,当然所有的例子都已包括在文中,所以这本手册很适合离线阅读。

seekmas 2013-04-05   3140   0

python写的翻译脚本 代码段

# -*- coding:utf-8 -*- #!/usr/bin/env python import re import urllib import urllib2 import sys class

ccpp 2015-01-04   1705   0
Python  
1 2 3 4 5 6 7 8 9 10