服务器开发之图形验证码 经验

序。短时间是无法退出人类舞台的,目前只是尽量提升用户体验。 作用 账号安全 反作弊 反爬虫 防论坛灌水 防恶意注册 分类 图形验证码 Gif动画验证码 手机短信验证码

BrandyDunro 2016-10-18   11219   0

10款难看但好用的SEO工具 资讯

txt文件中的问题,并且还能发现不可见的错误。他们甚至还可以对文件中的隐藏代码作出解释,这些文件可以对搜索引擎爬虫产生影响。 难看之处: robots.txt文件是很枯燥,但这并不意味着你的界面也要这么粗糙。

码头工人 2011-09-07   15566   0
SEO  

9个基于Java的搜索引擎框架 经验

Nutch 是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 利用Nutch,你可以做到以下这些功能: 每个月取几十亿网页 为这些网页维护一个索引 对索引文件进行每秒上千次的搜索

jopen 2014-09-03   34907   0

通用的内容分析工具:Apache Tika 经验

Cutting。我个人也是觉得这件事情很赞,要搞Nutch这样一个通用的搜索引擎,包括了全文索引和Web爬虫两大块内容,在开发过程中逐渐诞生出一 些核心的周边产品,再孕育成子项目,包括hadoop,Luce

jopen 2014-05-20   18555   0

一个简单的Redis应用 经验

HashMap值方式(支持多种类型的value是redis的一大强顶),另外还加上了Last-Modified和Etag支持,期望爬虫们能聪明一点,会用这两个东西来进一步减少不必要的访问量。

jopen 2015-03-03   20249   0

PhantomJS实现最简单的模拟登陆方案 经验

以前写爬虫,遇到需要登录的页面,一般都是通过chrome的检查元素,查看登录需要的参数和加密方法,如果网站的加密非常复杂,例如登录qq的,就会很蛋疼 在后面,有了Pyv8,就可以把加密的js文件扔

jopen 2016-01-12   44375   0

快速提高Android开发效率的Web工具 经验

持续更新。 查找优秀的参考工程 codota是一个查找可供参考的Android工程的网站,它的爬虫已经采集了将近7百万个工程。比如我们想要写一段Android中检测网络可用性的代码,我们只需要在搜

jopen 2015-07-20   14286   0

记一次 Python 编码的坑 经验

0x07~0x09 中解释过的 Unicode - Bytes 不同,这次遇到的是另外一种情况。应用场景如下:爬虫抓取网页数据,通过 requests 模块将数据 POST 到服务器,但是要去除数据中的空白符(包括

ilikepanda 2016-05-07   16381   0

感知哈希算法型 -- 找出相似的图片 经验

} } 谷歌服务器里的图片数量是百亿级别的, 我电脑里的图片数量当然没法比, 但以前做过 爬虫程序 , 电脑里有40,000多人的头像照片, 就拿它们作为对比结果吧! 我计算出这些图片的"指纹"

jopen 2012-07-12   23369   0
算法  

C#实现的搜索引擎 - Iveely Search Engine 经验

Spider", "IveelySE.Spider\IveelySE.Spider.csproj", 这是网络爬虫,即数据搜集部分。 "IveelySE.IDFS", "IveelySE.IDFS\IveelySE

openkk 2012-08-05   65697   0

Apache Shiro 介绍 经验

Subject:主体,代表了当前“用户”,这个用户不一定是一个具体的人,与当前应用交互的任何东西都是Subject,如网络爬虫,机器人等。 SecurityManager:安全管理器,即所有与安全有关的操作都会与Secu

jopen 2014-06-12   28402   0

最好的15个Python开源框架 经验

量的第三方模块,它没有URL路由、没有模板也没有数据库的访问。 Scrapy :Python的爬虫框架 Scrapy是一个使用Python编写的,轻量级的,简单轻巧,并且使用起来非常的方便。

jopen 2015-01-05   35535   0
P12

  nutch1.4 Windows Eclipse配置和使用 文档

(2) 按照官方网站说明在工程目录下建立urls目录在目录下建立txt文件,文件名字随意填写一个网址作为爬虫的目标网址 在conf下配置nutch-site.xml文件 中加入 http.agent.name

w523399859 2013-08-30   3058   0
P6

  网络抓取 文档

1 模拟ajax提交 这几天开始做一些爬虫方面的东西,但是在解析页面是碰到了分页数据的爬取问题,如果分页是get方式的url还好,但是如果是Post方式的ajax提交那就感觉比较纠结 思路: 因为是

764877509 2013-12-19   4505   0

提速30%:FoxOne 使用 Electron browserview 实践 经验

块链技术应用方向。而现在,改变世界需要有你同行。 除了移动端工程师,我们也同时招聘前端工程师、爬虫工程师、Golang 研发工程师、社群产品运营。欢迎青睐 FoxOne 的优秀人才加入我们。 请留意我们的招聘邮箱为

AmyChildres 2018-04-10   38145   0

10 个非常有用的 AngularJS 框架 资讯

建和部署高效的应用程序。担心搜索引擎优化的困境? Radion配有精心打造的PhantomJS网络爬虫,能够SEO的麻烦事。 官方网站: http://radian.io/ 8.Supersonic

jopen 2015-11-27   93079   0

用大数据告诉你身边的IT故事 资讯

最近我们 Team 利用 Dream 分布式计算平台,做了这样一件事情,将 Github 的大量数据通过爬虫抓取下来,通过分析后,我们抽取最近一年中部分的开发者和项目信息,得到了如下有趣的信息,故分享之,数据原汁原味,无人工干涉。

jopen 2013-08-28   5402   0

金电联行(北京)信息技术有限公司招聘 问答

会信用管理提供全方位的技术服务。 技术基础过硬,善于沟通,有互联网金融平台经验优先;有网络爬虫经验优先。 工作职责: 1、负责相关系统方案调研工作; 2、负责相关系统的设计工作; 3、负责技术调研及技术难点的攻关工作;

yz0530 2015-03-23   9990   0

Firefox OS,在利基市场匍匐前进 资讯

手机,销量多为几千台,成不了气候。 不过这并不是意味着 Firefox 手机没有人要,Mozilla 也算是有些影响力的组织,在和 Mozilla 关系不错的运营商 Telefonica 的势力范围内,Firefox

jopen 2014-02-18   6651   0

8款替代Dreamweaver的开源网页开发工具 资讯

有自动提示功能,能够给出代码大纲,可用于 JavaScript 调试,有集成文档。 7. Mozilla SeaMonkey Mozilla SeaMonkey 内置了一个浏览器,Email 和新闻组客户端,能用来

jopen 2014-05-23   12548   0
1 2 3 4 5 6 7 8 9 10