开源项目,开源代码,开源文档,开源新闻,开源社区

Hypy 是一个为 Python 应用程序编写的全文搜索引擎，可以使用它从Python代码索引和搜索你的文档。代码示例： db = HDatabase() db.open('casket', 'w')

openkk 2011-12-30 44961 0

Python 搜索引擎

Fullproof 是一个 JavaScript 库，提供了在浏览器上的高质量的全文搜索引擎。该特性可让你的 Web 应用在离线模式下使用 HTML5 离线特性进行搜索。特征：支持布尔值和搜索排名

jopen 2013-02-24 13171 0

搜索引擎 JavaScript

//依赖模块 var fs = require('fs'); var request = require("request"); var cheerio = require("cheerio"); var mkdirp = require('mkdirp'); var http = require('http'); var urlparse = require('url').parse; //目标

fdpg 2015-04-03 2869 1

Node.js JavaScript

这段代码通过抓取百度词典的翻译结果达到翻译单词的目的这个小工具使用Python语言编写完成，其中使用到这些类库（urllib,BeautifulSoup ），前者主要负责网络通讯方面，后者

pycct 2015-06-09 2092 0

Python

这是一个简单的php加phpquery实现抓取京东商品分类页内容的简易爬虫。phpquery可以非常简单地帮助你抽取想要的html内容，phpquery和jquery非常类似，可以说是几乎一样；如果你

jopen 2015-06-21 7985 0

爬虫

<?php /** desc：采集网页中的邮箱的代码 */ $url='http://www.xxx.net'; //要采集的网址 $content=file_get_contents($url); //echo $content; function getEmail($str) { //$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_

jopen 2015-07-08 750 0

PHP

/** * 更新相册某个文件 */ public static void photoUpdates(Context context, File file) { if (!file.exists()) { return; } try { MediaStore.Images.Media.insertImage(context.getContentResolver(), file.getAbsolute

flkt9867 2016-01-25 5066 0

Android

。因此，整个生态系统中就需要一个可靠的、支持事务的、保持一致性的数据变更抓取系统。 Databus是一个实时的低延迟数据抓取系统。从2005年就已经开始开发，正式在LinkedIn投入生产系统，是在2011年。

jopen 2013-03-04 9670 0

CD音频抓取器设计用来从光盘中提取（“RIP”）原始数字音频（通常被称为 CDDA 格式）并把它保存成文件或以其他形式输出。这类软件使用户能把数字音频编码成各种格式，并可以从在线光盘数据库 freedb

jopen 2015-03-28 7458 0

抓取器

数字码，但是HTML+CSS的排版是规整的，就可以用正则等方法来把title和PDF都挖出来并且一一对应上。想到下一步是要用到网页分析、抓取、下载的技术的，所以，今天就把这个技术给拿下吧。由于python似乎是我知道的这方面的“利器”，

openkk 2012-08-28 363633 0

Python Python开发

javascript 动态页面目前许多网站大量运用js脚本进行一些页面的处理，这些页面的抓取对爬虫是个挑战。这类页面的抓取，我用到了下面的方法分析页面（firebug/chrome调试工具等），找到aj

zsz 2014-10-26 61651 0

动态页面抓取网络爬虫 Python Scrapy

本篇文章是使用python抓取数据的第一篇，使用request+BeautifulSoup的方法对页面进行抓取和数据提取。通过使用requests库对链家网二手房列表页进行抓取，通过BeautifulS

azkb6080 2016-12-03 26851 0

Python开发 beautifulsoup

这是一个C#实现的屏幕抓取程序，可以抓取整个屏幕保存为指定格式的图片，并且保存当前控制台缓存到文本 using System; using System.Collections.Generic; using

xf3f 2015-04-24 1549 0

C#

争取其他语言一些类似的软件还有： Lobo Browser （Java Browser） Rhino （Java Javascript Engine） Htmlunit 、 TestNG （Java Testing Framework）

openkk 2012-08-26 138603 0

Python Python开发

通常利用程序来模拟人浏览网页的过程，发送http请求，从http响应中获得结果。 Web Scraping 注意事项在抓取数据之前，要注意以下几点：阅读网站有关数据的条款和约束条件，搞清楚数据的拥有权和使用限制

jopen 2014-05-30 174263 0

Python 网络爬虫

通过这个项目，你可能可以学习到的内容有：多渠道打包使用 ORM 快速操作数据库访问网络，简单解析 HTML RecyclerView 瀑布流的使用 RecyclerView 底部加载更多的简

jopen 2015-07-05 11586 0

Android Android开发移动开发

Fetch组件对于AJAX类型页面基本是熟视无睹，因此基于Htmlunit组件实现Nutch Plugin形式提供AJAX类型页面抓取解析支持。项目主页： http://www.open-open.com/lib/vi

jopen 2013-09-23 34957 0

搜索引擎 Apache Nutch nutch

P5

我们在开发网络程序时，往往需要抓取非本地文件，一般情况下都是利用php模拟浏览器的访问，通过http请求访问url地址，然后得到html源代码或者xml数据，得到数据我们不能直接输出，往往需要对内

luodao 2013-11-02 3450 0

PHP开发 PHP

using System; using System.Data; using System.Configuration; using System.Net; using System.IO; using System.Text; using System.Collections.Generic; using System.Text.RegularExpressions; using System.

mb78 2015-05-02 2977 1

C#

有的网页必须登陆才能看到，这个时候想要抓取信息必须在header里面传递cookie值才能获取 1、首先登陆网站，打开firebug就能看到对应的cookie把这些cookie拷贝出来就能使用了

KelDandridg 2016-01-22 946 0

PHP

Python全文搜索引擎 Hypy 经验

JavaScript 全文搜索引擎：Fullproof 经验

Node.js批量抓取高清妹子图片增强版代码段

python在线抓取百度词典的翻译结果翻译单词代码段

php+phpquery简易爬虫抓取京东商品分类代码段

如何用php抓取网页中邮箱地址代码代码段

Android抓取屏幕展示内容（类似屏幕截图）代码段

LinkedIn 实时低延迟数据抓取系统 Databus 开源资讯

4 个图形界面的 CD 音频抓取器资讯

用Python做网页抓取与解析入门笔记经验

zg手册之 scrapy 开发（4）-- javascript 动态页面的抓取经验

使用python抓取并分析数据—链家网(requests+BeautifulSoup) 经验

C#将当前屏幕抓取下来保存为图片代码段

Python 用于网站抓取登录发布的模块介绍经验

使用Python抓取欧洲足球联赛数据进行大数据分析经验

Android学习项目：抓取了妹纸图的开源小应用经验

支持AJAX类型页面抓取的Nutch插件：nutch-htmlunit 经验

PHP中抓取页面的几种方法文档

C#通过正则表达式抓取网页信息的类代码段

php curl 添加cookie伪造登陆抓取数据代码段

java抓取搜索引擎的相关搜索

关键词

Python全文搜索引擎 Hypy 经验

JavaScript 全文搜索引擎：Fullproof 经验

Node.js批量抓取高清妹子图片 增强版 代码段

python在线抓取百度词典的翻译结果翻译单词 代码段

php+phpquery简易爬虫抓取京东商品分类 代码段

如何用php抓取网页中邮箱地址代码 代码段

Android抓取屏幕展示 内容（类似屏幕截图） 代码段

LinkedIn 实时低延迟数据抓取系统 Databus 开源 资讯

4 个图形界面的 CD 音频抓取器 资讯

用Python做网页抓取与解析入门笔记 经验

zg手册 之 scrapy 开发（4）-- javascript 动态页面的抓取 经验