LinkedIn网站架构设计启示 经验

新闻主要来源是网络爬虫抓取:分布式爬虫、解析技术使用StAX和Rom 爬取到的数据经过解析清洗后进入News DB,再由Lucene构建索引,以供News Service检索 99%代码都是Java编写的 Li

jopen 2014-03-08   36373   0

Java 的 PDF 处理类库,Apache PDFBox 1.8.9 发布 资讯

主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成 填充PDF/XFDF表单数据 从文本文件创建PDF文档 从PDF页面创

jopen 2015-03-28   11217   0

Strata + Hadoop World大会2015 问答

Croll(具有网络性能、分析,云计算和业务战略背景的企业家、作家),Doug Cutting(Lucene、Nutch 、Hadoop等项目的发起人),Roger Magoulas(O'Reilly Media

活动家becky 2015-11-21   8393   0
ci   云计算   C/C++   Go   HTML  

介绍6个不同类型的开源协作管理系统 资讯

和部署在你所维护仓库中的每个Artifact。Nexus是一套“开箱即用”的系统不需要数据库,它使用文件系统加Lucene来组织数据。Nexus 使用ExtJS来开发界面,利用Restlet来提供完整的REST AP

jopen 2012-07-14   9663   0

Apache Nutch 1.10 发布,搜索引擎 资讯

。包括全文搜索和Web爬虫。 Nutch的创始人是 Doug Cutting ,他同时也是Lucene、Hadoop和Avro开源项目的创始人。 Nutch 诞生于2002年8月,是Apa

jopen 2015-05-09   13572   0

Review Board 2.5 发布,在线代码评审工具 资讯

人高兴的是它提 供了在diffs里进行语法彩色编码,使得代码阅读变得简便。此外,它还实现了基于Lucene的搜索来帮助管理较大的diffs组。 Review Board在审查补丁(Patch)方面

jopen 2015-11-01   6329   0

Android SwipeRefreshLayout 官方下拉刷新控件介绍 经验

REFRESH_COMPLETE: mDatas.addAll(Arrays.asList("Lucene", "Canvas", "Bitmap")); mAdapter.notifyDataSetChanged();

jopen 2016-01-16   23118   0

迅搜全文搜索引擎 XunSearch 经验

PHP 脚本语言,堪称最佳组合。 极低的开发难度,接口简单易用,而且文档规范、全面。 与 Lucene, Sphinx 之类相比较,Xunsearch 提供了更丰富而必需的功能,开发周期更短。

fmms 2012-01-01   78522   0
P29

  基于scala/akka构建响应式流计算 文档

未命中、实时抓取 10. 计算引擎Data-1Data-2Data-3cacheInput流计算数据源:Lucene、cache、RPC… Input: 流化管道 计算:一次Stream的聚合计算 11. DataFlow

ee37 2015-07-05   619   0

Redis应用实践 问答

唐福林是新浪微博开放平台资深工程师,目前负责t.cn短链、用户关系、计数器等底层服务。他曾负责过包括新浪邮箱全文搜索在内的多个基于 Lucene的垂直搜索引擎开发,以及新浪爱问和新浪播客的运维,对承载大数据量、高并发的互联网基础设施建设有丰富的经验。他在QCon杭州2011大

openkk 2011-11-05   22839   3
Redis   搜索引擎   C/C++   Go  

基于Java的Git在线管理工具:Gitblit 经验

notifications (via sendmail.groovy push script) Lucene indexing of specified repository branches Administrators

jopen 2013-06-15   46637   0

不再被墙后 一个全新GitHub到来 资讯

源代码。为了索引你的代码,并推到 GitHub 用户面前,在后台 GitHub 则使用了基于 Lucene 构建的 ElasticSearch 开源分布式搜索,这使得在搜索结果中你可以访问到公共和私人的资源库。

jopen 2013-01-24   4716   0
Github  
P235

  Liferay 管理员手册(中文) 文档

1、浏览器启动 125 5.3.1、控制面板 125 5.3.1、即时通讯 125 5.3.1、LUCENE 搜索 126 5.4、开源版本 129 5.4、值对象 130 5.4、通信链接 130 5

wang_yuan 2014-08-20   11352   0
P235

  Liferay使用手册 文档

1、浏览器启动 125 5.3.1、控制面板 125 5.3.1、即时通讯 125 5.3.1、LUCENE 搜索 126 5.4、开源版本 129 5.4、值对象 130 5.4、通信链接 130 5

abin888 2011-08-29   20629   0
P5

  十分钟掌握MapReduce的精髓 文档

如何的难。 注2:Lucene之父Doug Cutting的又一力作,Project Hadoop - 由Hadoop分布式文件系统和一个Map/Reduce的实现组成,Lucene/Nutch的成产线也够齐全的了。

wujianhai 2011-11-18   3799   0
P11

  BI开源工具调研报告 文档

数据挖掘组件:Weka   5、 Map引擎:Geo   6、 ETL:BIE   7、 搜索引擎:Lucene   8、 Dashboard:OpenLaszlo   9、 Portal Server:JBoss/

winstonw 2013-08-16   6303   0
P17

  maven介绍和使用指南 文档

由于分析功能基本上都是以项目站点报告的方式来展现,所以我们将以KMS Lucene项目为例简单讲解一下Maven项目站点的功能。 3.2.1 项目介绍 如果一个对项目不了解的人想快速了解KMS Lucene的功能和使用方法,Maven项目简介站点可让他快速了解项目的内容。

wuguohao 2016-05-12   496   0

使用 JavaScript 实现对 PDF 的全文索引 经验

规模安装的话,通常会使用功能更加强大的工具来进行处理。开源产品中主要是Solr/Lucene,Solr是围绕Lucene库封装的一个web应用。它们都是用Java编写的。 构造一个Javascri

jopen 2013-10-14   23485   0

含 Apache Spark 的 Lambda 架构 经验

他也是Apache Lucene这一被广泛使用的文本检索库的创造者. Hadoop的起源与Apache Nutch有关, Apache Nutch是一个开源的web搜索引擎 , 本身也是Lucene项目的一部分

wwang1969 2016-11-10   10257   0
P15

  通过HttpClient实现博客发布源代码 文档

33=82018;\toracle 34=82017;\tsqlite 35=82016;\tDB2 36=82014;lucene 37=82012;网络 38=82013;\thttpClient 39=82011;设计模式

xdh2000 2012-06-23   517   0
1 2 3 4 5 6 7 8 9 10