用Hadoop 进行分布式并行编程(一) 博客

Hadoop 一脉相承的另外两个开源项目 Nutch 和 Lucene ( 三者的创始人都是 Doug Cutting ),那绝对是大名鼎鼎。Lucene 是一个用 Java 开发的开源高性能全文检索工具包

Hadoopp 2012-09-28   1472   0

Postgres 的全文搜索已经足够好了 经验

。 搜索是项非常重要的功能,所以像 elasticsearch 和 SOLR 这样的基于 lucene 的工具变得很流行。它们都很棒。但使用这些大规模“杀伤性”的搜索武器前,你可能需要来点轻量级的,但又

jopen 2014-10-14   22324   0

Hadoop和大数据:60款顶级大数据开源工具 资讯

com/download/docs/ecl-language-reference 八、大数据搜索 54. Lucene 基于Java的Lucene可以非常迅速地执行全文搜索。据官方网站声称,它在现代硬件上每小时能够检索超过1

jopen 2015-10-23   46305   0
Hadoop  

60款与Hadoop和大数据相关的顶级开源工具 资讯

l-language-reference 八、大数据搜索 54. Lucene 基于 Java 的 Lucene 可以非常迅速地执行全文搜索。据官方网站声称,它在现代硬件上每小时能够检索超过

jopen 2015-08-10   60740   0
Hadoop  
P9

  Dom4j使用简介 文档

bookElement.addElement("title"); titleElement.setText("Lucene Studing"); bookElement = booksElement.addElement("book");

allen 2010-12-03   560   0
Dom4j   XML解析   DOM  
P6

  中文分词技术 文档

为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。 Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(包括向前、向后、

autorun365 2011-11-09   3661   0

Github上关于大数据的开源项目、论文等合集 资讯

framework Apache Lucene - Search engine library. Apache Solr - Search platform for Apache Lucene. ElasticSearch

jopen 2014-08-20   57775   0
Github  

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位 资讯

Harmony, Roller, stdcxx, Synapse, and Xerces; Apache Lucene graduates as a Top Level Project. ApacheCon returns

jopen 2014-11-24   28520   0
Apache  
P23

  分布式运算平台-Hadoop-基础篇 文档

以读完所有的数据。 4. 2:Hadoop的由来谈到Hadoop就不得不提到Lucene和Nutch。 首先,Lucene并不是一个应用程序,而是提供了一个纯Java的高性能全文索引引擎工具包, 它可

zhpboy 2013-10-12   3298   0

Struts2+Hibernate3.2+Spring2.5+Compass整合 博客

compass-index-patch.jar lucene-analyzers-2.4.0.jar lucene-core-2.4.0.jar lucene-highlighter-2.4.0.jar 

openkk 2010-10-10   177   0
FreeBSD  

大数据相关资源集合:Awesome Big Data 经验

framework Apache Lucene - Search engine library. Apache Solr - Search platform for Apache Lucene. ElasticSearch

jopen 2014-10-11   79484   0

电商搜索引擎的架构设计和性能优化 经验

电商可能更喜欢用一个开源的搜索引擎。所以总的来说,主要包括以下这几种方式: 第一种是「Lucene+自己封装」,只用来做检索,然后封装,后面所有的 ES,这两个是完整的解决方案,而且包括索引所

jopen 2015-11-21   27022   0

eBay的Elasticsearch性能调优实践 经验

Elasticsearch是一个基于Apache Lucene的开源搜索和分析引擎,允许用户近实时地存储、搜索和分析数据。Pronto是eBay托管Elasticsearch集群的平台,使eBay内部

tiiy5465 2018-02-06   49153   0

Solr入门和实践以及我对Solr的8点理解 经验

概述 Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言, 同时实现了可配置、可扩展并对查询性能进行

jopen 2016-01-08   33208   0
P9

  elasticsearch集群及应用 文档

e2协议),分布式的,RESTful的,构建在Apache Lucene之上的的搜索引擎. ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中

jombowang1 2017-02-13   1173   0

Java开源文档管理系统,LogicalDOC 发布 6.8.2 版本 资讯

Web的文档管理系统,易于使用和学习。它的架构充分利用同类最佳Java技术,实现了强大而灵活的解决方案。它为用户提供了基于Lucene的强大搜索 引擎,Web服务接口(通过CXF的JAX-WS)兼容NET和PHP版本,文档加版本控制,为文档添加注释,一个

jopen 2014-02-25   19624   0

Java开源文档管理系统,LogicalDOC 6.6 发布 资讯

Web的文档管理系统,易于使用和学习。它的架构充分利用同类最佳Java技术,实现了强大而灵活的解决方案。它为用户提供了基于Lucene的强大搜索 引擎,Web服务接口(通过CXF的JAX-WS)兼容NET和PHP版本,文档加版本控制,为文档添加注释,一个

jopen 2012-11-29   18978   0

jsearch v1.0 发布,基于java8的高性能全文检索工具包 资讯

jsearch 是一个高性能的全文检索工具包,基于倒排索引,基于java8,类似于lucene,但更轻量级。 jsearch 起源于 superword 项目。在superword项目的辅助阅读模

jopen 2015-11-25   6492   0
jsearch  

Java桌面搜索工具 Mustru 经验

Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。Mustru提供的功能包括:

fmms 2012-01-01   14065   0

ElasticSearch 集群统计:Bigdesk 经验

情况,索引数据、搜索情况,http连接数等。 Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快

jopen 2014-03-24   32512   0
1 2 3 4 5 6 7 8 9 10