0推荐
1K 浏览

Solandra

Solandra是一个实时分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建。其核心,Solandra是Solr与Cassandra的一个紧密集成。这意味着...
0推荐
1K 浏览

Zoie

Zoie是一个构建在Apache Lucene之上的实时搜索和索引系统。其需要逻辑上独立的索引和搜索子系统相对紧密的结合在一起,从而使得一篇文档一经索引,就能够立刻被搜索的到。 ZoieSyst...
0推荐
875 浏览

Katta分布式Lucene

Katta是一个可扩展的、高容错性、准实时的分布式搜索引擎。 具有索引复制的功能,会对索引进行分片处理,让索引分散到多个节点上,执行分布式检索。 它能很好的运行在由许多廉价服务器组成的大型集群之...
0推荐
936 浏览

代码搜索引擎 i.So.Code

北京大学Asseters小组开发的新一代代码搜索引擎。 目前iSoCode可以检索大约200个优秀(是真的优秀的~)的开源项目,包括jdk、Lucene、log4j、jdom、commons- ...
0推荐
792 浏览

起点R3企业级搜索引擎

起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下的数据访问控制(ACL),能够通过定义用户数据访问权限来控制检索数据的安全。 R3是一个强大的,高性能的JAVA企业级搜索引...
0推荐
962 浏览

DocSearcher

DocSearcher是一个文档全文搜索工具,采用 Lucene , POI Apache APIs 以及 PDF Box API 等Java开源项目开发。能够搜索 HTML、 MS Word、...
0推荐
681 浏览

Constellio

Constellio是一个开源的企业搜索引擎基于Apache Solr实现,并用到了Google Search Appliances connectors架构。利用Constellio只要单击一...
0推荐
735 浏览

HSearch

HSearch是一个基于Hadoop和HBase开发的开源NoSQL搜索引擎。HSearch提供的特性包括: * 多种文档格式支持 * 记录和文档级搜索访问控制 * 持续索引更新 * 使用多台机...
0推荐
877 浏览

Bobo

bobo-browse是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。 比如说搜索电脑,可以得到cpu是intel的有几条命中记录,cpu是amd的有几...
0推荐
934 浏览

ElasticSearch

ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数...
0推荐
748 浏览

Nut

只为lucene提供分布式搜索框架。理论上可对千G以上索引文件支持数千万级的用户搜索访问。Nut由Client、Server、Cache和DB四部分构成。Client处理用户请求和对搜索结果排序...
0推荐
1K 浏览

Open Search Server

Open Search Server是一个稳定、高性能的搜索引擎和一个全文搜索算法套件。可以用10种语言对文档进行索引。多语言分析器将句子切成词,然后基于文档的语言将lemmatisation算...
0推荐
594 浏览

Mustru

Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查...
0推荐
955 浏览

中文分词器 IKAnalyzer

IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应...
0推荐
590 浏览

Hounder

Hounder是一个完善的搜索系统,Hounder只会检索那些出现在互联网上的文档,并通过一个简单的网页来展示搜索结果。能够完美与其它项目相结合。它在各方面的设计都是规模级的包括:索引网页的数量...
0推荐
2K 浏览

Regain

Regain是一个基于Jakarta Lucene封装的搜索引擎。它能够索引和查询多种格式的文件(当前支持的格式包括:HTML、XML、Excel、Powerpoint、Word、PDF和RTF...
0推荐
855 浏览

Carrot2

Carrot2是一个开源搜索结果分类引擎。它能够自动把搜索结果组织成一些专题分类。Carrot2提供的一个架构能够从各种搜索引擎(YahooAPI、GoogleAPI、MSN Search AP...
0推荐
1K 浏览

Lucene中文分词“庖丁解牛” Paoding Analysis

Paoding's Knives中文分词具有极高效率和高扩展性。引入隐喻,采用完全的面向对象设计,构思先进。高效率:在PIII 1G内存个人机器上,1秒可准确分词100万汉字。采用基于不限制个数...
0推荐
2K 浏览

Apache Solr

Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特...
0推荐
8K 浏览

Aperture

Aperture这个Java框架能够从各种各样的资料系统(如:文件系统、Web站点、IMAP和Outlook邮箱)或存在这些系统中的文件(如:文档、图片)爬取和搜索其中的全文本内容与元数据。它当...
1 2
推荐项目

热门问答

热门文档