Apache Mahout 开源项目

Mahout项目Apache Lucene开源搜索引擎的一个子项目。在其中实现一些常见的用于集群、分类和CP的机器学习算法。

码头工人 2019-01-17   793   0

Java桌面搜索 JDesktopSearch 经验

JDesktopSearch是一个基于Apache Lucene实现的桌面搜索引擎。它能够索引HTML、XML、OpenOffice、MS Word和PDF文档。其它类型的文件只索引文件名。

fmms 2012-01-03   14376   0

OpenKM 开源项目

等来搜索文档。基于Jboss+J2EE+Ajax web (GWT)+Jackrabbit (lucene)等技术开发。

码头工人 2019-01-17   7107   0

DocSearcher 开源项目

DocSearcher是一个文档全文搜索工具,采用 Lucene , POI Apache APIs 以及 PDF Box API 等Java开源项目开发。能够搜索 HTML、 MS Word、 MS

码头工人 2019-01-17   962   0

高性能的全文检索工具包:jsearch 经验

jsearch是一个高性能的全文检索工具包,基于倒排索引,基于java8,类似于lucene,但更轻量级。 项目主页: http://www.open-open.com/lib/view/home/1431910036521

bcf2 2015-05-18   9647   0

删除重复数据的工具 Duke 经验

Duke 是一个快速灵活的去除重复数据的引擎,基于 Lucene 开发,普通笔记本电脑可以在 11 分钟内处理完 100 万条记录。 下图是 Duke 的架构: 项目主页: http://www

fmms 2012-01-13   13580   0
Lucene   Java  

Common Lisp 中的全文搜索引擎:Montezuma 经验

Lisp开发。 Montezuma 移植自 Ruby 语言的 Ferret 。而 Ferret 是 Lucene 的 Ruby 移植版本。但Montezuma的性能将优于Ferret和Lucen。

jopen 2012-09-04   17590   0

Regain 开源项目

Regain是一个基于Jakarta Lucene封装的搜索引擎。它能够索引和查询多种格式的文件(当前支持的格式包括:HTML、XML、Excel、Powerpoint、Word、PDF和RTF)。此

码头工人 2019-01-17   2042   0

ElasticSearch 开源项目

ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

码头工人 2019-01-17   934   0

LARM 开源项目

LARM能够为Jakarta Lucene搜索引擎框架的用户提供一个纯Java的搜索解决方案。它包含能够为文件,数据库表格建立索引的方法和为Web站点建索引的爬虫。

码头工人 2019-01-17   9988   0

分布式搜索引擎 Elastic Search 经验

ElasticSearch是一个基于 Lucene 构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

fmms 2012-01-01   21586   0

LogicalDOC 开源项目

LogicalDOC是一个基于Web的文档管理系统。提供的功能包括:文件/文件夹组织管理,全文索引和搜索(Lucene),版本修订管理,通过标签Tag浏览文档,搜索相似文档,通过Email发送文档等。

码头工人 2019-01-17   1853   0
P10

  Apache Mahout:适合所有人的可扩展机器学习框架 文档

。Grant 是 Apache Mahout 机器学习项目的创始人之一,并且是 Apache Lucene 和 Apache Solr 项目的负责人和发言人。他还是描述使用开源工具进行自然语言处理的图书

beiwei1121 2014-09-23   492   0

搜索工具,DocSearcher 3.93.0 发布 资讯

RTF, Text, 和HTML。 DocSearcher 采用Java开发,用到了一些开源类库: Lucene 和 POI 还有 PDF Box

openkk 2012-11-11   13111   0

ElasticSearch 1.7.5 发布,分布式搜索引擎 资讯

1.7.5 发布,下载地址: v1.7.5 Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快

jopen 2016-02-02   13774   0

spindle 开源项目

spindle是一个构建在Lucene工具包之上的Web索引/搜索工具.它包括一个用于创建索引的HTTP spider和一个用于搜索这些索引的搜索类。spindle项目提供了一组JSP标签库使得那些基

码头工人 2019-01-17   8697   0

Carrot2 开源项目

Meta Search、Alexa Web Search、PubMed、OpenSearch、Lucene index、SOLR)获取搜索结果。

码头工人 2019-01-17   855   0

imdict 开源项目

Model,HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供简体中文分词支持。

码头工人 2019-01-17   588   0

Java 搜索引擎服务器 Open Search Server 1.2.4 RC3 发布 资讯

OSS (Open Search Server) 是一个用 Java 开发的搜索引擎服务器,基于 Lucene 、ZK 和 Tomcat 等开源软件架构。 Open Search Server 1.2

fmms 2012-03-18   6970   0
Java  

OPEN-OPEN开通全文搜索功能(OPEN开源项目搜索)! 博客

OPEN-OPEN.COM利用Lucene搜索引擎和 IKAnalyzer 中文分词器开发了一个全文搜索功能,方便您快速找到自己需要的开源项目。可以搜索已经收录的 Java 开源项目, PHP 开源项目和

码头工人 2010-07-20   4175   0
1 2 3 4 5 6 7 8 9 10