IKAnalyzer 开源项目

。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。

码头工人 2019-01-17   925   0
P295

  自己动手写搜索引擎 - 建一个自己的Google 文档

搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nutch网络搜索软件 15 2.2.5 用户界面 17 2

zxh116116 2013-04-22   1703   0

Mahout快速入门教程 经验

: K-means clustering lucene.vector: : Generate Vectors from a Lucene index lucene2seq: : Generate Text

lidki 2015-03-22   18001   0

Java内容仓库API,Apache Jackrabbit Oak v1.2.15 发布 资讯

Oak-run console's lucene command is broken [OAK-4300] - Cost per entry for Lucene index of type v1 should

jopen 2016-05-17   9036   0

Java中文分词组件:word 经验

准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch插件。 分词使用方法: 1、快速体验 运行项目根目录下的脚本demo-word

jopen 2014-04-30   76300   0

OpenEdit 开源项目

用户管理,文件管理,版本控制和通告工具。电子商务模块包括在线产品目录管理,购物车,电子付款,产品展示与产品高级搜索(利用Nutch/Lucene的web爬行与搜索功能进行高级搜索所以不需要用数据库的功能). Blog模块包括在线管理,评论,注册和RSS/Atom引擎。

码头工人 2019-01-17   8659   0

分布式存储系统 Katta 经验

大的数据集。这些索引可以是不同的类型。当前该实现在Lucene和Hadoop mapfiles 让大型高负荷的索引变简单 能为许多具有大型Lucene或Hadoop Mapfile 的索引碎片的服务器提供服务

fmms 2012-02-06   15191   0

Java内容管理系统 OpenEdit 经验

用户管理,文件管理,版本控制和通告工具。电子商务模块包括在线产品目录管理,购物车,电子付款,产品展示与产品高级搜索(利用Nutch/Lucene 的web爬行与搜索功能进行高级搜索所以不需要用数据库的功能). Blog模块包括在线管理,评论,注册和RSS/Atom引擎。

fmms 2012-03-31   14499   0

分布式存储系统 Katta 经验

大的数据集。这些索引可以是不同的类型。当前该实现在Lucene和Hadoop mapfiles 让大型高负荷的索引变简单 能为许多具有大型Lucene或Hadoop Mapfile 的索引碎片的服务器提供服务

openkk 2012-06-08   17729   0

Solrj - 访问solr的Java客户端 经验

r索引。 Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化

jopen 2012-10-15   50942   0

Apache Lucy 0.4.4 发布,全文搜索引擎库 资讯

是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene 。 Apache Lucy 0.4.4 发布,更新如下: Bug修复:     * [L

jopen 2016-02-03   4059   0

Solr开发文档 经验

Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇文章中,将介绍 Solr 并展示如何轻松地将其表现优异的全文本搜索功能加入到 Web

fmms 2012-01-31   85705   0
P309

  罗刚著:自己动手写搜索引擎 文档

com下载得到。使用缺省方式安装即可。 然后要使用的是Lucene全文检索包。当前可以从http://lucene.apache.org/java/docs/index.html下载到最新的Lucene,当前的版本是2.3。另外

emmerich 2011-08-23   982   0
P44

  solr笔记 文档

Solr介绍 2.1 什么是solr Solr也是Apache下一个项目,它是使用java开发的,它是基于Lucene的全文搜索服务器。 Solr如何进行索引和搜索 索引:客户端(可以是浏览器可以是java程序)

wowwilliam 2016-12-27   934   0
P17

  Nutch初体验 文档

进行了一下介绍。 Nutch vs Lucene Lucene 不是完整的应用程序,而是一个用于实现全文检索的软件库。 Nutch 是一个应用程序,可以以 Lucene 为基础实现搜索引擎应用。 Nutch

ggyi2003 2011-07-31   550   0

Java 分布式中文分词组件,word v1.3.1 发布 资讯

ine功能灵活控制分词结果,还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、 Solr、ElasticSearch、Luke集成。 word 1.3.1这个版本是从代码分支

jopen 2015-10-05   12527   0
word  

Java 企业门户平台 Liferay Portal 经验

框架,基于XML的portlet配置文件可以自由地动态扩展,使用了Web服务来支持一些远程信息的获取,使用 Lucene实现全文检索功能。 主要特点如下: 1、提供单一登陆接口,多认证模式(LDAP或SQL);

fmms 2012-04-03   80337   0

Liferay 开源项目

以自由地动态扩展,使用了Web Services来支持一些远程信息的获取,使用 Apahce Lucene实现全文检索功能。 主要特点: 1、提供单一登陆接口,多认证模式(LDAP或SQL);

码头工人 2019-01-17   27185   0

LogicalDOC 6.7.1 发布,基于 Web的文档管理系统 资讯

Web的文档管理系统,易于使用和学习。它的架构充分利用同类最佳Java技术,实现了强大而灵活的解决方案。它为用户提供了基于Lucene的强大搜索 引擎,Web服务接口(通过CXF的JAX-WS)兼容NET和PHP版本,文档加版本控制,为文档添加注释,一个

jopen 2013-06-06   19342   1

Elasticsearch 2.0.0 GA 发布 资讯

Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

bger 2015-10-28   13944   0
1 2 3 4 5 6 7 8 9 10