P45

  Lucene 开发手册 文档

概述本手册首先介绍了Lucene的概念,详细描述了简单快速地将Lucene融入WEBDT运行平台并进行实际开发的方法,使技术人员对Lucene有一个概要性的框架认识,为下一步开发工作奠定基础。LUCENE简介什么是LUNCENELucene是一套javaAPI,就如同Servlet是一套API一样。Lucene不是一个独立的搜索引擎系统,但是你可以使用Luncene来开发搜索引擎系统。这正如Servlet不是网站系统但是你可以用Servlet开发网站一样。有人已经用Lucene开发出了独立的搜索引擎系统,你可以下载,然后不写一行代码就是用它。Nutch是最出名的了。

gulong 2011-12-22   1229   0
P3

  深入IK分词器 文档

首先,介绍一下IK的整个分词处理过程:1.Lucene的分词基类是Analyzer,所以IK提供了Analyzer的一个实现类IKAnalyzer。首先,我们要实例化一个IKAnalyzer,它有一个构造方法接收一个参数isMaxWordLength,这个参数是标识IK是否采用最大词长分词,还是采用最细粒度切分两种分词算法。实际两种算法的实现,最大词长切分是对最细粒度切分的一种后续处理,是对最细粒度切分结果的过滤,选择出最长的分词结果。

chennaid 2011-12-19   471   0
P1

  lucene全文检索接口说明 文档

realroc 2011-12-11   3475   0
Lucene   搜索引擎   HTML   SQL   Go  
P9

  lucene排序文档 文档

lucene默认的排序方式,在lucene中也被称为“评分机制”,可以同过给sort对象传递一个null来实现,也可以通过调用sort默认的构造函数来实现

realroc 2011-12-11   470   0
P3

  Lucene3.0之结果排序 文档

Lucene3.0之结果排序(1):原理传统上,人们将信息检索系统返回结果的排序称为“相关排序”(relevanceranking),隐含其中各条目的顺序反映结果和查询的相关程度。

sylixd 2011-12-05   3376   0
P10

  利用Lucene搜索Java源代码 文档

在这篇文章中,我推荐使用Lucene,它是基于Java的开源搜索引擎,通过提取和索引相关的源码元素来搜索源代码。这里,我仅限定搜索Java源代码。然而,Lucene同样可以做到对其他编程语言的源代码的搜索。 文章给出了在Lucene环境下搜索引擎重点方面的简短概述。要了解更多细节信息,参考Resources部分。

sylixd 2011-12-05   8595   0
P48

  Lucene学习总结之一:全文检索的基本原理一 文档

Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。当然有的地方还会提到第三种,半结构化数据,如XML,HTML等,当根据需要可按结构化数据来处理,也可抽取出纯文本按非结构化数据来处理。

sylixd 2011-12-05   453   0
P2

  全文搜索体系结构 文档

全文搜索体系结构本主题展示了组成ClearQuest全文搜索功能的组件的高级体系结构视图。全文搜索功能使用Solr搜索服务器和Lucene信息检索库技术。下图显示了组成全文搜索实施的关键软件组件。

sylixd 2011-12-05   3964   0
P20

  Lucene使用与优化 文档

Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。

bytion 2011-11-17   2698   0
P22

  使用Apache Solr对数据库建立索引 文档

主要分为两部分,第一部分是对《db-data-config.xml》的配置内容的讲解(属于高级内容),第二部分是DataImportHandler(属于基础),第三部分是对db-data-config.xml的进阶

autorun365 2011-11-09   551   0
P4

  Solr简介以及优势 文档

Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引,通过http协议进行查询,返回结果为xml格式。

autorun365 2011-11-09   15671   0
P12

  Solr概况 文档

Solr是一个开源的,企业级搜索服务器。她已经是一个成熟的产品,用于强化网络站点的搜索功能,包括内部局域网。 她是用Java语言编写。使用HTTP和XML进行数据传输,Java的掌握对于学习Solr不是必须的。除了能返回搜索 结果外,还有包括高亮搜索关键字,方位导航(已广泛用于电子商务网站),查询关键字拼写校验,自动查询建议 和 “类似”查询 帮助更好定位搜索。

autorun365 2011-11-09   3891   0
P25

  基于Java的Lucene的Compass框架说明使用技术文档 文档

Compass是一流的开放源码JAVA搜索引擎框架,对于你的应用修饰,搜索引擎语义更具有能力。依靠顶级的Lucene搜索引擎,Compass结合了,像Hibernate和Spring的流行的框架,为你的应用提供了从数据模型和数据源同步改变的搜索力.

calayou 2011-11-08   6495   0
P16

  Lucene基础指南 文档

Lucene基础指南Lucene是apache下的一个采用java实现的全文搜索引擎,功能非常强大,而它的API又比较简单,主要就做两件事:建立索引和进行搜索。

pjx2011 2011-11-07   453   0
P18

  传智播客Lucene3.0课程 文档

全文检索(Full-Text Retrieval)是指以文本作为检索对象,找出含有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指标。 关于全文检索,我们要知道:1,只处理文本。2,不处理语义。3,搜索时英文不区分大小写。4,结果列表有相关度排序。

etk99 2011-10-25   526   0
P19

  SOLR搭建企业搜索平台 文档

我是第一de 2011-10-03   3869   0
P16

  lucene.net(2.0)建立索引的详细过程及相关文件结构 文档

Lucene的索引结构从大到小分为以下几个概念:index,segments,document(以下可能简称为doc),field,termIndex(索引),一个索引,包括所有需要的信息内容;Segments(段),可以理解为一个子索引(sub-index),每当往index中新加入一个doc时,都会新生成一个segments保存这个doc,然后通过判断,合并部分segments,最后通过优化索引的命令,把所有的segments合并成一个index;Document(文档),一般以document为单位往index中添加记录,一个document可以是一个txt,一个html或者是数据库的一条记录。一个document由几个field的组成;

caty1985 2011-09-14   577   0
P

Lucene学习总结 文档

Lucene是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。Lucene以其方便使用、快速实施以及灵活性受到广泛的关注。它可以方便地嵌入到各种应用中实现针对应用的全文索引、检索功能,本总结使用lucene--2.3.2。

mysd76 2011-09-08   5180   0
P19

  Solr使用和原理 文档

Solr简介说起Apache Lucene,可以说无人不知,无人不晓,但是说道ApacheSolr,恐怕知道的不多。看看Apache Solr的说明:Solr是一个基于Lucenejava库的企业级搜索服务器,包含XML/HTTP,JSONAPI,高亮查询结果,缓存,复制还有一个WEB管理界面。Solr运行在Servlet容器中。所以Solr和Lucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是独立的应用程序,而Solr是。Lucene专注于搜索底层的建设,而Solr专注于企业应用。Lucene不负责支撑搜索服务所必须的管理,而Solr负责。一句话概括Solr:Solr是Lucene面向企业搜索应用的扩展。

zy1193 2011-09-07   881   0
P

Apache Lucene.net API文档 文档

qinshan_xy 2011-08-23   6846   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档