P45

  LUCENE 开发部署指导手册 文档

编制本手册的目的:1.描述Lucene用途,使开发人员依据本手册初步认识Lucene;2.描述Lucene的API,使开发人员可以快速认识并利用Lucene开发搜索引擎;3.描述Lucene和webdt的融合;4.重点描述Lucene的应用,使开发人员可按照本手册的描述开发。本手册面向的读者:熟悉Java开发,并对WEBDT软件的特点(请参阅《技术白皮书》)具有初步认识的技术人员。概述本手册首先介绍了Lucene的概念,详细描述了简单快速地将Lucene融入WEBDT运行平台并进行实际开发的方法,使技术人员对Lucene有一个概要性的框架认识,为下一步开发工作奠定基础。LUCENE简介什么是LUNCENELucene是一套javaAPI,就如同Servlet是一套API一样。Lucene不是一个独立的搜索引擎系统,但是你可以使用Luncene来开发搜索引擎系统。这正如Servlet不是网站系统但是你可以用Servlet开发网站一样。有人已经用Lucene开发出了独立的搜索引擎系统,你可以下载,然后不写一行代码就是用它。Nutch是最出名的了。Lucene是一个全文搜索框架,而不是应用产品。

i_google 2013-01-05   442   0
P58

  compass学习总结 文档

compass学习总结

sweetbaybe 2012-12-24   2688   0
P9

  搜索引擎solr环境配置、分词及索引操作 文档

搜索引擎solr环境配置、分词及索引操作

huafenged 2012-11-22   3997   0
P12

  Lucene的Highlighter实现文章摘要的自动提取 文档

使用Lucene自带的Highlighter就可以实现对原始文件摘要的提取工作。Highlighter类有一个getBestFragment方法,这个方法有多个重载的方法。使用Lucene自带的Highlighter就可以实现对原始文件摘要的提取工作。Highlighter类有一个getBestFragment方法,这个方法有多个重载的方法

zfr046 2012-11-02   10596   0
P18

  Lucene 3.1 使用教程 文档

全文检索就如同ORM,是一个概念。ORM的框架有很多种:Hibernate、TopLink、iBatis等,我们之前学习的是Hibernate。同样的,全文检索领域中也有多种框架,Lucene就是其中的一个用开源的全文检索框架。对索引库的操作可以分为两种:管理与查询。管理索引库使用IndexWriter,从索引库中查询使用IndexSearcher。Lucene的数据结构为Document与Field。Document代表一条数据,Field代表数据中的一个属性。一个Document中有多个Field,Field的值为String型,因为Lucene只处理文本。

a565810900 2012-10-16   3588   0
P1

  Lucene 基本概念 文档

Lucene它最主要就是做两件事:建立索引和进行搜索来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 建立索引:Document:文档;Document相当于一个要进行索引的单元,任何可以想要被索引的文件都必须转化为Document对象才能进行索引。

lydouble0 2012-09-27   3387   0
P35

  lucene 初级学习资料 文档

lucene简介lucene是什么?lucene是一套JavaAPI,它不是一个独立的搜索引擎系统,但是你可以使用lucene开发搜索引擎系统。现在我们学习lucene主要是学习如何使用别人开源的东西,来组建自己想要的搜索引擎系统。在这里我是和大家共同讨论学习lucene,前些日子我先简单的学习了一下,下面给大家具体的介绍一下lucene.lucene有什么(也就是lucene的组成)(1)indexer(2)searcher一个完整的搜索引擎有四部分组成,lucene可以完成两部分。

zzc0112 2012-09-24   3328   0
Lucene   搜索引擎   HTML   Java   SQL  
P8

  实战Lucene-快速上手开发搜索引擎 文档

本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。Lucene简介Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene目前是ApacheJakarta家族中的一个开源项目。也是目前最为流行的基于Java开源全文检索工具包。目前已经有很多应用程序的搜索功能是基于Lucene的,比如Eclipse的帮助系统的搜索功能。Lucene能够为文本类型的数据建立索引,所以你只要能把你要索引的数据格式转化的文本的,Lucene就能对你的文档进行索引和搜索。

chongan 2012-09-21   529   0
P4

  Lucene 学习总结 文档

Lucene学习总结非复合式创建索引时,创建indexN次,会在luke搜索时,搜索到N条相同

北斗狼 2012-09-06   2830   0
P7

  lucene 全文检索数据库 文档

我们以前经常碰到搜索数据库的内容;用like %的sql语句; 如果数据量大而且多表查询时; 用lucene2那就可以解决速度问题。 lucene2搜索photo表的title,username,tagname,desr内容; 用一个例题来说明更直观;

北斗狼 2012-09-06   4338   0
P8

  Nutch 配置过程 文档

Nutch搜索引擎数据获取。1基本原理:1.1体系结构设计:网络蜘蛛一般都具有3模块:HTTP下载模块,链接分析模块,下载控制模块。HTTP下载模块利用http网络协议下载,获取并存储内容。链接分析模块能提取网页中的超链接,用来获得后续页面入口。下载控制模块控制页面访问次序、更新策略、访问队列调度等工作。工作流程:访问URL数据库,读取URL入口地址,生成内存访问队列。寻找空闲的HTTP下载模块,分配URL,启动下载任务。HTTP下载模块访问互联网,得到的网页内容放入结果队列。定期保存到网页数据库,为后续索引做准备。链接分析模块提取页面内的新连接,存入URL数据库等待下载。重复上述过程直到全部下载完成,等待新的任务。

Johey 2012-09-06   3875   0
P3

  Lucene 的基本原理和代码分析 文档

我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等对非结构化数据也即对全文数据的搜索主要有两种方法:一种是顺序扫描法(SerialScanning):所谓顺序扫描,比如要找内容包含某一个字符串的文件,就是一个文档一个文档的看,对于每一个文档,从头看到尾,如果此文档包含此字符串,则此文档为我们要找的文件,接着看下一个文件,直到扫描完所有的文件。从非结构化数据中提取出的然后重新组织的信息,我们称之索引。先建立索引,再对索引进行搜索的过程就叫全文检索(Full-textSearch)。全文检索大体分两个过程,索引创建(Indexing)和搜索索引(Search)。

niyong 2012-09-04   2999   0
P34

  全文检索及Lucence原理、使用总结 文档

全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。

religiose 2012-09-03   10827   0
P26

  SPHINX 搜索共享学习 文档

Coreseek是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景,用户可以免费下载使用。

0309yt 2012-08-27   5030   0
P39

  Lucene in Action(简体中文版)教程完整版 文档

,Lucene已经翻译成很多其它的语言包括C++、C#、Perl和Python。在最开始的Java和其它这些语言中,Lucene的应用比我预想的要广泛地多。它为不同的应用(如财富100公司讨论组、商业Bug跟踪、Microsoft提供的邮件搜索和100页面范围的Web搜索引擎)提供搜索动力。在业内,我被介绍为“Lucene人”。很多人告诉我他们在项目中使用到Lucene。我依然认为我只听说了使用Lucene的程序的小部分。

我爱男科 2012-08-21   6818   0
P17

  Nutch 入门 文档

Nutch中的所有配置文件都放置在总目录下的conf子文件夹中,最基本的配置文件是conf/nutch-default.xml。这个文件中定义了 Nutch的所有必要设置以及一些默认值,它是不可以被修改的。如果你想进行个性化设置,你需要在conf/nutch-site.xml进行设置,它会 对默认设置进行屏蔽。

xcp881012 2012-08-19   3754   0
P35

  lucene 初级学习资料 文档

lucene简介lucene是什么?lucene是一套JavaAPI,它不是一个独立的搜索引擎系统,但是你可以使用lucene开发搜索引擎系统。现在我们学习lucene主要是学习如何使用别人开源的东西,来组建自己想要的搜索引擎系统。在这里我是和大家共同讨论学习lucene,前些日子我先简单的学习了一下,下面给大家具体的介绍一下lucene.lucene有什么(也就是lucene的组成

平江夜弹 2012-08-17   545   0
Lucene   搜索引擎   HTML   Java   SQL  
P31

  基于Lucene 3.0 的简易完整搜索_实习报告(含完整代码) 文档

介绍要完成的项目,概要介绍总共要完成的功能•程序基本要求清晰易读、稳定可靠 •网络爬虫多线程 链接分析 抓取控制 •文本分析 Html文本分析 css、JavaScript等无用代码的清除.

mousefat 2012-08-16   752   0
P31

  基于LUCENE 3.0的简易完整搜索_实习报告(含完整代码) 文档

主要使用Java里面的URL类和URLConnection类来实现网页的获取,通过htmlparser中的parser,node,tag包中提供的方法完成链接的分析工作。及URL和URLConnection得到网页代码,结点分析得到新的链接。详情参看Spid类中的serach方法。

mousefat 2012-08-08   2614   0
P8

  基于Java的全文索引/检索引擎 - Lucene 文档

Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。

fanhx9 2012-07-30   409   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档