P28

  基于java的搜索引擎的设计与实现 文档

网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,本人还亲自实现了一个自己的搜索引擎——新闻搜索引擎。 新闻搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。 本人在介绍搜索引擎的章节中除了详细的阐述技术核心外还结合了新闻搜索引擎的实现代码来说明,图文并茂、易于理解。

lijinfei 2011-08-16   5085   0

Java 搜索引擎 Compass 经验

Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架

openkk 2011-12-30   18741   0

Java搜索引擎 Nutch 介绍 经验

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

openkk 2011-12-30   54716   0

Java搜索引擎平台 Hawk 经验

Hawk 搜索引擎平台 是面向中小型网站,可以定制的垂直搜索引擎平台。本搜索引擎平台目标是方便用户搭建站内搜索、某个领域的垂直搜索、以及检索个人文档以及自己关注的网站信 息的桌面搜索等应用领域。它改造自Lucene,Hadoop和Nutch系统。

fmms 2012-01-01   29657   0

Java搜索引擎 IndexTank 经验

IndexTank, 一套基于Java的索引-搜索引擎实现,支持的特性包括:variables (boosts), categories (facets), faceted search, snippeting, 自定义打分功能, 搜索建议和自动完成。

jopen 2011-12-22   24252   0

Java搜索引擎 Lucene 经验

Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单确强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,Lucene是现在并且是这几年,最受欢迎的免费java资讯检索程式库。

openkk 2011-12-30   51334   0

Java搜索引擎 Lucene 4.0 的开发状态 资讯

Lucene最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构的研究。他贡献出Lucene的目标是为各种中小型应用程式加入全文检索功能。

fmms 2011-11-14   18285   2
Lucene  

Java搜索引擎,Nutch v1.6 发布 资讯

Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. 为了完成这一宏伟的目标。 爬虫crawler和查询searcher。Crawler主要用于从网络上抓取网页并为这些网页建立索引。Searcher主要利用这些索引检索用户的查找关键词来产生查找结果。两者之间的接口是索引,所以除去索引部分,两者之间的耦合度很低。

jopen 2012-12-08   9090   1
nutch  

Java 搜索引擎 Lucene 3.5 发布 资讯

Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单确强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,Lucene是现在并且是这几年,最受欢迎的免费java资讯检索程式库。人们经常提到资讯检索程式库,就像是搜寻引擎,但是不应该将资讯检索程式库与网搜索引擎相混淆。

jopen 2011-11-27   18955   1
Lucene  

Apache Lucene 5.5.0 发布,Java 搜索引擎 资讯

Apache Lucene 5.5.0 发布了,该版本包含 bug 修复、优化和改进。

jopen 2016-02-23   12370   0

Java搜索引擎,MG4J 5.2 发布 资讯

MG4J 是一个高度可定制的,高性能的,全文Java搜索引擎。适用于大型文件集,它提供了一些高级的功能(如BM25/BM25F得分)和新的研究算法。

jopen 2013-02-18   9399   0
MG4J  

Java搜索引擎,Managing Gigabytes for Java 5.1 发布 资讯

MG4J是一个高度可定制的,高性能的,全文Java搜索引擎,主要用于大型文件集。它提供了先进的功能(如BM25/BM25F得分)和新的研究算法。

jopen 2012-11-22   4954   0
MG4J  

Nutch 1.6 即将发布,Java搜索引擎 资讯

从Nutch的开发者邮件中得到消息。Nutch 1.6 RC 将在未来数日内发布。将修复和增超过40个的bug/功能要求。

jopen 2012-11-28   10293   0
nutch  

Java搜索引擎 Apache Lucene 3.4.0 发布 资讯

Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单确强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,Lucene是现在并且是这几年,最受欢迎的免费java资讯检索程式库。人们经常提到资讯检索程式库,就像是搜寻引擎,但是不应该将资讯检索程式库与网搜索引擎相混淆。

openkk 2011-09-15   16383   0
Lucene  

Lucene 5.1.0 发布,Java 搜索引擎 资讯

Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

jopen 2015-06-02   16337   0
Lucene  

Lucene 5.2.1 发布,Java 搜索引擎 资讯

Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

nw44 2015-06-15   8089   0
Lucene  

9个基于Java的搜索引擎框架 经验

在这个信息相当繁杂的互联网时代,我们已经学会了如何利用搜索引擎这个强大的利器来找寻目标信息,比如你会在Google上搜索情人节如何讨女朋友 欢心,你也会在百度上寻找正规的整容医疗机构(尽管有很大一部分广告骗子)。那么如果在你自己开发的网站系统中需要能让用户搜索一些重要的信息,并且能以 结构化的结果展现给用户,下面分享的这9款Java搜索引擎框架或许就可以帮助到你了。

jopen 2014-09-03   34907   0

java搜索引擎爬虫,抓取url示例 代码段

import java.io.IOException; import java.util.LinkedList; import java.util.List; import java.util.Queue; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.jsoup.Jsoup; import o

by57 2015-01-29   4552   0
Java  

Java搜索引擎 MG4J 经验

MG4J 是另一个搜索引擎。与Lucene 主要区别是,它提供了cluster 功能,具有更OO的设计方式。

fmms 2012-01-03   15208   0

Java搜索引擎 Lucene 3.6 将支持“查询时连接”功能 资讯

一个非常便利的功能——查询时连接 (query time joining) 将出现在接下来发布的 Lucene 版本中。上个月 Lucene 团队确认 4.0 版本将包含这个特性,但是最新的消息称 Lucene 3.6 也将提供这个功能。

fmms 2012-02-11   13950   0
Lucene  
1 2 3 4 5 6 7 8 9 10