FalconEngine - 一个 Go 语言实现的简单搜索引擎 经验

搜索引擎感兴趣的可以去看看 这本书 ,比较浅并且也比较完整的介绍了一个搜索引擎的全部机能。 我的这个搜索引擎原始数据是MySql数据库的,大家可以根据需要进行二次开发,用来支持其他数据库或者本地文件,Detail文件是存储在

jopen 2015-07-27   11057   0

实时的、分布式的RESTful搜索引擎:Eleasticsearch 经验

Elasticsearch是一个实时的、分布式的RESTful搜索引擎,基于Apache Lucene开发。具备高可靠性,支持非常多的企业级搜索用例。它对外提供一系列基于Java和HTTP的API,用于索引、检索、修改大多数配置。

jopen 2014-04-01   22699   0
P21

  分布式搜索引擎技术 - Lily 文档

元数据节点(Namenode)和数据节点(datanode) 18 Zookeeper介绍 18 Lucene搜索引擎 20 Minion搜索引擎 20 Lily 分布式搜索 Lily以NoSQL技术为主题,是建立在云计算上的内容仓库(content

ykyx00 2012-04-01   5121   0
P309

  罗刚著:自己动手写搜索引擎 文档

了解搜索引擎 1.1 你也可以做搜索引擎 一个最简单的搜索引擎由搜索和抓取两部分组成: Web Index DB Spider Searcher Database 数据来源可以是Web或者数据库等,也可以是本地路径等。

emmerich 2011-08-23   982   0
P295

  自己动手写搜索引擎 - 建一个自己的Google 文档

自己动手写搜索引擎 ——建一个自己的Google 2008 目录 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1

zxh116116 2013-04-22   1703   0

java搜索引擎爬虫,抓取url示例 代码段

import java.io.IOException; import java.util.LinkedList; import java.util.List; import java.util.Queue; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.jsoup.Jsoup; import o

by57 2015-01-29   4552   0
Java  
P63

  开源企业搜索引擎SOLR的应用教程 文档

 开源企业搜索引擎SOLR的 应用教程 2010-10 目 录 1 概述 4 1.1 企业搜索引擎方案选型 4 1.2 Solr的特性 4 1.2.1 Solr使用Lucene并且进行了扩展 4 1

abert 2014-09-18   408   0

具有强大功能的全文搜索引擎:Hyper Estraier 经验

Hyper Estraier是一个具有强大功能的全文搜索引擎,它由一个日本人开发,支持中文,日文,韩文,英文,以及其它多国语言。Hyper Estraier采用LGPL开源授权协议。 特性: 智能的Web爬虫

openkk 2011-12-30   19052   0

PHP的Web爬虫和搜索引擎 PhpDig 经验

PhpDig是一个采用PHP开发的Web爬虫和搜索引擎。通过 对动态和静态页面进行索引建立一个词汇表。当搜索查询时,它将按一定的排序规则显示包含关 键字的搜索结果页面。PhpDig包含一个模板系统并能够索引PDF

openkk 2011-12-30   28005   0
P13

  开源搜索引擎solr应用培训教程 文档

1. 目录 企业搜索引擎方案选型 Solr的特性介绍 Solr的安装与配置 Solr的应用过程 Solr的测试数据 2. 一 企业搜索引擎方案选型由于搜索引擎功能在门户社区中对提高用户体验有着重要作用

zxh116116 2013-04-22   9247   0
P33

  大网站搜索引擎优化策略 文档

1. 大网站搜索引擎优化策略麦宝大学MAIBAO UNIVERSITY20-Oct-18讲师:芦蒿 2. 2大网站搜索引擎优化策略 关于搜索引擎优化(SEO)  关于关键词  关于站内优化  关于链接建设

huangxm129 2011-07-15   608   0

原生CSS搜索引擎:Jets.js 经验

原生CSS搜索引擎 Demo, usage, etc… 项目主页: http://www.open-open.com/lib/view/home/1442058267867

jopen 2015-09-13   8983   0

垂直搜索引擎中的分词系统 经验

应用的搜索引擎解决方案也越来越 重视。同时,通用的可选开源搜索引擎框架或解决方案也越来越多,如著名的Lucene,Solr,ElasticSearch等。打造一套完美适应自身业 务需求的搜索引擎是个具

jopen 2015-06-18   45479   0

实时分布式搜索引擎 Solandra 介绍 经验

Solandra 是一个实时分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建。其核心,Solandra是Solr与Cassandra的一个紧密集成。这意味着So

openkk 2011-12-30   29843   0

基于Redis与Node.js实现的全文搜索引擎 Reds 经验

是由LearnBoost公司的TJ Holowaychuk开发的一个基于 Redis 的Node.js全文搜索引擎,其代码加上注释也只有300行。不得不说又是一个Redis的最佳实践,它的主要原理是通过Redi

fmms 2012-01-01   28816   0

嵌入式全文搜索引擎 Senna 经验

Senna 是一个可嵌入式的全文搜索引擎,可用在各种不同的脚本语言和数据库中。Senna 是一个倒排索引的引擎,并结合最好的n元语法的索引和词索引,以实现快速,精确的搜索。虽然塞纳是相当紧凑的代码是可扩展性不够,处理大量的数据和查询。

fmms 2012-01-01   13975   0

Java搜索引擎 MG4J 经验

MG4J 是另一个搜索引擎。与Lucene 主要区别是,它提供了cluster 功能,具有更OO的设计方式。 MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引,通过使内插编码(interpolative

fmms 2012-01-03   15208   0

分布式搜索引擎 Elastic Search 经验

ElasticSearch是一个基于 Lucene 构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

fmms 2012-01-01   21586   0

结构化数据的搜索引擎 Argos 经验

Argos是一个结构化数据的搜索引擎。 它不仅包含全文搜索引擎的功能,还针对结构化数据搜索提供了丰富的支持。 Argos很大程度是是基于我在eBay的主要项目Voyager以其后续项目Cassini的一个开源仿制品。

openkk 2012-08-20   19172   0

groonga - 快速,准确的全文搜索引擎 经验

Groonga 是一个快速、准确、基于倒排索引的全文搜索引擎。新注册的文件立即显示在搜索结果中,并且在更新的时候没有只读锁定。这些特性使得可以将其用作一个性能优越的实时应用程序。 它还是一个面向列的数

jopen 2012-12-29   20934   0
1 2 3 4 5 6 7 8 9 10