P15 关于搜索引擎及其开发 作者:xwjbs 来自:http://blog.csdn.net/xwjbs 转载的时候请注明作者和出处。没有作者的允许,严禁用于商业利益。 托google、百度们成功
RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数
Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG
一个c++编写的简单的搜索引擎,它是我对全文搜索文件结构理解的一次实践,现在应该还不能用到具体的项目中,但是如果你想了解搜索引擎的原理,那它是个不错的东西。 项目主页: http://www
XQEngine 是一个基于XML文档的全文本搜索引擎,前端使用的是 XQuery 查询语言。 项目主页: http://www.open-open.com/lib/view/home/1325594717984
mnoGoSearch是一个功能完整的Web搜索引擎,你可以用它来在HTTP,HTTPS,FTP,NTTP服务器,本地文件和数据库文本字段之上构建搜索引擎。它内置支持XML,HTML,eml和文本文件
Elasticsearch是一个分布式可扩展的实时搜索和分析引擎。它能帮助你搜索、分析和浏览数据,而往往大家并没有在某个项目一开始就预料到需要这些功能。Elasticsearch之所以出现就是为了重新赋予硬盘中看似无用的原始数据新的活力。
P5 搜索引擎命令大全 -seoerboy分享-觉得好就收藏 1、双引号 把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google
Regain是一个基于Jakarta Lucene封装的搜索引擎。它能够索引和查询多种格式的文件(当前支持的格式包括:HTML、XML、Excel、Powerpoint、Word、 PDF和RTF)。
Xapian 是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而 Xapian 则填补了这个缺憾。
SimpleSearch是专为PHP开发人员而开发的一款搜索引擎,其基于 Xapian 开发,目标是让所有PHP开发人员都很容易解决百万级数量以上的全文检索需求。 它的实现真的很简单。轻轻松松就能
Ferret是一个与Apache Lucene相同的信息检索库。起初完全移植Lucene,但现在它使用了自己的文件格式和索引算法。但它仍然在许多方面与 Lucene非常相似。所有能在Lucene实现的功能,在Ferret中也能够做到。
P7 搜索引擎原理 全文索引: 根据搜索结果来源的不同,全文搜索引擎可分为两类:一类拥有自己的网页抓取、索引、检索系统(Indexer),有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler)、或
代码搜索功能。谷歌最近宣布,他们从Google code移除代码搜索支持。本文将介绍一些代码搜索引擎网站。 Github is a most widely used open source
P28 1. 基于lucene的搜索引擎 2007/07/01 2. 引言 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache
http://www.kuqin.com/opensource/20080806/13483.html
Lucene 索引库的封装。通过 PyLucene 可以用来创建索引和对索引进行搜索。 示例说明: Java 代码: for (int i = 0; i < hits.length(); i++) { Document
Sphider是一个轻量级,采用PHP开发的Web 爬虫和搜索引擎,使用mysql来存储数据。可以利用它来为自己的网站添加搜索功能。Sphider非常小,易于安装和修改,已经有数千网站在使用它。 在线演示地址:
DataparkSearch 搜索引擎是一个 C 语言的全功能的开源基于Web的搜索引擎, 支持来自 http, https, ftp, nntp, and news URLs, htdb virtual
scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。支持海量数据高速检索,功能强大,简单易用! 本项目旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以