关于搜索引擎及其开发 作者:xwjbs 来自:http://blog.csdn.net/xwjbs 转载的时候请注明作者和出处。没有作者的允许,严禁用于商业利益。 托google、百度们成功
PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数
Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG
一个c++编写的简单的搜索引擎,它是我对全文搜索文件结构理解的一次实践,现在应该还不能用到具体的项目中,但是如果你想了解搜索引擎的原理,那它是个不错的东西。 项目主页: http://www
XQEngine 是一个基于XML文档的全文本搜索引擎,前端使用的是 XQuery 查询语言。 项目主页: http://www.open-open.com/lib/view/home/1325594717984
mnoGoSearch是一个功能完整的Web搜索引擎,你可以用它来在HTTP,HTTPS,FTP,NTTP服务器,本地文件和数据库文本字段之上构建搜索引擎。它内置支持XML,HTML,eml和文本文件
Elasticsearch 是一个建立在全文搜索引擎Apache Lucene(TM)基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架。但是Lucene只是一个框架,要充分
1. 搜索引擎解密猎兔搜索 罗刚 2. 搜索引擎结构文档文本提取索引程序索引库(Lucene)搜索查询服务器(Solr)文件数据库爬虫NBA搜索 3. Lucene是什么包括 全文索引库 简单的语言解析功能
搜索引擎命令大全 -seoerboy分享-觉得好就收藏 1、双引号 把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google
Regain是一个基于Jakarta Lucene封装的搜索引擎。它能够索引和查询多种格式的文件(当前支持的格式包括:HTML、XML、Excel、Powerpoint、Word、 PDF和RTF)。
Xapian 是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而 Xapian 则填补了这个缺憾。
SimpleSearch是专为PHP开发人员而开发的一款搜索引擎,其基于 Xapian 开发,目标是让所有PHP开发人员都很容易解决百万级数量以上的全文检索需求。 它的实现真的很简单。轻轻松松就能
Ferret是一个与Apache Lucene相同的信息检索库。起初完全移植Lucene,但现在它使用了自己的文件格式和索引算法。
搜索引擎原理 全文索引: 根据搜索结果来源的不同,全文搜索引擎可分为两类:一类拥有自己的网页抓取、索引、检索系统(Indexer),有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler)、或
业的成长至关重要。 本文介绍了搜索引擎的基本原理,对搜索引擎的一些核心技术进行了介绍与深入的分析;介绍了Lucene搜索引擎工具包的架构及其基本使用;对基于开源搜索引擎包 Lucene的搜索框架Sol
代码搜索功能。谷歌最近宣布,他们从Google code移除代码搜索支持。本文将介绍一些代码搜索引擎网站。 Github is a most widely used open source
1. 基于lucene的搜索引擎 2007/07/01 2. 引言 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache
http://www.kuqin.com/opensource/20080806/13483.html
Lucene 索引库的封装。通过 PyLucene 可以用来创建索引和对索引进行搜索。 示例说明: Java 代码: for (int i = 0; i < hits.length(); i++) { Document
Sphider是一个轻量级,采用PHP开发的Web 爬虫和搜索引擎,使用mysql来存储数据。可以利用它来为自己的网站添加搜索功能。Sphider非常小,易于安装和修改,已经有数千网站在使用它。 在线演示地址: