快速,准确的全文搜索引擎:groonga 2.0.8 发布 资讯

Groonga是一个快速、准确、基于倒排索引的全文搜索引擎。新注册的文件立即显示在搜索结果中,并且在更新的时候没有只读锁定。这些特性使得可以将其用作一个性能优越的实时应用程序。它还是一个面向列的数据库管理系统(DBMS),与著名的面向行的系统,如MySQL和PostgreSQL相比,面向列的系统更适合于聚合查询。

jopen 2012-10-29   6547   0
Groonga  

全文搜索引擎,Groonga 2.06 发布 资讯

Groonga 是一款可嵌入式的全文搜寻引擎,具有储存功能和全文搜寻的检索功能。

jopen 2012-08-30   6094   0

分布式搜索引擎,Elasticsearch 1.7.2 发布 资讯

Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

jopen 2015-09-15   15587   0
P21

  搜索引擎系统学习与开发总结-相生昌 文档

现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。

Baggio 2012-06-02   2924   0

6款开发者必备的源代码搜索引擎 经验

借鉴现有的开源项目或开源代码,对于初级开发者来说,不失为一种很好的编程手段,但千万不要单纯地“用”,更多地是理解与提升,这样才会进步。

jopen 2014-04-20   13550   0

基于P2P的搜索引擎:YaCy 经验

YaCy是一个个人的网络爬虫和网络搜索引擎。这也是一个基于P2P的Web索引交换网络没有中央服务器,并没有设限的可能性。网页抓取可以在本地,或者 你可以触发所有其他YaCy同行的网络爬虫来共同协作抓取Web页面。 YaCy可以显示出有趣的文字,图片,音频和视频的搜索结果,并直接链接到OGG,MP3和视频文件。它有一个协作式的书签系统和许多Web发布功能。

jopen 2012-11-08   18871   0

基于NodeJS和Redis的轻量级搜索引擎Reds 经验

Reds 是一个轻量的基于NodeJS和Redis的搜索引擎,由TJ Holowaychuk 开发,这个模块原本是为优化 Kue 搜索能力而开发,但是它也非常适合作为轻量的通用搜索库而加入到Blog、文档系统中去。

jopen 2014-12-24   14431   0

一个简单的nodejs版本开源全文搜索引擎:seamSearch 经验

这篇文章写得很真实。作者讲了自己的心路历程:在他的 startup 失败后,那些原来不愿掏钱的客户、甚至是竞争对手纷纷要求他开源产品;一开始他当然很不爽,当然不愿意开源;后来理性地思考后,还是决定开源了。

jopen 2014-11-25   44219   0

Solr学习总结(七)Solr搜索引擎的整体架构 经验

经过前面一段时间的努力,终于把我所知道的关于solr 的内容都总结完了。前面讲到了solr 的安装配置,web管理后台的使用,solr 的查询参数和查询语法,还说到了solr的客户端 solrnet 的使用,基本用法和Query,Facet,高亮等实际开发中的常用方法。可以说solr的相关的基础的内容,都已经讲到了。

jopen 2016-01-04   11856   0

如何用 Node.js 和 Elasticsearch 构建搜索引擎 经验

Elasticsearch 是一款开源的搜索引擎,由于其高性能和分布式系统架构而备受关注。本文将讨论其关键特性,并手把手教你如何用它创建 Node.js 搜索引擎。

hxud3799 2016-10-13   79157   0

ElasticSearch 1.7.5 发布,分布式搜索引擎 资讯

Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

jopen 2016-02-02   13774   0

起点R3企业级搜索引擎 开源项目

起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下的数据访问控制(ACL),能够通过定义用户数据访问权限来控制检索数据的安全。 R3是一个强大的,高性能的JAVA企业级搜索引擎产品,R3构建于Solr和Lucene之上,集成了POI、PDFBox和Apache Tika等第三方开源项目,在R3企业级搜索平台上,你可以搜索出你企业所有相关的内容包括网站、邮箱、ECM, CRM。R

码头工人 2019-01-17   792   0
P13

  基于搜索引擎优化的策略研究 文档

本文从搜索引擎谈起,介绍了其工作流程以及出现的一些实际问题,从而提出搜索引擎优化。在介绍了搜索引擎优化定义、目的以及价值后,从搜索引擎优化自身的发展、用户行为分析、基于Z39.50的元搜索引擎的应用等方面,对搜索引擎优化的策略进行系统的总结,并针对这三种优化策略提出一系列具体的优化方法,搜索引擎技术优化、个性化服务的丰富与完善、大力发展特色搜索引擎等等。最后,对搜索引擎优化的发展前景进行了展望与总结。

GreenYue 2014-06-08   3842   0
P9

  php面试题 - 某搜索引擎 文档

一、基础及程序题(建议使用你擅长的语言:C/C++、PHP、Java)1.写一个排序算法,可以是冒泡排序或者是快速排序,假设待排序对象是一个维数组。(提示:不能使用系统已有函数,另外请仔细回忆以前学习过的基础知识) 。

workman 2012-02-26   6022   0
P4

  基于HITS算法的搜索引擎概述 文档

摘要:本文简要介绍了目前搜索引擎中应用较为广泛的一种算法——HITS算法。HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。其基本思想是利用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点。HITS算法通过两个评价权值 - 内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。它专注于改善泛指主题检索的结果,通过一定的计算(迭代计算)方法以得到针对某个检索提问的最具价值的网页,即排名最高的authority。

yuchihuo 2012-05-28   4032   0

图片搜索引擎 IMAGE-R3 经验

基于内容的图像检索能有效的对图像进行管理和检索,这项技术既充分体现了图像的信息特点,又充分结合了传统数据库技术,它的应用对解决信息膨胀,有效快速地利用多媒体信息有很好的实用价值。图像的内容包括图像的颜色、纹理、形状等视觉特征和语义特征。

fmms 2012-01-01   18472   0

PHP 文本搜索引擎 Zend Search Lucene 经验

Zend_Search_Lucene 是一个完全由 PHP 5 编写的通用文本搜索引擎。由于其将索引保存在文件系统中而不需要数据库支持,因此它几乎可以为任何由 PHP 驱动的网站增加搜索能力。

fmms 2012-01-01   19895   0

Java桌面搜索引擎 Terrier 经验

Terrier 是一个用来快速开发Web、企业内部网、桌面搜索引擎的软件,是一个模块和的平台用来构建大规模的信息获取应用,提供索引和数据获取功能,提供一个桌面搜索应用。

fmms 2012-01-03   15901   0

搜索引擎爬虫,抓取url的Java源码 经验

搜索引擎爬虫,抓取url的Java源码

fmms 2012-01-18   34944   0

Java企业级搜索引擎 起点R3 经验

起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下的数据访问控制(ACL),能够通过定义用户数据访问权限来控制检索数据的安全。

fmms 2012-01-06   28681   0
1 2 3 4 5 6 7 8 9 10