C语言的搜索引擎 DataparkSearch 经验

DataparkSearch 搜索引擎是一个 C 语言的全功能的开源基于Web的搜索引擎。

fmms 2012-01-01   34470   0

使用wukong全文搜索引擎 经验

wukong,是一款golang实现的高性能、支持中文分词的全文搜索引擎。我个人觉得它最大的特点恰恰是不像ElasticSearch那样庞大和功能完备,而是可以以一个Library的形式快速集成到你的应用或服务中去,这可能也是在当前阶段选择它的最重要原因,当然其golang技术栈也是让我垂涎于它的另外一个原因。

zzsyg0306 2016-12-06   30258   0

迅搜全文搜索引擎 XunSearch 资讯

迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。支持海量数据高速检索,功能强大,简单易用! 本项目旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。

fmms 2011-09-09   22144   0

开源的PHP搜索引擎 - Yioop! 资讯

Yioop! 是一个开源的搜索引擎采用PHP开发,使用MySQL或SQLite 来自存储数据。 它可以配置抓取任何页面或指定链接地址范围或对限制URL数量,可用它搭建一个网站的搜索引擎(如Google自定义搜索)。 利用其提供的默认安装程序,每天可以抓取和索引数百万的页面。还可以通过运行更多的爬虫(支持分布式)增加每天抓取和索引的页面数。

码头工人 2011-08-31   24255   1

13 款开源的全文搜索引擎 资讯

主要介绍13款现有的开源搜索引擎,你可以将它们用在你的项目中以实现检索功能。

jopen 2013-04-02   520316   0

搜索引擎如何改变我们的大脑 资讯

Google 一开始只是做了一个微不足道的搜索引擎,然而经过多年发展,它现在已经成为了一个巨无霸。 Google 的触角伸向四面八方,它打造了一系列影响我们生活的产品——比如说 Gmail 、 Google Maps 、 Android 与 Chrome 。在 Google 新扩张的版图中, Alphabet 公司正在开发无人驾驶汽车和手术机器人,这些前沿产品有望改变我们的生活。

m47g 2015-08-30   6741   0

Crawlzilla - 基于集群的搜索引擎 经验

Crawlzilla是一个基于集群的搜索引擎部署工具。它可以帮助用户建立集群中的搜索引擎,提供了管理机制(如:集群管理,爬管理,索引池管理)。

jopen 2012-10-12   19525   0

基于Redis的Python搜索引擎 pyredise 经验

pyredise 是一个基于 Python 和 Redis 的简单快速的搜索引擎。

fmms 2012-04-29   18220   0

MySQL全文搜索引擎:mysqlcft 经验

MySQL在高并发连接、数据库记录数较多的情况 下,SELECT ... WHERE ... LIKE '%...%'的全文搜索方式不仅效率差,而且以通配符%开头作查询时,使用不到索引,需要全表扫描,对数据库的压力也很大。MySQL针对这一问题提供 了一种全文索引解决方案,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索。但是,至今为 止,MySQL对中文全文索引无法正确支持。

jopen 2012-11-28   46768   0

13 款开源的全文搜索引擎 经验

主要介绍13款现有的开源搜索引擎,你可以将它们用在你的项目中以实现检索功能。

yg3n 2015-06-04   25487   0

BT搜索引擎:ssbc 经验

作为最早在国内研究和实践DHT爬虫的人,我的灵感是来自芬兰Helsinki大学的这篇论文: Real-World Sybil Attacks in BitTorrent Mainline DHT 英文好的同学应该很容易读懂,跟我写的不到300行的爬虫代码大致原理一样。初次接触DHT网络的可以结合我之前的文章阅读,或者拜读Kevin Lynx的博客。所以具体原理在这里就不再阐述了。

sdww 2015-07-18   21676   0
P9

  基于内容的图像搜索引擎 文档

基于内容的图像检索。摘要:常人在平日的生活中只能记住自己听到过内容的10%,记住自己阅读过内容的30%,却能记住自己看过内容的80%。视觉是人类获得信息的重要途径。越来越多的图像搜索引擎亮相公众,人们的图片检索更加快捷。本文介绍了基于内容图像检索技术的原理及基于这些原理的近几年出现的图像搜索引擎。关键词:搜索引擎;图像检索;

wushijie 2014-02-28   4473   0

全文搜索引擎 groonga 经验

Groonga 是一个全文搜索引擎和一个基于列的存储数据库。

openkk 2011-12-15   19452   0

迅搜全文搜索引擎 XunSearch 经验

帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。

fmms 2012-01-01   78522   0

.NET全文搜索引擎 HubbleDotNet 经验

HubbleDotNet 是一个基于.net framework 的开源的全文搜索数据库项目。HubbleDotNet提供了基于SQL的全文检索接口,使用者只需会操作SQL,就可以很快学会使用HubbleDotNet进行全文检索。

fmms 2012-01-01   28455   0

全文搜索引擎库 Apache Lucy 经验

Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。目前该项目还只是 Apache 基金会的孵化项目。

fmms 2012-01-03   14704   0

Hawk搜索引擎平台 开源项目

Hawk搜索引擎平台是面向中小型网站,可以定制的垂直搜索引擎平台。本搜索引擎平台目标是方便用户搭建站内搜索、某个领域的垂直搜索、以及检索个人文档以及自己关注的网站信息的桌面搜索等应用领域。它改造自Lucene,Hadoop和Nutch系统,是纯Java的搜索平台软件,可以运行于Windows及Linux等平台,具备基本的抓取、索引和检索功能。 平台特点简介 对网页进行深度抓取和分析,自定义抓取规则

码头工人 2019-01-17   726   0

本地文件搜索引擎:Everything 经验

Everything 是一个速度极快,用于搜索本地文件及文件包的工具,出门居家旅行必备。比windows 内置的搜索功能好用,支持正则表达式搜索。

jopen 2015-11-04   5382   0

C++搜索引擎 CLucene 经验

CLucene是Lucene的一个C++端口,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。

openkk 2011-12-30   42772   0
P648

  搜索引擎核心技术与实现 文档

搜索引擎开发实战:基于Lucene和Solr 。本章首先概要的介绍搜索引擎的总体结构和基本模块,然后会介绍其中的最核心的模块:全文检索的基本原理。为了尽快普及搜索引擎开发技术,本章介绍的搜索引擎结构可以采用开源软件实现。为了通过实践来深入了解相关技术,本章中会介绍相关的开发环境。本书介绍的搜索技术使用Java编程语言实现,之所以没有采用性能可能会更好的C/C++,是希望读者不仅能够快速完成相关的开发任务,而且可以把相关实践作为一个容易上手的游戏。另外,为了集中关注程序的基本逻辑,书中的Java代码去掉了一些错误和异常处理,实际可以运行的代码可以在本书附带的光盘中找到。在以后的各章中会深入探索搜索引擎的每个组成模块。

lxfsbxh 2012-05-11   790   0
1 2 3 4 5 6 7 8 9 10