登录   注册
所有分类  >  软件开发  >  搜索引擎
  内容摘要 用户评价 浏览量 分享时间

基于Redis的Python搜索引擎 pyredise

pyredise 是一个基于 Python 和 Redis 的简单快速的搜索引擎。 ...

66次 3 周 前

使用lingpipe自然语言处理包进行文本分类

TrainTClassifier,基于TF/IDF算法的分类器,必须先把要语料库放到各自所属的分类文件夹中,比如:与金融相关的文章就放到金融这个文件夹中,我这的根目录是f:/data/category,训练完后会生成一个分类器模型 tclassifier,之后其它文本的分类的确定就是通过它。...

250次 2 个月 前

分布式搜索方案选型

分布式搜索方案选型之一:Solr <br> 分布式搜索方案选型之二:Solandra <br> 分布式搜索方案选型之三:SolrCloud <br> 分布式搜索方案选型之四:Solr+Katta <br> ...

618次 2 个月 前

Lucene3.0详解

对于搜索,按被搜索的资源类型,分为两种:可以转为文本的、多媒体类型。我们上一节提到的搜索功能都是搜索的可以转为文本的资源(第一种)。注意,百度或谷歌提供的音乐或视频搜索不是多媒体搜索,他们是按文件名搜索。在智能手机上有一款音乐搜索的软件,可以让他听10秒钟的音乐,然后他就能上网找出这段音乐的名称、演奏者等信息。这是多媒体搜索。 ...

292次 2 个月 前

.Net实时分布式搜索引擎 Lucandra.NET

Lucandra.NET 是 .NET 版的 Lucandra (Solandra) ...

192次 2 个月 前

Solr可视化工具 Explain.solr.pl

Explain.solr.pl 是一个 Solr 的可视化工具,用来帮助你分析为什么一个文档会出现在搜索结果列表中。 ...

218次 2 个月 前

分布式搜索方案 - SolrCloud

SolrCloud是基于Solr和Zookeeper的分布式搜索方案,是正在开发中的Solr4.0的核心组件之一,它的主要思想是使用Zookeeper作为集群的配置信息中心。...

440次 2 个月 前

Nutch+Hadoop集群搭建

Apache Nutch是一个用于网络搜索的开源框架,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。 ...

1344次 3 个月 前

基于Lucene框架 Compass 的使用例子

基于Lucene框架 Compass 的使用例子 ...

1001次 3 个月 前

搜索引擎 Summa

Summa是一种由java开发的,快速模块化和可扩展的搜索引擎...

152次 3 个月 前

Solr基于.Net的客户端 - Solr.Net

Solr基于.Net的客户端...

564次 3 个月 前

Solr开发文档

Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇文章中,将介绍 Solr 并展示如何轻松地将其表现优异的全文本搜索功能加入到 Web 应用程序中。 ...

934次 3 个月 前

企业搜索解决方案 Constellio

Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。 ...

240次 4 个月 前

企业搜索系统 Rivulet ES

Rivulet ES 是一个开源的企业搜索系统,基于 Lucene 和 Solr ,提供基于 XML/HTTP 和 JSON API 接口。主要特性有命中高亮显示、faceted搜索、缓存、复制以及Web管理接口。 ...

276次 4 个月 前

Java企业级搜索引擎 起点R3

起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下的数据访问控制(ACL),能够通过定义用户数据访问权限来控制检索数据的安全。 ...

351次 4 个月 前

通用网页正文抽取 cx-extractor

对于Web信息检索来说,网页正文抽取是后续处理的关键。 虽然使用正则表达式可以准确的抽取某一固定格式的页面,但面对形形色色的HTML,使用规则处理难免捉襟见肘。能不能高效、准确的将一个页面的正文抽取出来,并做到在大规模网页范围内通用,这是一个直接关系上层应用的难题。 ...

513次 4 个月 前

JSON/REST 搜索服务器 RestPose

RestPose 是一个搜索引擎,主要设计用来保存大量的问题,并通过给定的查询对文档进行搜索,并根据匹配排名进行排序。...

196次 4 个月 前

开源的 Solr 插件 MontySolr

MontySolr 是一个开源的 Solr 插件,他可以让程序在 Solr 中添加 Python 代码。你可以用 Java 调用 Python 的方法,也可以用 Python 来控制绝大部分 Solr 的操作。 ...

334次 4 个月 前

全文检索实验系统 zettair

zettair 是全文检索界鼎鼎大名的大牛:Justin Zobel,以他的研究成果为基础的全文检索实验系统。 ...

245次 4 个月 前

Java搜索引擎 MG4J

MG4J 是另一个搜索引擎。与Lucene 主要区别是,它提供了cluster 功能,具有更OO的设计方式。 ...

266次 4 个月 前
最新文档 - 更多