大数据处理方面的 7 个开源搜索引擎 资讯

其他语言提供索引兼容的实现 2. Apache Solr Apache Solr (读音: SOLer) 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache

jopen 2013-04-04   54524   0

mmseg4j 开源项目

MMSeg 算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。MMSeg 算法有两种分词方法:Simple和Compl

码头工人 2019-01-17   513   0

.Net实时分布式搜索引擎 Lucandra.NET 经验

+ Lucene Solandra = Solr + Cassandra Solandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建

openkk 2012-03-07   23944   0

13 款开源的全文搜索引擎 资讯

官方主页: https://www.indexdata.com/zebra 11.  Solr Solr是一个用java开发的独立的企业级搜索应用服务器,它提供了类似于Web-service的

jopen 2013-04-02   520316   0

13 款开源的全文搜索引擎 经验

官方主页:https://www.indexdata.com/zebra 11.  Solr Solr是一个用java开发的独立的企业级搜索应用服务器,它提供了类似于Web-service

yg3n 2015-06-04   25487   0
P24

  如何构建千万级用户的电商系统 文档

ZooKeeper应用案例HDFS HA(QJM) Solr Hbase Lily Lily是一个分布式数据管理平台,它基于Hadoop、HBase、Solr、ZooKeeper实现。使用ZooKeeper来注册Lily

gavin_xzw 2017-04-09   581   0
方案   报告   Apache   HTTP   Go  

Lucene开发实例:Lucene中文分词 经验

下载solr 3.6.1:  http://lucene.apache.org/solr/(编译IK Analyzer时需引用包) OK,将lucene 、solr 相关包(lucene-core-3

NoSQL 的 ORM 框架,Apache Gora 0.6.1 发布 资讯

issues ,包含 gora-mongodb 模块大量的改进和修复。同时还修复了 Apache Solr 相关的一个重要 bug,新增 gora-gradle 插件 和 Gora Spark 后端支持

jopen 2015-09-16   9092   0

Apache Gora 0.6 发布,NoSQL 的 ORM 框架 资讯

org/gora-0.6 >,还有一些重要的改进,新功能和依赖升级。最值得关注的是 Hadoop,HBase 和 Solr 依赖升级,还有关于 MongoDB 模块的重要 bug 修复。 Gora 建议支持的数据库如下:

jopen 2015-02-21   9740   0

开源的全文搜索服务器:Fess 经验

FESS基于Java的全文搜索服务器。Fess采用 Seasar2 框架+ Apache Solr 构建。Fess还提供了一个爬虫 S2Robot ,可以抓取网络或本地文件系统上的文件,并支持多种文件格式,如MS

jopen 2013-06-25   14361   0

企业搜索系统 Rivulet ES 经验

Lucene 和 Solr ,提供基于 XML/HTTP 和 JSON API 接口。主要特性有命中高亮显示、faceted搜索、缓存、复制以及Web管理接口。 功能特性 And Solr the same

fmms 2012-01-06   23513   0

基于P2P的搜索引擎:YaCy 1.2 发布 资讯

的书签系统和许多Web发布功能。 YaCy现在有一个嵌入式的Solr4.0.0,并集成标准Solr的XML搜索界面。这是现在主要的索引引擎。该版本增加了主机的浏览器来浏览抓取主机的

jopen 2012-11-08   7784   0
YaCy  

Java 分布式中文分词组件,word v1.3.1 发布 资讯

控制分词结果,还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、 Solr、ElasticSearch、Luke集成。 word 1.3.1这个版本是从代码分支 ForElasticsearch1

jopen 2015-10-05   12527   0
word  

NoSQL 的 ORM 框架,Apache Gora 0.5 发布 资讯

功能,支持多个 Hadoop 版本;改进了 Accumulo 认证;改进了大量模块的文档;实现了可插式的 solr,支持 HttpSolrServer http 的默认值。 此版本现提供 http(Http

jopen 2014-09-20   7325   0

1、Spring Boot简介 经验

spring-boot-starter-data-solr Support for the Apache Solr search platform, including spring-data-solr. spring-boo

cy8989 2016-01-28   207998   0

Java企业级搜索引擎 起点R3 经验

权限来控制检索数据的安全。 R3是一个强大的,高性能的JAVA企业级搜索引擎产品,R3构建于Solr和Lucene之上,集成了POI、PDFBox和 Apache Tika等第三方开源项目,在R3

fmms 2012-01-06   28681   0

Java企业搜索平台:起点R3(Rivulet ES) V5.0 正式开源 博客

权限来控制检索数据的安全。 R3是一个强大的,高性能的JAVA企业级搜索引擎产品,R3构建于Solr和Lucene之上,集成了POI、PDFBox和Apache Tika等第三方开源项目,在R3企

jaddy0302 2011-03-10   1810   0

Apache Lucene 6.1.0 发布,全文索引引擎工具包 资讯

and the uninverting package have been moved to Solr. (Mike McCandless) 优化 LUCENE-7071 : Reduce bytes

jopen 2016-06-18   24243   0

几种常见的基于Lucene的开源搜索解决方案对比 博客

Time search )搜索方案的可扩展性有待进一步完善 二 Solr ( http://lucene.apache.org/solr/ ) 说明:基于 Lucene 的企业级搜索的开箱即用的解决方案

openkk 2012-08-23   4505   0

nutch2.0初体验------三大亮点 资讯

ment,去掉搜索、索引的功能,交给第三方做。 5.重写solr索引去重 所有操作都通过webtable来进行,同时避免从solr中检索数据。 6.各种新功能 如:支持网站地图,规范标

jopen 2012-06-02   17048   0
nutch  
1 2 3 4 5 6 7 8 9 10