Elasticsearch学习笔记 经验

根据官网自己的介绍,Elasticsearch是一个分布式搜索服务,提供Restful API,底层基于Lucene,采用多shard的方式保证数据安全,并且提供自动resharding的功能,加之github等大型的站点也采用

jopen 2015-05-08   139138   0
P13

  开源搜索引擎solr应用培训教程 文档

门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择: 基于Lucene自己进行封装实现站内搜索。工作量及扩展性都较大,不采用。 调用Google、Baidu的API

zxh116116 2013-04-22   9247   0
P19

  SOLR搭建企业搜索平台 文档

org/download-60.cgi 下载solr:http://apache.etoak.com/lucene/solr/1.4.0/ 详情请见:http://wiki.apache.org/solr/Solr1

我是第一de 2011-10-03   3869   0
P19

  solr安装部署平台搭建 文档

org/download-60.cgi 下载solr:http://apache.etoak.com/lucene/solr/1.4.0/ 详情请见:http://wiki.apache.org/solr/Solr1

wandern 2013-12-24   5756   0

NoSQL 数据存储系统 Blur 经验

Blur 是一个 NoSQL 数据存储系统,基于 lucene、hadoop、thrift 和 Zookeeper 构建的,包含一系列的分片的 lucene 索引,可跨越多个服务器存储。 这里 有一篇介绍入门的文章。

openkk 2011-12-01   19881   0

Bobo 开源项目

bobo-browse是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。 比如说搜索电脑,可以得到cpu是intel的有几条命中记录,cpu是amd的有几条命中记录。

码头工人 2019-01-17   877   0

Blur 开源项目

Blur 是一个 NoSQL 数据存储系统,基于 lucene、hadoop、thrift 和 Zookeeper 构建的,包含一系列的分片的 lucene 索引,可跨越多个服务器存储。 这里 有一篇介绍入门的文章。

码头工人 2019-01-17   753   0

ElasticSearch优化设计 经验

大家可能会遇到索引数据比较慢的过程。其实明白索引的原理就可以有针对性的进行优化。ES索引的过程到相对Lucene的索引过程多了分布式数据的扩展,而这ES主要是用tranlog进行各节点之间的数据平衡。所以从

Cha1681 2016-02-11   10757   0

Java分布式中文分词组件word分词v1.2发布 资讯

准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch、Luke插件。 API在线文档: word 1.0

xg48 2015-04-10   27874   0

垂直搜索引擎中的分词系统 经验

重视。同时,通用的可选开源搜索引擎框架或解决方案也越来越多,如著名的Lucene,Solr,ElasticSearch等。打造一套完美适应自身业 务需求的搜索引擎是个具有挑战性的任务,而且无论选择Lucene,Solr这些搜索引擎框架、方

jopen 2015-06-18   45479   0

Java NoSQL数据库,OrientDB 1.7 发布 资讯

最新新闻:OrientDB1.7 发布了!OrientDB比以前有新的令人兴奋的功能,如分布式分片,对Lucene的索引支持(全文及地理空间),SSL连接,并行查询和更快速。 下载 OrientDB 1.7

jopen 2014-05-27   12816   0

ElasticSearch 最新版本 2.20 发布了 资讯

Elasticsearch的更新速度实在太快了,16年2月2日更新到了2.2版本,首先看一下这个版本增加了哪些新的特性。首先是基于Lucene 5.4.1,修复了Elasticsearch 2.1.2和Elasticsearch 1.7

jopen 2016-02-04   10991   0
P5

  Solr:强大的企业级搜索引擎平台 文档

Solr:强大的企业级搜索引擎平台 - Solr是Lucene下面的一个用Java写的开源子工程项目,它是一个非常强大的企业级搜索平台,它的主要特征包括强大的全文检索、高亮显示、分面搜索、动态聚类、

fengyong 2011-06-17   8969   0

Elasticsearch 2.20 使用环境说明 经验

FS(简单文件系统) Simplefs类型是一个简单的实现随机访问文件的文件存储系统(映射到Lucene SimpleFsDirectory的)。该实现的并发性能较差(多线程是个瓶颈)。当你需要将索引持久化时,最好使用niofs。

njshdf2p 2016-02-06   18306   0

Hadoop之父Doug Cutting 资讯

生活中,可能所有人都间接用过他的作品,他是 Lucene、Nutch 、Hadoop 等项目的发起人。是他,把高深莫测的搜索技术形成产品,贡献给普罗大众;还是他,打造了目前在云计算和大数据领域里如日中天的

jopen 2013-04-25   23794   0
Hadoop  

LIRE 开源项目

LIRE(Lucene Image REtrieval)提供一种的简单方式来创建基于图像特性的Lucene索引。利用该索引就能够构建一个基于内容的图像检索(content-based image re

码头工人 2019-01-17   410   0

mmseg4j 开源项目

Tsai 的 MMSeg 算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。MMSeg 算法有两种分词方法:Si

码头工人 2019-01-17   513   0

ElasticSearch详解与优化设计 经验

ES索引我们可以理解为数据入库的一个过程。我们知道ES是基于Lucene框架的一个分布式检索平台。索引的同样也是基于Lucene创建的,只不过在其上层做了一些封装。ElasticSearch客户

jopen 2016-01-05   115893   0

LIUS 开源项目

LIUS是一个基于Jakarta Lucene项目的索引框架。LIUS为Lucene添加了对许多文件格式的进行索引功能如: Ms Word,Ms Excel,Ms PowerPoint,RTF,PDF

码头工人 2019-01-17   9818   0

重复数据删除引擎 Duke 0.6 发布 资讯

新的cleaners, 一些bug修复,Lucene 更新至 3.6.1和配置方面一些改进。 下图是 Duke 的架构: Duke 是一个基于 Lucene 开发,快速灵活的去除重复数据的引擎,可以在

jopen 2012-09-16   5977   0
Duke  
1 2 3 4 5 6 7 8 9 10