Java开源搜索引擎,Apache Lucene 4.0-alpha 发布 资讯

previously scattered across Lucene core, contrib, and Solr. These modules also include additional functionality

jopen 2012-07-03   11230   0
Lucene  

Apache Lucene 5.0发布,不再兼容3.X系列版本 资讯

ChangeLog 。此外,基于Lucene的Solr也更新到了5.0版本,主要在易用性、维护操作、分布式集群等方面进行了改进,读者可以登录其 官网 了解相关信息。目前,除了Solr外,还有有众多著名的开源项目基于Lucene实现,如

jopen 2015-02-25   13029   0
Lucene  

Lucene3.0 的几种分词系统 博客

实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的 TokenizerFactory 以方便在 Lucene 和 Solr 中使用。 MMSeg 算法有两种分词方法: Simple

openkk 2010-10-24   4678   0
Storm   ODF  

开源大数据处理工具汇总(下) 经验

简介 :SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机

jopen 2016-01-05   77527   0

大数据实时处理:百分点实时计算架构和算法 经验

NoSQL数据库(Redis、MongoDB、HBase)、分布式消息队列(Apache Kafka)、分布式搜索引擎(Apache Solr) 以及必不可少的Apache Zookeeper。 数据处理层由四个部分组成。其中Web应

jopen 2014-03-01   101750   0

ElasticSearch详解与优化设计 经验

;能够达到实时搜索,稳定,可靠,快速。和Apache Solr一样,它也是基于Lucence的索引服务器,而ElasticSearch对比Solr的优点在于: 轻量级:安装启动方便,下载文件之后一条命令就可以启动。

jopen 2016-01-05   115893   0

Django搜索模块:Haystack 经验

Django 框架的搜索扩展模块。Haystack 提供统一的 API 允许你使用不同的搜索后端,包括 Solr, Elasticsearch, Whoosh, Xapian 等等。 要求: Python

jopen 2012-12-13   30584   0

开源的图片共享社区:Photographer.io 经验

4.0 服务器平台 Ruby 2.0 PostgreSQL 9+ Redis Memcached Solr 外部服务 Amazon S3 and CloudFront 项目主页: http://www

jopen 2013-07-08   74471   0

Carrot2 开源项目

Search、Alexa Web Search、PubMed、OpenSearch、Lucene index、SOLR)获取搜索结果。

码头工人 2019-01-17   855   0

基于NoSQL技术的内容仓库 Lily 经验

的内容仓库(content repository)。它是基于Apache的 HBase(存储)和Solr(索引/搜索),并提供了大型内容集合存储与检索的解决方案。可运用在门户网站,内容管理系统,及时搜索,档案应用,文案管理,等等。

fmms 2012-04-01   15908   0

Java分布式爬去:spider 经验

使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。

jopen 2016-01-11   11930   0

企业搜索解决方案 Constellio 经验

Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。

fmms 2012-01-06   17907   0

SpringBoot项目推荐 经验

项目框架, 持久化使用JPA+Hibernate springboot-ssh 三、支持Solr 5.4.0版本的IK分词. IK-Analyzer 以上为第一个版本,有问题再改咯

chl696 2016-02-13   21108   0

搜索结果聚类引擎 - Carrot2 经验

Search、Alexa Web Search、PubMed、OpenSearch、Lucene index、SOLR)获取搜索结果。 项目主页: http://www.open-open.com/

fmms 2012-01-01   51428   0

JavaScript全文搜索引擎:lunr.js 经验

为您的客户端应用程序提供一个简单的全文搜索引擎。类似 Solr。示例代码: //定义索引 var idx = lunr(function () { this.field('title', { boost:

jopen 2013-03-05   40676   0

Hadoop和Hadoop的生态系统资源列表:Awesome Hadoop 经验

StorageHanlder https://github.com/chimpler/hive-solr https://github.com/bfemiano/accumulo-hive-storage-manager

jopen 2014-10-15   40861   0

Apache HBase 2015年发展回顾与未来展望 资讯

Cloudera 自带的 Solr,发现服务器 memory CPU 开销太大。 HBase 的随机读性能不足为在线服务提供缓存服务,可以考虑使用 Redis 或者 Memcache。Solr 应该是做全文索引服务,这应该和

jopen 2016-01-03   22798   0
HBase  

1号店11.11:分布式搜索引擎的架构实践 资讯

下面我们针对这些设计要点分别展开。 分布式搜索引擎 1号店分布式搜索引擎是Lucene/Solr核心的,结合SOA框架Hedwig构建了一层分布式框架,支持搜索请求的分发和合并,并且构建了搜索

jopen 2015-11-12   13371   0

Java招聘 问答

年以上开发工作经验, 本科 软件知识结构全面,算法基本功扎实,有良好 的 Java 基础 有 Solr & Lucene 的开发经验 熟悉 SQL 语言,有 MySQL 的开发经验 有 Hadoop

monica1018 2014-10-13   14698   0

Nutch 1.6 即将发布,Java搜索引擎 资讯

x分支持已经实现了Apache Gora,因此它可以将爬虫爬回来的数据存储至SQL/NoSQL,而不只是存至 SOLR(1.x版本实现方式)。最新的2.x版本,2.1 已经于10月5号发布。 关于Nutch的介绍请查看:

jopen 2012-11-28   10293   0
nutch  
1 2 3 4 5 6 7 8 9 10