携程ELK日志分析平台深耕之路 经验

如下是一个Openstack日志的分析示例面板: Elasticsearch是基于Lucene的,对于日志的所有字段都可以索引,并且其倒排索引的数据结构非常紧凑,搜索效率非常的高。Elasticsearch的Facet

qfkw0998 2016-03-01   60447   0

Apache Mahout中推荐算法Slope one源码分析 经验

Mahout中Slope one的设计思路以及代码实现 先简单介绍下,Mahout是Apache的一个开源项目,由Lucene项目组和Hadoop项目组分离出来,它实现了推荐引擎中的大部分经典算法,有兴趣的朋友可以研究研究

fmms 2012-02-11   58092   0

在Ubuntu/Fedora/CentOS中安装Gitblit 经验

folder sizes in 11 msecs 2015-01-10 09:16:55 [INFO ] Lucene will process indexed branches every 2 minutes.

jopen 2015-03-25   48163   0

Kafka Zero-Copy 使用分析 经验

对象是啥呢?其实就是对应的一个Topic的Partition. 一个Partition是由很多端(Segment)组成的,这和Lucene非常相似。一个Segment就是一个文件。实际的数据自然是从这里读到的。代码如下: val fetchInfo

DanHelmick 2016-01-31   10018   0
Kafka  

新浪网/系统架构师饶琛琳:那一年,我毕业了 资讯

request。Puppet作者原先是CFengine开发人员,Elasticsearch作者至今还是Lucene的committer。可以说: 在你没有把一个流行的开源软件深入了解到能把优缺点都列明白的时候

jopen 2015-07-06   14831   0

盘点大数据生态圈,那些繁花似锦的开源项目 资讯

Echarts等等。此外,加之Cassandra、HBase、MongoDB、Redis等NoSQL,Lucene、Solr、 ElasticSearch等搜索技术,Docker等容器技术,ZooKeeper

jopen 2015-09-11   33463   0
P10

  elasticsearch学习入门 文档

这几年,搜索的开发门槛越来越低,每个语言都有开源的检索工具包,而且功能越来越全,完整的解决方案也越来越多、越来越好用,比如lucene上就有solr, elasticsearch, sensei等。它们对于绝大部分的需求应该说都

wuce7758 2014-07-14   7570   0

LinkedIn的架构演进之路 经验

va RPC通信。大约正是这个时候,他们产生了搜索功能需求。他们的会员图服务开始向一个新的运行Lucene的搜索服务提供数据。 只读副本数据库随着网站的发展,Leo的功能越来越多,复杂性也越来越高

JustinY 2016-02-11   38879   0

TOP 13 大最热开源微服务 Java 框架 经验

Restlet 集成了 JavaMail 库;为防构建大量文本索引和元数据,Restlet 集成了 Lucene 和 Solr。 Restlet 不需要使用 JSON,因为代码可以处理 XML、CSV、YAML

码头工人 2019-01-03   12690   0

对程序员说点实在话 资讯

了,如果你没有这个知识渠道,应该不会认识到ETL、数据挖掘和倒排索引的意思,可能你已经熟练的修改、添加、编译 lucene 了。 但是,再好的知识,离开了实践,均不会得到升华,认为一个好的程序员,应该关注代码和实现,但应该摒弃简单copy原则,虽然

jopen 2015-06-19   8790   0

Linkedin 体系结构进化史 经验

feeding data into a new search service running Lucene . Replica read DBs As the site grew, so did Leo

jopen 2015-07-24   16878   0

几个大型网站的Feeds(Timeline)设计简单对比 经验

tolerant, protocol-agnostic RPC system)。 搜索引擎使用了Lucene。存储也大量使用了Redis。 ③人人网 参考《人人网Feed系统结构浅析.pdf》和《人

ygfb 2015-12-07   42067   0
网站  

基于MySQL实现按距离排序、范围查找 经验

com/cn/articles/depth-study-of-Symfony2 http://tech.meituan.com/lucene-distance.html http://blog.csdn.net/liminlu03

wang3065 2016-01-29   12685   0
P8

  SolrCloud 整合Tomcat手册 文档

Solr服务版本:solr4.0 http://mirror.bit.edu.cn/apache/lucene/solr/4.0.0/ Tomcat服务器版本:tomcat7.0.11 2 操作步骤 2.1

lcc0739 2013-11-28   3094   0

大型网站系统架构演化之路 问答

不是所有的数据都要放在关系型数据中。常用的NOSQL有mongodb和redis,搜索引擎有 Lucene 。 九、将应用服务器进行业务拆分 随着业务进一步扩展,应用程序变得非常臃肿,这时我们

jopen 2015-07-19   14552   1

Rails 中的全文搜索 经验

的SQL查询应对这样的查询需求,但有时,更有效的是使用搜索引擎。 Solr是Apache Lucene项目中的一个流行的搜索平台。其主要功能包括强大的全文搜索,点击显示,分面搜索,近实时索引,动态

jopen 2014-05-09   14383   0

大型网站系统架构演化之路 经验

数据都要放在关系型数据中。常用的NOSQL有mongodb、hbase、redis,搜索引擎有lucene、solr、elasticsearch。 九、将应用服务器进行业务拆分 随着业务进一步

jopen 2014-09-27   19023   0
P7

  Elasticsearch 分布式搜索配置文件详解 文档

 Elasticsearch是一个开源的分布式实时搜索与分析引擎,支持云服务。它是基于Apache Lucene搜索引擎的类库创建的,提供了全文搜索能力、多语言支持、专门的查询语言、支持地理位置服务、基于上

afreon 2015-08-04   612   0

程序猿找工作吐槽分享 资讯

写简历是个纯技术活,如果没有 github,没有技术博客,扯几个你熟悉的一些来源项目是很有帮助的,比如 nginx,lucene,redis 等等这些,前提是你真的了解过这些开源项目,否则遇到懂行的面试官,一问三不知就尴尬了。

jopen 2014-11-08   20966   1
P39

  Mahout in Action 中文版 文档

Mahout项 目开始于2008年,作为Apache Lucene的子项目,Apache Lucene项目是大家熟知的开源搜索引擎。Lucene提供了搜索、文本挖掘和信息检索的高级实现。在计算机科学领域,这些概念和机器学习技术近似,像

Mon 2013-12-01   5643   0
1 2 3 4 5 6 7 8 9 10