开源项目,开源代码,开源文档,开源新闻,开源社区

History Simpler interface More details here… HBase Kerberos 支持 Indexer 支持 Zookeeper 配置，如果指向错误的

jopen 2014-11-09 9968 0

Hadoop

23+lucene3.0.3+eclipse3.6.1+hadoop0.20.2+zookeeper3.3.2+hbase0.20.6+memcached+mongodb+linux 2、特新 a、热插拔 b、可扩展

jopen 2014-01-02 13759 0

Nut 搜索引擎

P29

RoleStream RoleStream RoleStream Role分布式消息队列(HQueue等)HBase,iSearch等MySQL DRC, TT等 10. 消息管理Stream Service的设计理念：计算和存储分层，计算之间解耦

defeqw 2015-11-30 546 0

搜索引擎 SQL

用分片的技术同样可以完成Hadoop可以做的工作。当然使用众多功能，我们可以在Hadoop之上（Hive、HBase、Pig和同样的一些）你也可以用多种方式查询Hadoop集群中的数据。那么，我们现在是否

jopen 2015-05-12 22864 0

分布式/云计算/大数据 ElasticSearch

awk这样的命令，奇幻般的从日志中挖掘出有用的信息；亦或是研发人员往往会基于MySQL,MongoDB,HBase开发自己的日志存储和分析工具。然而互联网大规模、分布式的特性决定了日志的源头越来越分散，产

qfkw0998 2016-03-01 60447 0

Logstash 日志分析日志处理

P26

端口1300+，6000+实例孵化于动态平台MySQL和Redis 端口 900+端口MySQL端口1100+，maya 中间层，Hbase服务iDB自助服务系统上线平台规模 15个IDC数据中心 4000＋台服务器 600+项目在使用

dcb3 2015-05-19 520 0

报告 SQL

量或类目划分子机群，下面才是传统的二维行列架构，这带来的好处是查询性能的巨幅优化。离线集群 HBase 升级 0.98，近 700 台机器的离线集群上各业务线分头开发累积导致集群效率底下，支持售罄率预估也要求我们把调优经验更厚实的

jopen 2014-11-21 5881 0

搜索

再就是数据存储，这里采用了小米的统一 HBase 存储，同时还使用 MySQL 来保存一些量不大，但需要复杂过滤条件的数据（topic 等），并且为了降低对 HBase 的压力，中间还加了一层 Redis

jopen 2014-11-13 11129 0

小米

added into an application * [EAGLE-339] - Create HBase tables if not exists * [EAGLE-340] - refactor

jopen 2016-07-21 27380 1

eBay Hadoop Apache Eagle

时有助于看到基于虚拟机的语言的局限，比如HBase的 BlockBuffer本身是提高读取的效率的设计，但因为JVM的堆和GC机制，这个设计可能会拖垮HBase。这一点同样应该适用于C#&CLR。

jopen 2015-06-19 8790 0

程序员

统一管理异构存储介质和资源，包括磁盘，SSD，网络，CPU 和 memory，并将这些资源分配给 MapReduce，HBase，甚至 HDFS。 YARN 在2015年，YARN 取得了重大进展，本来准备了 5 个特性，由于时间关系，今天主要介绍三个：

码头工人 2015-12-30 20231 0

Hadoop

在deploy的过程当中，会出现一些忽略的环境因素，首先是时间同步问题，在HBase集群之间需要保证时间的一致性（或是时间间隔极短），否则，时间不同步，会导致HBase集群异常，因而，这里我们可以事先将时间同步，命令如下所示：

jopen 2015-12-25 256529 0

Hadoop 分布式/云计算/大数据

23+lucene3.0.3+eclipse3.6.1+hadoop0.20.2+zookeeper3.3.2+hbase0.20.6+memcached+mongodb+linux 2、特新 a、热插拔 b、可扩展

fmms 2012-01-01 43838 0

搜索引擎 Hadoop Lucene

P2

些系统中有的拥有内建数据存储层，这是Storm所没有的，如果需要持久化，可以使用一个类似于Cassandra或Riak这样的外部数据库。入门的最佳途径是阅读GitHub上的官方《Storm Tutorial》。

wuxiaofeng 2013-06-24 7836 0

分布式/云计算/大数据

项开源项目，这就让 Facebook 的开源项目总数达到了 225 项。 Apache Cassandra（一种 NoSQL 数据库）、Thrift（为扩展性跨语言服务提供框架）、Apache Hive（建立在

jopen 2014-12-21 5797 0

Facebook

件处理进行动态分区，并能够扩展为每秒处理数百万事件；此外，Pulsar能够集成Druid或Cassandra等存储系统；高可用性：Pulsar具有基于标准的分布式、跨多个数据中心云部署架构，所以在软

n7w77 2015-03-19 10283 0

Pulsar

会保证消息得到处理。这些系统中有的拥有内建数据存储层，这是 Storm 所没有的，如果需要持久化，可以使用一个类似于 Cassandra 或 Riak 这样的外部数据库。入门的最佳途径是阅读 GitHub 上的官方《Storm

码头工人 2011-09-29 18518 0

云计算

Oracle rigs MySQL for NoSQL-like access Apache Cassandra ready for the enterprise The Oracle NoSQL Database

fmms 2011-10-24 26799 1

NOSQL

主要是使用一些有趣的编程语言（如，Clojure、Erlang和 Go语言等），还有就是框架和应用程序（如Hadoop和Cassandra等）。但很多公司都无法满足我们。主要是因为一个公司一旦为他的程序选择了某种语言（如C+ +）

pfmm 2015-11-07 3868 0

程序员

sentiment表可以被任意查询，也可以使用Spark SQL和其他数据源（比如，Cassandra数据等）进行交叉查询。查询DataFrame的列子： sqlContext.sql("select

AnjaBrother 2016-05-24 19380 0

情感分析分布式/云计算/大数据 Spark Streaming

Hue 3.7 发布，Hadoop 图形化用户界面资讯

lucene + hadoop 分布式搜索运行框架：Nut 经验

搜索离线生产集群中的流计算文档

Elasticsearch、MongoDB和Hadoop比较经验

携程ELK日志分析平台深耕之路经验

新浪数据库运维平台演进v1.3 文档

从未降级的搜索技术资讯

小米11.11：海量数据压力下的推送服务资讯

Apache Eagle v0.4.0发布，一个高效分布式的流式策略引擎资讯

对程序员说点实在话资讯

Hadoop年度回顾与2016发展趋势资讯

Hadoop - Ambari集群管理剖析经验

lucene + hadoop 分布式搜索运行框架 Nut 介绍经验

Storm 简介文档

Facebook欲做最大开源公司：不会靠卖软件赚钱资讯

Pulsar：来自eBay的开源实时分析平台资讯

Twitter Storm 开源实时Hadoop简介资讯

Oracle 发布 NoSQL 数据库产品资讯

让程序员干的爽，他们肯定愿意留下资讯

使用Spark Streaming进行情感分析经验

Cassandra hbase 的相关搜索

关键词

Hue 3.7 发布，Hadoop 图形化用户界面 资讯

lucene + hadoop 分布式搜索运行框架：Nut 经验

搜索离线生产集群中的流计算 文档

Elasticsearch、MongoDB和Hadoop比较 经验

携程ELK日志分析平台深耕之路 经验

新浪数据库运维平台演进v1.3 文档

从未降级的搜索技术 资讯

小米11.11：海量数据压力下的推送服务 资讯

Apache Eagle v0.4.0发布，一个高效分布式的流式策略引擎 资讯

对程序员说点实在话 资讯

Hadoop年度回顾与2016发展趋势 资讯

Hadoop - Ambari集群管理剖析 经验

lucene + hadoop 分布式搜索运行框架 Nut 介绍 经验

Storm 简介 文档

Facebook欲做最大开源公司：不会靠卖软件赚钱 资讯

Pulsar：来自eBay的开源实时分析平台 资讯

Twitter Storm 开源实时Hadoop简介 资讯

Oracle 发布 NoSQL 数据库产品 资讯

让程序员干的爽，他们肯定愿意留下 资讯

使用Spark Streaming进行情感分析 经验