Hue 3.7 发布,Hadoop 图形化用户界面 资讯

History Simpler interface More details here… HBase Kerberos 支持 Indexer 支持 Zookeeper 配置,如果指向错误的

jopen 2014-11-09   9968   0
Hadoop  

lucene + hadoop 分布式搜索运行框架:Nut 经验

23+lucene3.0.3+eclipse3.6.1+hadoop0.20.2+zookeeper3.3.2+hbase0.20.6+memcached+mongodb+linux 2、特新 a、热插拔 b、可扩展

jopen 2014-01-02   13759   0
P29

  搜索离线生产集群中的流计算 文档

RoleStream RoleStream RoleStream Role分布式消息队列(HQueue等)HBase,iSearch等MySQL DRC, TT等 10. 消息管理Stream Service的设计理念:计算和存储分层,计算之间解耦

defeqw 2015-11-30   546   0

Elasticsearch、MongoDB和Hadoop比较 经验

用分片的技术同样可以完成Hadoop可以做的工作。当然使用众多功能,我们可以在Hadoop之上(Hive、HBase、Pig和同样的一些)你也可 以用多种方式查询Hadoop集群中的数据。 那么,我们现在是否

jopen 2015-05-12   22864   0

携程ELK日志分析平台深耕之路 经验

awk这样的命令,奇幻般的从日志中挖掘出有用的信息;亦或是研发人员往往会基于MySQL,MongoDB,HBase开发自己的日志存储和分析工具。 然而互联网大规模、分布式的特性决定了日志的源头越来越分散,产

qfkw0998 2016-03-01   60447   0
P26

  新浪数据库运维平台演进v1.3 文档

端口1300+,6000+实例孵化于动态平台MySQL和Redis 端口 900+端口MySQL端口1100+,maya 中间层,Hbase服务iDB自助服务系统上线平台规模 15个IDC数据中心 4000+台服务器 600+项目在使用

dcb3 2015-05-19   520   0
报告   SQL  

从未降级的搜索技术 资讯

量或类目划分子机群,下面才是传统的二维行列架构,这带来的好处是查询性能的巨幅优化。 离线集群 HBase 升级 0.98,近 700 台机器的离线集群上各业务线分头开发累积导致集群效率底下,支持售罄率预估也要求我们把调优经验更厚实的

jopen 2014-11-21   5881   0
搜索  

小米11.11:海量数据压力下的推送服务 资讯

再就是数据存储,这里采用了小米的统一 HBase 存储,同时还使用 MySQL 来保存一些量不大,但需要复杂过滤条件的数据(topic 等),并且为了降低对 HBase 的压力,中间还加了一层 Redis

jopen 2014-11-13   11129   0
小米  

Apache Eagle v0.4.0发布,一个高效分布式的流式策略引擎 资讯

added into an application * [EAGLE-339] - Create HBase tables if not exists * [EAGLE-340] - refactor

jopen 2016-07-21   27380   1

对程序员说点实在话 资讯

时有助于看到基于虚拟机的语言的局限,比如HBase的 BlockBuffer本身是提高读取的效率的设计,但因为JVM的堆和GC机制,这个设计可能会拖垮HBase。 这一点同样应该适用于C#&CLR。

jopen 2015-06-19   8790   0

Hadoop年度回顾与2016发展趋势 资讯

统一管理异构存储介质和资源,包括磁盘,SSD,网络,CPU 和 memory,并将这些资源分配给 MapReduce,HBase,甚至 HDFS。 YARN 在2015年,YARN 取得了重大进展,本来准备了 5 个特性,由于时间关系,今天主要介绍三个:

码头工人 2015-12-30   20231   0
Hadoop  

Hadoop - Ambari集群管理剖析 经验

在deploy的过程当中,会出现一些忽略的环境因素,首先是时间同步问题,在HBase集群之间需要保证时间的一致性(或是时间间隔极短),否则,时间不同步,会导致HBase集群异常,因而,这里我们可以事先将时间同步,命令如下所示:

jopen 2015-12-25   256529   0

lucene + hadoop 分布式搜索运行框架 Nut 介绍 经验

23+lucene3.0.3+eclipse3.6.1+hadoop0.20.2+zookeeper3.3.2+hbase0.20.6+memcached+mongodb+linux 2、特新 a、热插拔 b、可扩展

fmms 2012-01-01   43838   0
P2

  Storm 简介 文档

些系统中有的拥有内建数据存储层,这是Storm所没有的,如果需要持久化,可以使用一个类似于Cassandra或Riak这样的外部数据库。 入门的最佳途径是阅读GitHub上的官方《Storm Tutorial》。

wuxiaofeng 2013-06-24   7836   0

Facebook欲做最大开源公司:不会靠卖软件赚钱 资讯

项开源项目,这就让 Facebook 的开源项目总数达到了 225 项。 Apache Cassandra(一种 NoSQL 数据库)、Thrift(为扩展性跨语言服务提供框架)、Apache Hive(建立在

jopen 2014-12-21   5797   0

Pulsar:来自eBay的开源实时分析平台 资讯

件处理进行动态分区,并能够扩展为每秒处理数百万事件;此外,Pulsar能够集成Druid或Cassandra等存储系统; 高可用性:Pulsar具有基于标准的分布式、跨多个数据中心云部署架构,所以在软

n7w77 2015-03-19   10283   0
Pulsar  

Twitter Storm 开源实时Hadoop简介 资讯

会保证消息得到处理。这些系统中有的拥有内建数据存储层,这是 Storm 所没有的,如果需要持久化,可以使用一个类似于 Cassandra 或 Riak 这样的外部数据库。 入门的最佳途径是阅读 GitHub 上的官方 《Storm

码头工人 2011-09-29   18518   0

Oracle 发布 NoSQL 数据库产品 资讯

Oracle rigs MySQL for NoSQL-like access Apache Cassandra ready for the enterprise The Oracle NoSQL Database

fmms 2011-10-24   26799   1
NOSQL  

让程序员干的爽,他们肯定愿意留下 资讯

主要是使用一些有趣的编程语言(如,Clojure、Erlang和 Go语言等),还有就是框架和应用程序(如Hadoop和Cassandra等)。但很多公司都无法满足我们。主要是因为一个公司一旦为他的程序选择了某种语言(如C+ +)

pfmm 2015-11-07   3868   0

使用Spark Streaming进行情感分析 经验

sentiment表可以被任意查询,也可以使用Spark SQL和其他数据源(比如,Cassandra数据等)进行交叉查询。查询DataFrame的列子: sqlContext.sql("select

1 2 3 4 5 6 7 8 9 10