开源项目,开源代码,开源文档,开源新闻,开源社区

在淘宝如订单这块的应用，还有如果你有NoSQL或Hadoop相关知识，他们可能会问NoSQL中HBase中HMaster如何保证单点，Hadoop的一些基本运用，如果你没在简历上写可能不会问的。问题可

码头工人 2011-09-12 25310 0

面试

it there's nothing else to manage (like Redis, HBase, or whatever). It's designed to be distributed and

jopen 2014-01-28 20577 0

开源项目

用。局限性 1、不适合低延迟数据访问高吞吐量可能要求以高延迟作为代价 Hbase可以弥补不足 2、无法高效存储大量小文件文件数量大小的限制由NameNode来决定

fdwm 2015-04-19 17745 0

HDFS 分布式/云计算/大数据

可将节点信息写入Zookeeper的一个znode上；监听这个znode可获取它的实时状态变化典型应用 Hbase中Master状态监控与选举分布式通知/协调分布式环境中，经常存在一个服务需要知道它所管理的子服务的状态；

jopen 2016-01-20 13280 0

分布式/云计算/大数据

P30

Time Stream Processing StormOnline Data Processing HBase, Accumulo Monolithic Resource Management Execution

dfwm 2014-10-19 763 0

分布式/云计算/大数据 Apache Java Scala Go

分布式计算平台最核心的分布式文件系统 HDFS 、 MapReduce 处理过程，以及数据仓库工具 Hive 和分布式数据库 Hbase 的介绍，基本涵盖了 Hadoop 分布式平台的所有技术核心。 HDFS 对外部客户机而

jopen 2015-08-30 15444 0

Hadoop 分布式/云计算/大数据

RocksDB 虽然在代码层面上是在LevelDB原有的代码上进行开发的，但却借鉴了Apache HBase的一些好的idea。在云计算横行的年代，开口不离Hadoop，RocksDB也开始支持HDFS，允许从HDFS读取数据。而

jopen 2015-12-13 83291 0

RocksDB NoSQL数据库

计累计去重指标，那么可能需要采用其它方式，比如：精确统计当天实时累计用户数，一种简单的办法是在HBase中使用计数器来配合完成。其它实时数据消费者如果需要实时统计一小段时间（比如十分钟、一小时

jopen 2015-11-30 50542 0

日志日志处理

性能/重复的权衡，我通常在不同应用场景下选用不同的batch Size。比如使用Flume 的HBase Sink ，经常采用100的Batch Size来降低系统的延迟。而使用HDFS Sink的时候，

ppbi8196 2016-05-05 26387 0

Flume

存储系统负责存储抓取系统和离线处理系统的产出，同时向这两个“厂”提供高性能、大容量的存取服务。目前我们采用的是Hadoop+HBase的体系结构，将网页、链接、图片进行了分类存放。存储系统是一淘存放原料、半成品的“核心仓库”。在

jopen 2014-01-15 25496 0

架构软件架构

我希望在后Hadoop时代下面这些技术能够更具竞争性。尽管许多Apache社区的项目和商业化Hadoop项目都非常活跃，并以来自HBase、Hive和下一代MapReduce（YARN）的技术不断完善着Hadoop体系，我依然认为，

jopen 2014-08-05 27938 0

Hadoop 分布式/云计算/大数据

擎可以达到更好的性能。并不是所有的数据都要放在关系型数据中。常用的NOSQL有mongodb、hbase、redis，搜索引擎有lucene、solr、elasticsearch。九、将应用服务器进行业务拆分

jopen 2014-09-27 19023 0

系统架构

Hadoop和其他大数据技术也或多或少地在使用Java技术，例如Apache的基于Java的HBase和Accumulo（开源），还有 ElasticSearch。不过Java在此领域并不算是霸主，还有其他技术例如MongoDB则是用C

jopen 2014-12-27 41555 0

Java Java开发

ommon）。在这些组件上层还有一些其他很受欢迎的可选工具，比如运行在HDFS上的数据库（ HBase ）、查询语言平台（Pig）和数据仓库基础结构（Hive）。 Apache Spark 作为

jopen 2015-03-24 17806 0

React.js Java开发

P6

起见，一定要设定一个访问密码. ganglia 3.1.7 安装最近在安装ganglia用于hbase监控，还是有点小麻烦的，步骤如下：第一步：需要下载的包 apr-1.3.2.tar.bz2

baobamboo 2011-12-28 4902 0

系统监控

Atlas和Prometheus被认真考虑过，但在时间上并不可用。我们最终并没有选择OpenTSDB，因为在使用HBase时的糟糕的运行体验。 InfluxDB不成熟，因为它缺乏自助服务的功能，而这正是我们需要推出的。

jopen 2015-12-17 7923 0

Spotify

为此，我们针对前端产品设计了专门的存储层。在这一层，我们有基于MySQL的分布式关系型数据库集群MyFOX和基于HBase的NoSQL存储集群Prom，在后面的文字中，我将重点介绍这两个集群的实现原理。除此之外，其他第三方的模块也被我们纳入存储层的范畴。

jopen 2015-12-31 26083 0

淘宝

里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS，分布式计算系统Hadoop/Hbase等等，分布式的东西都不神秘了。技术的实现在以前可能是问题，现在不是了。对于云计算工程方

jopen 2015-03-25 10045 0

云计算 C/C++

P28

Android/阿里云手机处理JSON MessageQueue传输对象配置文件代替XML 保存数据到磁盘、数据库、Hbase 8. 功能完备支持序列化和反序列化支持循环引用支持泛型能够定制序列化，可以过滤和修改支

patrick002 2015-01-10 471 0

JSON Java XML

P31

7. 大数据实时流计算系统（二）Facebook 的Puma Facebook使用puma和Hbase相结合来处理实时数据,使批处理计算平台具备一定实时计算能力。不过这不算是一个开源的产品。只是内部使用。

nd7b 2015-12-09 6303 0

分布式/云计算/大数据报告 Apache Go

淘宝面试记资讯

10大最新的开源项目资讯

Hadoop分布式文件系统HDFS介绍经验

大数据(六) - ZooKeeper 经验

Tez - 下一代Hadoop上的执行引擎文档

细细品味大数据--初识hadoop 经验

RocksDB介绍：一个比LevelDB更彪悍的引擎经验

记录一下互联网日志实时收集和实时计算的简单方案经验

Apache Flume 性能调优 (第一部分) 经验

一淘网的系统架构经验

Hadoop的辉煌还能延续多久？经验

大型网站系统架构演化之路经验

10个使用Java最广泛的现实领域经验

超越线程池：Java并发并没有你想的那么糟糕经验

Install Ganglia in RedHat 5.4 文档

Spotify的监测框架（上）资讯

淘宝数据产品技术架构分析资讯

无论是云计算SaaS,PaaS还是IaaS,拼的都是运维! 问答

Fastjson 介绍文档

Storm对于交通数据的处理文档

Cassandra hbase 的相关搜索

关键词

淘宝面试记 资讯

10大最新的开源项目 资讯

Hadoop分布式文件系统HDFS介绍 经验

大数据(六) - ZooKeeper 经验

Tez - 下一代Hadoop上的执行引擎 文档

细细品味大数据--初识hadoop 经验

RocksDB介绍：一个比LevelDB更彪悍的引擎 经验

记录一下互联网日志实时收集和实时计算的简单方案 经验

Apache Flume 性能调优 (第一部分) 经验

一淘网的系统架构 经验

Hadoop的辉煌还能延续多久？ 经验

大型网站系统架构演化之路 经验

10个使用Java最广泛的现实领域 经验

超越线程池：Java并发并没有你想的那么糟糕 经验