开源项目,开源代码,开源文档,开源新闻,开源社区

存储系统负责存储抓取系统和离线处理系统的产出，同时向这两个“厂”提供高性能、大容量的存取服务。目前我们采用的是Hadoop+HBase的体系结构，将网页、链接、图片进行了分类存放。存储系统是一淘存放原料、半成品的“核心仓库”。在

jopen 2014-01-15 25496 0

架构软件架构

一致性)事务策略目前此类产品有facebook 的cassandra,apache hbase,google bigtable等，非常适合一些非结构化的数据，如key-value形式数据存储，具有很好的水平伸缩性

jopen 2013-05-19 58754 0

淘宝

我希望在后Hadoop时代下面这些技术能够更具竞争性。尽管许多Apache社区的项目和商业化Hadoop项目都非常活跃，并以来自HBase、Hive和下一代MapReduce（YARN）的技术不断完善着Hadoop体系，我依然认为，

jopen 2014-08-05 27938 0

Hadoop 分布式/云计算/大数据

擎可以达到更好的性能。并不是所有的数据都要放在关系型数据中。常用的NOSQL有mongodb、hbase、redis，搜索引擎有lucene、solr、elasticsearch。九、将应用服务器进行业务拆分

jopen 2014-09-27 19023 0

系统架构

Hadoop和其他大数据技术也或多或少地在使用Java技术，例如Apache的基于Java的HBase和Accumulo（开源），还有 ElasticSearch。不过Java在此领域并不算是霸主，还有其他技术例如MongoDB则是用C

jopen 2014-12-27 41555 0

Java Java开发

ommon）。在这些组件上层还有一些其他很受欢迎的可选工具，比如运行在HDFS上的数据库（ HBase ）、查询语言平台（Pig）和数据仓库基础结构（Hive）。 Apache Spark 作为

jopen 2015-03-24 17806 0

React.js Java开发

impressions 这两篇博客，也没太好的能下定决心的选择。 1. OpenTSDB 基于HBase，不支持RRD风格的数据精度递减，函数有限比如根本就没有Top N这种功能，运维复杂。 2.

jopen 2015-04-11 66885 0

Graphite

P6

起见，一定要设定一个访问密码. ganglia 3.1.7 安装最近在安装ganglia用于hbase监控，还是有点小麻烦的，步骤如下：第一步：需要下载的包 apr-1.3.2.tar.bz2

baobamboo 2011-12-28 4902 0

系统监控

Atlas和Prometheus被认真考虑过，但在时间上并不可用。我们最终并没有选择OpenTSDB，因为在使用HBase时的糟糕的运行体验。 InfluxDB不成熟，因为它缺乏自助服务的功能，而这正是我们需要推出的。

jopen 2015-12-17 7923 0

Spotify

为此，我们针对前端产品设计了专门的存储层。在这一层，我们有基于MySQL的分布式关系型数据库集群MyFOX和基于HBase的NoSQL存储集群Prom，在后面的文字中，我将重点介绍这两个集群的实现原理。除此之外，其他第三方的模块也被我们纳入存储层的范畴。

jopen 2015-12-31 26083 0

淘宝

里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS，分布式计算系统Hadoop/Hbase等等，分布式的东西都不神秘了。技术的实现在以前可能是问题，现在不是了。对于云计算工程方

jopen 2015-03-25 10045 0

云计算 C/C++

P28

Android/阿里云手机处理JSON MessageQueue传输对象配置文件代替XML 保存数据到磁盘、数据库、Hbase 8. 功能完备支持序列化和反序列化支持循环引用支持泛型能够定制序列化，可以过滤和修改支

patrick002 2015-01-10 471 0

JSON Java XML

P31

Limitations19 20. SequoiaDB vs. MongoDB vs. Cassandra vs. Hbase 高性能支持事务开源为何使用SequoiaDB？20 21. 为何使用Docker+Coreos+SequoiaDB？21零配置

b2f5 2015-06-12 524 0

虚拟化 Dockerfile

P31

7. 大数据实时流计算系统（二）Facebook 的Puma Facebook使用puma和Hbase相结合来处理实时数据,使批处理计算平台具备一定实时计算能力。不过这不算是一个开源的产品。只是内部使用。

nd7b 2015-12-09 6303 0

分布式/云计算/大数据报告 Apache Go

受限于业务，老平台分成了生产邮件和促销邮件两个子平台。对于邮件任务的发送，老促销邮件平台引入了Thrift框架，而老生产邮件平台则通过抢占式更新数据库的方式实现。渲染邮件模板时，老生产使用的是velocity

padge96ytw5 2016-09-08 6221 0

Redis 分布式/云计算/大数据

jar负责连接到nimbus并且上传jar文件。因为topology的定义其实就是一个Thrift结构并且nimbus就是一个Thrift服务，有可以用任何语言创建并且提交topology。上面的方面是用JVM

jopen 2013-07-27 67066 0

分布式/云计算/大数据 Storm

P16

reducer 无法完成的复杂的分析工作。 Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上，控制分隔符，也允许用户指定数据格式。二、 Hive 的下载配置安装安装配置 Hadoop。安装配置数据库（mysql

xsh1019 2013-01-05 692 0

分布式/云计算/大数据

jar负责连接到nimbus并且上传jar文件。因为topology的定义其实就是一个Thrift结构并且nimbus就是一个Thrift服务，有可以用任何语言创建并且提交topology。上面的方面是用JVM

jopen 2014-12-03 25859 0

Storm 分布式/云计算/大数据

快。一开始时我也计划在非JVM的语言中使用Storm。拓扑被定义为 Thrift 的数据结构并提交了一个Thrift的API。除此之外，我设计了一个协议使得spouts和bolts可以在任何语言中的实现。Storm可以应用在其他

jopen 2014-10-27 38619 0

Apache Storm

/2012/12/05/schema-evolution-in-avro-protocol-buffers-thrift.html 1369 / 915 /css/typography.css

jopen 2015-09-11 27066 0

Apache Kafka

一淘网的系统架构经验

淘宝高性能架构简介经验

Hadoop的辉煌还能延续多久？经验

大型网站系统架构演化之路经验

10个使用Java最广泛的现实领域经验

超越线程池：Java并发并没有你想的那么糟糕经验

Graphite的百万Metrics实践之路经验

Install Ganglia in RedHat 5.4 文档

Spotify的监测框架（上）资讯

淘宝数据产品技术架构分析资讯

无论是云计算SaaS,PaaS还是IaaS,拼的都是运维! 问答

Fastjson 介绍文档

Dockerizing SequoiaDB 文档

Storm对于交通数据的处理文档

单日峰值 2T 发送量邮件营销平台实践经验经验

storm 简介及单机版安装指南经验

Hive 学习文档

storm 原理简介及单机版安装指南经验

Apache Storm 的历史及经验教训资讯

[译]从LinkedIn，Apache Kafka到Unix哲学经验

thrift HBase 的相关搜索

关键词

一淘网的系统架构 经验

淘宝高性能架构简介 经验

Hadoop的辉煌还能延续多久？ 经验

大型网站系统架构演化之路 经验

10个使用Java最广泛的现实领域 经验

超越线程池：Java并发并没有你想的那么糟糕 经验

Graphite的百万Metrics实践之路 经验

Install Ganglia in RedHat 5.4 文档

Spotify的监测框架（上） 资讯

淘宝数据产品技术架构分析 资讯