一淘网的系统架构 经验

存储系统负责存储抓取系统和离线处理系统的产出,同时向这两个“厂”提供高性能、大容量的存取服务。目前我们采用的是Hadoop+HBase的体系结构,将网页、链接、图片进行了分类存放。存储系统是一淘存放原料、半成品的“核心仓库”。 在

jopen 2014-01-15   25496   0

淘宝高性能架构简介 经验

一致性)事务策略 目前此类产品有facebook 的cassandra,apache hbase,google bigtable等,非常适合一些非结构化的数据,如key-value形式数据存储,具有很好的水平伸缩性

jopen 2013-05-19   58754   0
淘宝  

Hadoop的辉煌还能延续多久? 经验

我希望在后Hadoop时代下面这些技术能够更具竞争性。 尽 管许多Apache社区的项目和商业化Hadoop项目都非常活跃,并以来自HBase、Hive和下一代MapReduce(YARN)的技术不断完善 着Hadoop体系,我依然认为,

jopen 2014-08-05   27938   0

大型网站系统架构演化之路 经验

擎可以达到更好的性能。并不是所有的数据都要放在关系型数据中。常用的NOSQL有mongodb、hbase、redis,搜索引擎有lucene、solr、elasticsearch。 九、将应用服务器进行业务拆分

jopen 2014-09-27   19023   0

10个使用Java最广泛的现实领域 经验

Hadoop和其他大数据技术也或多或少地在使用Java技术,例如Apache的基于Java的HBase和Accumulo(开源),还有 ElasticSearch。不过Java在此领域并不算是霸主,还有其他技术例如MongoDB则是用C

jopen 2014-12-27   41555   0

超越线程池:Java并发并没有你想的那么糟糕 经验

ommon)。 在这些组件上层还有一些其他很受欢迎的可选工具,比如运行在HDFS上的数据库( HBase )、查询语言平台(Pig)和数据仓库基础结构(Hive)。 Apache Spark 作为

jopen 2015-03-24   17806   0

Graphite的百万Metrics实践之路 经验

impressions 这两篇博客,也没太好的能下定决心的选择。 1. OpenTSDB 基于HBase,不支持RRD风格的数据精度递减,函数有限比如根本就没有Top N这种功能,运维复杂。 2.

jopen 2015-04-11   66885   0
P6

  Install Ganglia in RedHat 5.4 文档

起见,一定要设定一个访问密码. ganglia 3.1.7 安装 最近在安装ganglia用于hbase监控,还是有点小麻烦的,步骤如下: 第一步:需要下载的包 apr-1.3.2.tar.bz2  

baobamboo 2011-12-28   4902   0

Spotify的监测框架(上) 资讯

Atlas和Prometheus被认真考虑过,但在时间上并不可用。我们最终并没有选择OpenTSDB,因为在使用HBase时的糟糕的运行体验。 InfluxDB不成熟,因为它缺乏自助服务的功能,而这正是我们需要推出的。

jopen 2015-12-17   7923   0
Spotify  

淘宝数据产品技术架构分析 资讯

为此,我们针对前端产品设计了专门的存储层。在这一层,我们有基于MySQL的分布式关系型数据库集群MyFOX和基于HBase的NoSQL存储集群Prom,在后面的文字中,我将重点介绍这两个集群的实现原理。除此之外,其他第三方的模块也被我们纳入存储层的范畴。

jopen 2015-12-31   26083   0
淘宝  

无论是云计算SaaS,PaaS还是IaaS,拼的都是运维! 问答

里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS,分布式计算系 统Hadoop/Hbase等等,分布式的东西都不神秘了。技术的实现在以前可能是问题,现在不是了。 对于云计算工程方

jopen 2015-03-25   10045   0
P28

  Fastjson 介绍 文档

Android/阿里云手机处理JSON MessageQueue传输对象 配置文件代替XML 保存数据到磁盘、数据库、Hbase 8. 功能完备支持序列化和反序列化 支持循环引用 支持泛型 能够定制序列化,可以过滤和修改 支

patrick002 2015-01-10   471   0
JSON   Java   XML  
P31

  Dockerizing SequoiaDB 文档

Limitations19 20. SequoiaDB vs. MongoDB vs. Cassandra vs. Hbase 高性能 支持事务 开源为何使用SequoiaDB?20 21. 为何使用Docker+Coreos+SequoiaDB?21零配置

b2f5 2015-06-12   524   0
P31

  Storm对于交通数据的处理 文档

7. 大数据实时流计算系统(二)Facebook 的Puma Facebook使用puma和Hbase相结合来处理实时数据,使批处理计算平台具备一定实时计算能力。 不过这不算是一个开源的产品。只是内部使用。

nd7b 2015-12-09   6303   0

单日峰值 2T 发送量邮件营销平台实践经验 经验

受限于业务,老平台分成了 生产邮件和促销邮件 两个子平台。对于邮件任务的发送, 老促销邮件平台引入了Thrift框架 ,而老生产邮件平台则通过抢占式更新数据库的方式实现。 渲染邮件模板时, 老生产使用的是velocity

padge96ytw5 2016-09-08   6221   0

storm 简介及单机版安装指南 经验

jar负责连接到nimbus并且上传jar文件。 因为topology的定义其实就是一个Thrift结构并且nimbus就是一个Thrift服务, 有可以用任何语言创建并且提交topology。上面的方面是用JVM

jopen 2013-07-27   67066   0
P16

  Hive 学习 文档

reducer 无法完成的复杂的分析工作。 Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允许用户指定数据格式。 二、 Hive 的下载配置安装 安装配置 Hadoop。安装配置数据库(mysql

xsh1019 2013-01-05   692   0

storm 原理简介及单机版安装指南 经验

jar负责连接到nimbus并且上传jar文件。 因为topology的定义其实就是一个Thrift结构并且nimbus就是一个Thrift服务, 有可以用任何语言创建并且提交topology。上面的方面是用JVM

jopen 2014-12-03   25859   0

Apache Storm 的历史及经验教训 资讯

快。 一开始时我也计划在非JVM的语言中使用Storm。拓扑被定义为 Thrift 的 数据结构并提交了一个Thrift的API。除此之外,我设计了一个协议使得spouts和bolts可以在任何语言中的实现。Storm可以应用在其他

jopen 2014-10-27   38619   0

[译]从LinkedIn,Apache Kafka到Unix哲学 经验

/2012/12/05/schema-evolution-in-avro-protocol-buffers-thrift.html 1369 / 915 /css/typography.css

jopen 2015-09-11   27066   0
1 2 3 4 5 6 7 8 9 10