想染指系统架构?看这篇就够了 经验

发布了第一个列型存储数据库Bigtable,它影响了 Hadoop 生态系统中活跃的开源数据库HBase 和 Facebook 的Cassandra。像 BigTable,HBase 和 Cassandra 这样的存储系统将键以字母顺序存储,可以高效地读取键列。

justphb 2017-04-17   70314   0
P11

  大数据方案介绍 文档

ü Storm,流式数据处理 ü Spark/Spark Streaming,内存计算框架 ü HBase,Key-Value数据存储 ü MapReduce,离线批处理计算框架 ü Kafka,消息队列式流失数据接入

guet_lee 2017-01-12   1929   0

亿级用户下的新浪微博平台架构 经验

资源层主要是数据模型的存储,包含通用的缓存资源Redis和Memcached,以及持久化数据库存储MySQL、HBase,或者分布式文件系统TFS以及Sina S3服务。 水平分层有一个特点,依赖关系都是从上往下

jopen 2015-01-20   40751   0

Spark Streaming + Elasticsearch 构建 App 异常监控平台 经验

,我们还使用了另一个开源项目ES SQL提供类SQL查询。ES的运维成本,相对 SQL on HBase方案也要低很多。整个项目开发只用了不到700行代码,开发维护成本还是非常低的。那如此“简单”的系统,可用性可以保证吗?

beuf3754 2016-11-06   22460   0
P24

  如何构建千万级用户的电商系统 文档

2. Zookeeper分布式应用程序协调服务,在很多分布式系统中用到了它 3. Hadoop、Hbase用于存储数据 4. Memcache是一套分布式的高速缓存系统 大部分以及关键技术都是开源项目

gavin_xzw 2017-04-09   581   0
方案   报告   Apache   HTTP   Go  

美团大众点评合并:背后技术力量的对比回顾 资讯

大众点评网因应对大数据查询分析功能,从2011年开始使用Hadoop,有60多个节点,700TB容量,还有2个HBase线上集群。使用 Puppet管理集群,之后由于业务需要,又自行开发了Taurus调度系统。并于2

jopen 2015-10-14   38763   0
大众  

如何让Hadoop结合R语言做统计和大数据分析? 资讯

reaming access)文件系统中的数据。 Hadoop的家族成员:Hive, HBase, Zookeeper, Avro, Pig, Ambari, Sqoop, Mahout, Chukwa

jopen 2015-12-23   48265   0
Hadoop  

Presto:Facebook的分布式SQL查询引擎 资讯

时的另一个要点。在项目的早期阶段, 我们就意识到出了 HDFS 之外,大量数据会被存储在很多其他类型的系统中。 其中一些是像 HBase 一类的为人熟知的系统,另一类则是象 Facebook New Feed 一样的定制的后台。Presto

jopen 2013-11-10   26154   0
Presto  
P45

  基于Hadoop的大数据应用分析 文档

educe任务进行运行 ZooKeeper:高效的,可扩展的协调系统,存储和协调关键共享状态 HBase是一个开源的,基于列存储模型的分布式数据库 HDFS是一个分布式文件系统。有着高容错性的特点,并

xcxc 2015-08-24   782   0

大数据架构:flume-ng+Kafka+Storm+HDFS 实时系统组合 经验

下图为flume典型的体系结构: Flume数据源以及输出方式: Flume提供了从console(控制台)、RPC(Thrift-RPC)、text(文件)、tail(UNIX tail)、syslog(syslog日志系

fefre 2015-07-27   54432   0

flume-ng+Kafka+Storm+HDFS 实时系统搭建 经验

Flume 数据源以及输出方式 : Flume 提供了从 console( 控制台 ) 、 RPC(Thrift-RPC) 、 text( 文件 ) 、 tail(UNIX tail) 、 syslog(syslog

liu0627 2016-02-17   56233   0

Twitter的开源自动化测试工具:Diffy 资讯

Diffy简介 Diffy 是一个开源的自动化测试工具,它能够自动检测基于 Apache Thrift 或者基于HTTP的服务。使用Diffy,只需要进行简单的配置,之后不需要再编写测试代码。

jopen 2015-10-29   11783   0
Diffy  
P33

  淘宝海量数据产品技术架构 文档

2, 3, 4, 5, 6, 7查索引求交集节点21, 2, 4, 6, 7本地SUM运算(Hbase扩展)汇总计算 写入缓存 21. Prom—数据冗余明细数据大量冗余 牺牲磁盘容量,以得到: 避免明细数据网络传输

lanxue1939 2013-06-13   7663   0
软件架构   HTTP   JSON   SQL  

从 0 到 1,一号店通用推荐平台的搭建 经验

栏位的逻辑计算日志通过自主研发的数据回流框架,以HDFS的形式沉淀,并通过数据清洗等步骤写入到HBase中,通过WEB界面展示给网站运营方,来解释线上的栏位是如何推荐商品的,这个平台称为推荐可追溯平台。

路过蜻蜓 2016-09-13   9272   0
P38

  Infinidb 在大数据的实战应用 文档

业务线的反馈 7. 目录背景 InfiniDB的特点 Infinidb的实战 8. Infinidb的定位Hbase等infinidbinfinidb 9. infinidb产品介绍产品特点: Mysql协议兼容

lofe 2015-09-03   468   0
P33

  淘宝海量数据产品技术架构 文档

2, 3, 4, 5, 6, 7查索引求交集节点21, 2, 4, 6, 7本地SUM运算(Hbase扩展)汇总计算 写入缓存 21. Prom—数据冗余明细数据大量冗余 牺牲磁盘容量,以得到: 避免明细数据网络传输

gonow86 2013-01-30   5210   0
软件架构   HTTP   JSON   SQL  

sqoop的安装与使用 经验

#set the path to where bin/hbase is available export HBASE_HOME=/usr/local/hbase #Set the path to where 

jopen 2014-05-29   284329   0

基于大数据与深度学习的自然语言对话 资讯

90+位讲师,16大分论坛,Databricks公司联合创始人、Apache Spark首席架构师辛湜,Hadoop、HBaseThrift项目的PMC成员和Committer、Kudu的发明人Todd Lipcon等海外专家将亲临

jopen 2015-12-04   36649   0

两年内从零到每月十亿 PV 的发展来谈 Pinterest 的架构设计 经验

方案。 集群 —— 所有事情都是自动化的 示例: Cassandra, MemBase, HBase 结论: 太可怕了,不是在现在,可能在将来,但现在太复杂了,有非常多的故障点 属性: 自动化数据分布

jopen 2013-04-20   47543   0
P57

  大数据中心建设方案 文档

安装Hadoop、hbase等Nosql分布式数据库集群,对现有的数据ETL采集、清洗、转换、汇总进来,使用海量数据分布存储技术,用spark、storm等大数据处理软件对hbase中的数据进行分析处

guet_lee 2017-01-12   1207   0
1 2 3 4 5 6 7 8 9 10