P32

  Hadoop 学习笔记(纲要) 文档

1. Hadoop学习笔记(纲要) 2. 主要内容1、HDFS 2、MapReduce 3、HBase 3. 为什么要提出云计算1、从一些趋势入手; 2、并行计算现在存在的一些问题; 4. 云计算和其他技术的对比1、对比

lenhan12345 2012-11-27   576   0
P10

  Hadoop 集群测试报告 文档

32-220.el6.x86_64 o hadoop-1.0.2 o hive-0.8.1 o hbase-0.92.1 o Oracle 11g_r2(64位) o KVM o MySQL-server-5

lenhan12345 2012-11-27   7980   0

粗看WASP :Alibaba的海量数据分布式数据库探索 经验

是什么 == Wasp 是阿里集团开发的基于 HBase 的一个数据库方案,其根本出发点是仿效 Google 的 Megastore ,“在HBase系统上不牺牲线性拓展能力的同时又能提供跨行事务、索引、SQL的功能”

jopen 2014-04-01   10936   0
WASP  
P25

  NoSQL 研究及选型报告 文档

5业务场景模拟 7 3.1.6客户端 8 3.1.7其它特性 9 3.1.8待研究 9 3.2HBase数据库介绍 9 3.2.1简介 9 3.2.2安装配置 11 3.2.3备份恢复 12 3.2.4集群部署

xfei365 2014-01-03   623   0
P31

  基于Hadoop生态技术构建阿里搜索离线系统 文档

离线系统—集群概况发展主要阶段1.x2010.08 Hadoop-0.20.2+HBase-0.20.51.x~2.x2012.12 HDFS-2.0 + MR-1 + HBase-0.922013.07 MR-1 + iStream

byc2 2014-11-19   1874   0

几个大型网站的Feeds(Timeline)设计简单对比 经验

stories at read time”。 FB的众多产品、模块,通讯协议自然用自家的Thrift,还用到SMC和其他的底层平台。 存储模块,有自家的“排序”存储文件(feed要按时间倒排

ygfb 2015-12-07   42067   0
网站  
P34

  人人网服务化与架构变迁v3 (1) 文档

自建与开源的折中 自建:没有精力 开源:被绑架 对待开源系统的态度 作为组件而不是框架 选择Thrift 19. Thrift/ThriftEX 定制传输层/协议层 性能优化 路由、存储、调试 定制序列化方式,总线adaptor,列压缩

n5em 2015-06-05   539   0
方案   Java  

hadoop执行分布式Process 经验

要把N个超级大表导入HBase,N是按月来分的,表:亿+的行数,100+的字段。测试过sqoop,JDBC,性能都不满意,对任务失败重做也很麻烦,HBase的批量导出还靠谱点,但这样导入HBase有几个麻烦的地方:

openkk 2012-08-31   22642   0
P50

  NoSQL 综述 文档

高可用 NoSQL在不太影响性能的情况,就可以方便的实现高可用的架构。比如Cassandra,HBase模型,通过复制模型也能实现高可用。 大数据量,高性能 NoSQL数据库都具有非常高的读写性能,尤

wei5445 2012-03-21   748   0
P26

  Facebook 海量数据处理论文 文档

ach HBase来对每天数十亿的消息信息进行处理支持。这篇论文描述了Facebook在众多系统中(比如Apache Cassandra,Voldemort)最终选择了Hadoop和HBase的原因,

huafenged 2012-07-11   532   0

在线数据迁移经验:如何为正在飞行的飞机更换引擎 经验

平移是指迁移前后数据组织形式不变,比如Mysql从1个实例扩展为4个实例,Redis从4个端口扩展到16个端口,HBase从20台机器扩 展到 30台机器等等。如果在最初的设计里就为以后的扩容缩容提供了方便,那么数据迁

jopen 2015-02-15   14003   0
经验  

Hadoop - 你不得不了解的大数据工具 经验

APIs可大幅削减代码量。正因为如此,Pig仍然是吸引大量的软件开发人员。 改善数据访问:HBase、Sqoop以及Flume Hadoop核心还是一 套批处理系统,数据加载进HDFS、处

fmms 2012-02-21   67402   0
P3

  hadoop常见错误总结 文档

hadoop.hbase.client.RegionOfflineException: region offline: lm,,1288597709144   网上说,将/hbase删除;重启hbase后,可

419133824 2012-02-18   5004   0
P20

  Hadoop 主要子项目介绍 文档

hadoopSqoop Bigtable Nosql 2. Hadoop主要子项目介绍(Pig Zookeeper Hbase Sqoop Avro Chukwa Cassandra )Hive 现 在Hadoop已经发

706394187 2015-05-23   807   0

图数据库 Titan 快速入门 经验

Titan的数据需要存在一个数据库里面,而用户可以选择以下几种数据库: - Cassandra - HBase - BerkeleyDB B. Titan 底层的实现需要索引的支持: - Elasticsearch

jopen 2014-10-01   106868   0
Titan  

centos 6 下pinpoint搭建 经验

环境变量版本 四 安装 & 启动 HBASE 1:Download & Start 进入pinpoint/quickstart/bin目录,执行 sh start-hbase.sh 2:Initialize

jopen 2016-01-06   67574   0
CentOS  

怎样利用Spark Streaming和Hadoop实现近实时的会话连接 经验

些常见的和高级的Spark Streaming功能,然后加载活动有关的统计数据到Apache HBase,用不喜欢的 BI 用具来绘图分析。 ( Sessionization 指的是捕获的单一访问者的

jopen 2015-06-22   21976   0

Hive深入浅出 经验

format”—there is no such thing. Hive works equally well on Thrift, control delimited, or your specialized data formats

jopen 2014-08-31   63675   0

Android Weekly #312 安卓开发周刊 中文版 经验

在Airbnb上协调GraphQL和Thrift (medium.com) Airbnb frontend engineers需要GraphQL的快速迭代和灵活性,而backend engineers需要Thrift的稳定性

P17

  淘宝分布式数据处理实践 文档

Hadoop 升级 OSD及CRUSH算法 11. Hive使用2009年3月调研,4月投入生产 CLI与Thrift Server并用 Web/SSH 界面 模板化 & 预加载 86个统一发布UDF Lineage

1 2 3 4 5 6 7 8 9 10