开源项目,开源代码,开源文档,开源新闻,开源社区

P32

1. Hadoop学习笔记(纲要) 2. 主要内容1、HDFS 2、MapReduce 3、HBase 3. 为什么要提出云计算1、从一些趋势入手； 2、并行计算现在存在的一些问题； 4. 云计算和其他技术的对比1、对比

lenhan12345 2012-11-27 576 0

Hadoop 分布式/云计算/大数据

P10

32-220.el6.x86_64 o hadoop-1.0.2 o hive-0.8.1 o hbase-0.92.1 o Oracle 11g_r2（64位） o KVM o MySQL-server-5

lenhan12345 2012-11-27 7980 0

Hadoop 分布式/云计算/大数据报告

是什么 == Wasp 是阿里集团开发的基于 HBase 的一个数据库方案，其根本出发点是仿效 Google 的 Megastore ，“在HBase系统上不牺牲线性拓展能力的同时又能提供跨行事务、索引、SQL的功能”

jopen 2014-04-01 10936 0

WASP

P25

5业务场景模拟 7 3.1.6客户端 8 3.1.7其它特性 9 3.1.8待研究 9 3.2HBase数据库介绍 9 3.2.1简介 9 3.2.2安装配置 11 3.2.3备份恢复 12 3.2.4集群部署

xfei365 2014-01-03 623 0

NoSQL数据库报告 SQL

P31

离线系统—集群概况发展主要阶段1.x2010.08 Hadoop-0.20.2+HBase-0.20.51.x~2.x2012.12 HDFS-2.0 + MR-1 + HBase-0.922013.07 MR-1 + iStream

byc2 2014-11-19 1874 0

Hadoop 分布式/云计算/大数据方案 Java SQL

stories at read time”。 FB的众多产品、模块，通讯协议自然用自家的Thrift，还用到SMC和其他的底层平台。存储模块，有自家的“排序”存储文件（feed要按时间倒排

ygfb 2015-12-07 42067 0

网站

P34

自建与开源的折中自建：没有精力开源：被绑架对待开源系统的态度作为组件而不是框架选择Thrift 19. Thrift/ThriftEX 定制传输层/协议层性能优化路由、存储、调试定制序列化方式，总线adaptor，列压缩

n5em 2015-06-05 539 0

方案 Java

要把N个超级大表导入HBase，N是按月来分的，表：亿+的行数，100+的字段。测试过sqoop，JDBC，性能都不满意，对任务失败重做也很麻烦，HBase的批量导出还靠谱点，但这样导入HBase有几个麻烦的地方：

openkk 2012-08-31 22642 0

分布式/云计算/大数据 Hadoop

P50

高可用 NoSQL在不太影响性能的情况，就可以方便的实现高可用的架构。比如Cassandra，HBase模型，通过复制模型也能实现高可用。大数据量，高性能 NoSQL数据库都具有非常高的读写性能，尤

wei5445 2012-03-21 748 0

NoSQL数据库方案 Apache C/C++ Go

P26

ach HBase来对每天数十亿的消息信息进行处理支持。这篇论文描述了Facebook在众多系统中(比如Apache Cassandra，Voldemort)最终选择了Hadoop和HBase的原因，

huafenged 2012-07-11 532 0

分布式/云计算/大数据

平移是指迁移前后数据组织形式不变，比如Mysql从1个实例扩展为4个实例，Redis从4个端口扩展到16个端口，HBase从20台机器扩展到 30台机器等等。如果在最初的设计里就为以后的扩容缩容提供了方便，那么数据迁

jopen 2015-02-15 14003 0

经验

APIs可大幅削减代码量。正因为如此，Pig仍然是吸引大量的软件开发人员。改善数据访问：HBase、Sqoop以及Flume Hadoop核心还是一套批处理系统，数据加载进HDFS、处

fmms 2012-02-21 67402 0

Hadoop 分布式/云计算/大数据

P3

hadoop.hbase.client.RegionOfflineException: region offline: lm,,1288597709144 网上说，将/hbase删除；重启hbase后，可

419133824 2012-02-18 5004 0

Hadoop 分布式/云计算/大数据

P20

hadoopSqoop Bigtable Nosql 2. Hadoop主要子项目介绍（Pig Zookeeper Hbase Sqoop Avro Chukwa Cassandra ）Hive 现在Hadoop已经发

706394187 2015-05-23 807 0

分布式/云计算/大数据方案报告 Apache Go

Titan的数据需要存在一个数据库里面，而用户可以选择以下几种数据库： - Cassandra - HBase - BerkeleyDB B. Titan 底层的实现需要索引的支持： - Elasticsearch

jopen 2014-10-01 106868 0

Titan

环境变量版本四安装 & 启动 HBASE 1：Download & Start 进入pinpoint/quickstart/bin目录，执行 sh start-hbase.sh 2：Initialize

jopen 2016-01-06 67574 0

CentOS

些常见的和高级的Spark Streaming功能，然后加载活动有关的统计数据到Apache HBase，用不喜欢的 BI 用具来绘图分析。 ( Sessionization 指的是捕获的单一访问者的

jopen 2015-06-22 21976 0

Spark Hadoop 分布式/云计算/大数据

format”—there is no such thing. Hive works equally well on Thrift, control delimited, or your specialized data formats

jopen 2014-08-31 63675 0

Hive 数据挖掘

在Airbnb上协调GraphQL和Thrift (medium.com) Airbnb frontend engineers需要GraphQL的快速迭代和灵活性，而backend engineers需要Thrift的稳定性

五嘎子 2018-06-05 36816 0

Android 安卓开发周刊开发者周刊 Android开发移动开发

P17

Hadoop 升级 OSD及CRUSH算法 11. Hive使用2009年3月调研,4月投入生产 CLI与Thrift Server并用 Web/SSH 界面模板化 & 预加载 86个统一发布UDF Lineage

qooxdoo 2010-11-28 5389 0

淘宝分布式/云计算/大数据淘宝分布式数据处理实践方案 Java

Hadoop 学习笔记(纲要) 文档

Hadoop 集群测试报告文档

粗看WASP ：Alibaba的海量数据分布式数据库探索经验

NoSQL 研究及选型报告文档

基于Hadoop生态技术构建阿里搜索离线系统文档

几个大型网站的Feeds(Timeline)设计简单对比经验

人人网服务化与架构变迁v3 (1) 文档

hadoop执行分布式Process 经验

NoSQL 综述文档

Facebook 海量数据处理论文文档

在线数据迁移经验：如何为正在飞行的飞机更换引擎经验

Hadoop - 你不得不了解的大数据工具经验

hadoop常见错误总结文档

Hadoop 主要子项目介绍文档

图数据库 Titan 快速入门经验

centos 6 下pinpoint搭建经验

怎样利用Spark Streaming和Hadoop实现近实时的会话连接经验

Hive深入浅出经验

Android Weekly #312 安卓开发周刊中文版经验

淘宝分布式数据处理实践文档

thrift HBase 的相关搜索

关键词

Hadoop 学习笔记(纲要) 文档

Hadoop 集群测试报告 文档

粗看WASP ：Alibaba的海量数据分布式数据库探索 经验

NoSQL 研究及选型报告 文档

基于Hadoop生态技术构建阿里搜索离线系统 文档

几个大型网站的Feeds(Timeline)设计简单对比 经验

人人网服务化与架构变迁v3 (1) 文档

hadoop执行分布式Process 经验

NoSQL 综述 文档

Facebook 海量数据处理论文 文档

在线数据迁移经验：如何为正在飞行的飞机更换引擎 经验

Hadoop - 你不得不了解的大数据工具 经验

hadoop常见错误总结 文档

Hadoop 主要子项目介绍 文档

图数据库 Titan 快速入门 经验

centos 6 下pinpoint搭建 经验

怎样利用Spark Streaming和Hadoop实现近实时的会话连接 经验

Hive深入浅出 经验

Android Weekly #312 安卓开发周刊 中文版 经验

淘宝分布式数据处理实践 文档

thrift HBase 的相关搜索

关键词

Hadoop 集群测试报告文档

粗看WASP ：Alibaba的海量数据分布式数据库探索经验

NoSQL 研究及选型报告文档

基于Hadoop生态技术构建阿里搜索离线系统文档

几个大型网站的Feeds(Timeline)设计简单对比经验

NoSQL 综述文档

Facebook 海量数据处理论文文档

在线数据迁移经验：如何为正在飞行的飞机更换引擎经验

Hadoop - 你不得不了解的大数据工具经验

hadoop常见错误总结文档

Hadoop 主要子项目介绍文档

图数据库 Titan 快速入门经验

centos 6 下pinpoint搭建经验

怎样利用Spark Streaming和Hadoop实现近实时的会话连接经验

Hive深入浅出经验

Android Weekly #312 安卓开发周刊中文版经验

淘宝分布式数据处理实践文档