开源项目,开源代码,开源文档,开源新闻,开源社区

语言「Pig」、类似 SQL 语法查询功能的「Hive」、专门用在 Hadoop 上的资料库系统「HBase」等。 Hadoop 生态系：对 Hadoop 有初步的认识后，如果想进一步学习相关的

jopen 2015-03-13 25945 0

Hadoop 分布式/云计算/大数据

标包括：HDFS、Hive、Logger、Thrift、IRC、File Roll、Null、HBase、MorphlineSolr、ElasticSearch、Kite Dataset、Kafka、Custom(自定义)

jopen 2015-07-01 130478 0

Flume 日志处理

P11

javascript helloworld hadoop mapreduce java hadoop hbase 当出现org.apache.hadoop.hdfs.server.namenode.SafeModeException:

zhangbc 2013-09-06 757 0

Hadoop 分布式/云计算/大数据

P7

一个可扩展的多master的，避免单节点失效的数据库 Chukwa:一个用于管理大规模分布式系统的数据集系统 HBase: 一个可扩展的，分布的数据库，支持对大表的结构化数据的存储 Hive:一个数据仓库的基础设施，提供数据汇总和特定查询。

xsh1019 2013-01-05 3560 0

Hadoop 分布式/云计算/大数据

P30

分布式文件系统HDFS MapReduce框架并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具ChukwaHadoop生态系统

lxz 2014-01-03 3863 0

Hadoop 分布式/云计算/大数据方案 SQL Go

P19

移动网关JOS授权API个人数据存储家居健康长连接网关核心模型媒体车载设备联动引擎DB缓存云云存储语义解析引擎HBASE基本架构云海 8. 智能云超级APPhttps://gw.smart.jd.com长连接服务De

g4mm 2015-04-24 3968 0

方案

impala与hadoop生态结合紧密（1） HDFS是impala最主要的数据源。除此之外， impala也支持HBase，甚至支持S3存储。（2） impala表定义存储在hive metastore中，支持读取hive表定义。

er74 2015-07-26 61584 0

分布式/云计算/大数据 Impala

全部耦合在一起，也造成维护成本进一步加大。比如之前一些服务开发中碰到的类似如下的问题： hbase-client由于没有实现容错设计，导致访问出现了抖动，影响了同一服务池的其他调用，需要增加类似MySQL

jopen 2014-11-10 12511 0

设计

SQL Hive 是一种数据仓库基础架构，设计用于支持批量查询和分析 Hadoop 管理的文件 HBase 是一种以列为主的数据存储环境，设计用于支持 Hadoop 中的稀疏填充的大型表格 Flume 是一种用来数据收集并将其加载到

openkk 2012-02-25 30861 0

Hadoop

如Apache Spark内存处理引擎、Apache Hive数据仓库基础设施和Apache HBase NoSQL存储系统。企业要将大数据纳入到其核心企业数据架构，势必需要改动或购置大数据即服

jopen 2016-03-09 4973 0

大数据数据仓库 Hadoop

P33

NoSQLWide Column Store / Column Families Hadoop / HBase Cassandra Hypertable Document Store CouchDB MongoDB

wuhoufeng 2012-03-20 559 0

软件架构 Apache PHP Scala Go

P45

Hadoop,使用Zookeeper的事件處理確保整個集群只有一個NameNode,存儲配置信息等. HBase,使用Zookeeper的事件處理確保整個集群只有一個HMaster,察覺HRegionServer聯機和宕機

efeil 2012-09-07 2739 0

分布式/云计算/大数据

Vice President, and J. Aaron Farr is Treasurer. HBase, Hive, and Zookeeper enter the Incubator; Apache

jopen 2014-11-24 28520 0

Apache

你选择MySQL分库、表、区，还是选择Redis，MongoDB作sharding？还是你直接就上HBase了？二级索引在哪里？其实很佩服一篇文章，几个图表，看起来很cool的架构图就把这些问题说得一清二楚，架构嘛。

y35w 2015-07-09 11656 0

事务

的结构进行存储。文档可以存储列表，键值对以及层次结构复杂的文档。 BigTable 的列簇式存储 HBase 和 Cassandra 的数据模型都借鉴自 Google 的 BigTable。这种数据模型的

码头工人 2011-12-07 29770 1

NOSQL

是一个通用型系统。你可以有许多的生产者和消费者分享多个主题。相反地，Flume 被设计成特定用途的工作，特定地向 HDFS 和 HBase 发送出去。Flume 为了更好地为 HDFS 服务而做了特定的优化，并且与 Hadoop 的安

jopen 2015-08-11 22359 0

消息系统 Apache Kafka

P23

FS。 HDFS是为达到高数据吞吐量而优化的，这有可能会以延迟为代价。目前，对于低延迟访问，HBase是更好的选择。大量的小文件名称节点(namenode)存储着文件系统的元数据，因此文件数量的限制也由名称节点的内存量决定。

zhpboy 2013-10-12 3298 0

Hadoop 分布式/云计算/大数据 Apache C/C++ Go

出现在实时统计、实时风控、实时推荐等场景中。一般来说，我们从类kafka的metaQ或者基于 hbase的timetunnel中读取实时日志消息，经过一系列处理，最终将处理结果写入到一个分布式存储中，提供给应用程序访问。我们每天的实时消息

jopen 2013-11-04 78329 0

分布式/云计算/大数据 Storm

mode) 3 HADOOP环境(这里只需要hadoop) hadoop-1.0.3 hbase-0.94.2 hive-0.9.0 pig-0.10.0 sqoop-1.4.2 thrift-0

jopen 2014-10-31 21736 0

RHadoop 分布式/云计算/大数据

Hadoop：分布式的文件系统，结合其MapReduce编程模型可以用来做海量数据的批处理（Hive，Pig，HBase啥的就不说了），值得介绍的是Cloudera的Hadoop分支CDH5，基于YARN MRv2集

jopen 2015-11-18 110476 0

Github

一篇文章读懂大数据的黄色小象帮手––Hadoop 经验

实时日志收集系统Flume入门经验

ubuntu下安装配置hadoop1.0.4 文档

Hadoop 的一周学习心得文档

淘宝Hadoop与数据分析文档

京东智能云服务平台文档

impala笔记经验

应用层的容错与分层设计经验

BigInsights：解读IBM基于Hadoop的数据分析平台资讯

指点迷津的现代数据数据架构之道资讯

大型互联网应用架构设计文档

zookeeper 集群安装文档

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位资讯

你真的很熟分布式和事务吗？资讯

NoSQL生态系统资讯

Apache kafka 工作原理介绍经验

分布式运算平台-Hadoop-基础篇文档

storm简介经验

RHadoop环境搭建经验

GitHub上整理的一些工具经验

HBase ͼƬ�洢的相关搜索

关键词

一篇文章读懂大数据的黄色小象帮手––Hadoop 经验

实时日志收集系统Flume入门 经验

ubuntu下安装配置hadoop1.0.4 文档

Hadoop 的一周学习心得 文档

淘宝Hadoop与数据分析 文档

京东智能云服务平台 文档

impala笔记 经验

应用层的容错与分层设计 经验

BigInsights：解读IBM基于Hadoop的数据分析平台 资讯

指点迷津的现代数据数据架构之道 资讯

大型互联网应用架构设计 文档

zookeeper 集群安装 文档

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位 资讯

你真的很熟分布式和事务吗？ 资讯

NoSQL生态系统 资讯

Apache kafka 工作原理介绍 经验

分布式运算平台-Hadoop-基础篇 文档

storm简介 经验

RHadoop环境搭建 经验

GitHub上整理的一些工具 经验

HBase ͼƬ�洢 的相关搜索

关键词

实时日志收集系统Flume入门经验

Hadoop 的一周学习心得文档

淘宝Hadoop与数据分析文档

京东智能云服务平台文档

impala笔记经验

应用层的容错与分层设计经验

BigInsights：解读IBM基于Hadoop的数据分析平台资讯

指点迷津的现代数据数据架构之道资讯

大型互联网应用架构设计文档

zookeeper 集群安装文档

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位资讯

你真的很熟分布式和事务吗？资讯

NoSQL生态系统资讯

Apache kafka 工作原理介绍经验

分布式运算平台-Hadoop-基础篇文档

storm简介经验

RHadoop环境搭建经验

GitHub上整理的一些工具经验

HBase ͼƬ�洢的相关搜索