一篇文章读懂大数据的黄色小象帮手––Hadoop 经验

语言「Pig」、类似 SQL 语法查询功能的「Hive」、专门用在 Hadoop 上的资料库系统「HBase」等。 Hadoop 生态系: 对 Hadoop 有初步的认识后,如果想进一步学习相关的

jopen 2015-03-13   25945   0

实时日志收集系统Flume入门 经验

标包括:HDFS、Hive、Logger、Thrift、IRC、File Roll、Null、HBase、MorphlineSolr、ElasticSearch、Kite Dataset、Kafka、Custom(自定义)

jopen 2015-07-01   130478   0
P11

  ubuntu下安装配置hadoop1.0.4 文档

javascript  helloworld hadoop mapreduce java hadoop hbase  当出现org.apache.hadoop.hdfs.server.namenode.SafeModeException:

zhangbc 2013-09-06   757   0
P7

  Hadoop 的一周学习心得 文档

一个可扩展的多master的,避免单节点失效的数据库 Chukwa:一个用于管理大规模分布式系统的数据集系统 HBase: 一个可扩展的,分布的数据库,支持对大表的结构化数据的存储 Hive:一个数据仓库的基础设施,提供数据汇总和特定查询。

xsh1019 2013-01-05   3560   0
P30

  淘宝Hadoop与数据分析 文档

分布式文件系统HDFS MapReduce框架 并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具ChukwaHadoop生态系统

lxz 2014-01-03   3863   0
P19

  京东智能云服务平台 文档

移动网关JOS授权API个人数据存储家居健康长连接网关核心模型媒体车载设备联动引擎DB缓存云云存储语义解析引擎HBASE基本架构云海 8. 智能云超级APPhttps://gw.smart.jd.com长连接服务De

g4mm 2015-04-24   3968   0
方案  

impala笔记 经验

impala与hadoop生态结合紧密 (1) HDFS是impala最主要的数据源。 除此之外, impala也支持HBase,甚至支持S3存储。 (2) impala表定义存储在hive metastore中, 支持读取hive表定义。

er74 2015-07-26   61584   0

应用层的容错与分层设计 经验

全部耦合在一起,也造成维护成本进一步加大。 比如之前一些服务开发中碰到的类似如下的问题: hbase-client由于没有实现容错设计,导致访问出现了抖动,影响了同一服务池的其他调用,需要增加类似MySQL

jopen 2014-11-10   12511   0
设计  

BigInsights:解读IBM基于Hadoop的数据分析平台 资讯

SQL Hive 是一种数据仓库基础架构,设计用于支持批量查询和分析 Hadoop 管理的文件 HBase 是一种以列为主的数据存储环境,设计用于支持 Hadoop 中的稀疏填充的大型表格 Flume 是一种用来数据收集并将其加载到

openkk 2012-02-25   30861   0
Hadoop  

指点迷津的现代数据数据架构之道 资讯

如Apache Spark内存处理引擎、Apache Hive数据仓库基础设施和Apache HBase NoSQL存储系统。 企业要将大数据纳入到其核心企业数据架构,势必需要改动或购置大数据即服

jopen 2016-03-09   4973   0
P33

  大型互联网应用架构设计 文档

NoSQLWide Column Store / Column Families Hadoop / HBase Cassandra Hypertable Document Store CouchDB MongoDB

wuhoufeng 2012-03-20   559   0
软件架构   Apache   PHP   Scala   Go  
P45

  zookeeper 集群安装 文档

Hadoop,使用Zookeeper的事件處理確保整個集群只有一個NameNode,存儲配置信息等. HBase,使用Zookeeper的事件處理確保整個集群只有一個HMaster,察覺HRegionServer聯機和宕機

efeil 2012-09-07   2739   0

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位 资讯

Vice President, and J. Aaron Farr is Treasurer. HBase, Hive, and Zookeeper enter the Incubator; Apache

jopen 2014-11-24   28520   0
Apache  

你真的很熟分布式和事务吗? 资讯

你选择MySQL分库、表、区,还是选择Redis,MongoDB作sharding?还是你直接就上HBase了? 二级索引在哪里? 其实很佩服一篇文章,几个图表,看起来很cool的架构图就把这些问题说得一清二楚,架构嘛。

y35w 2015-07-09   11656   0
事务  

NoSQL生态系统 资讯

的结构进行存储。文档可以存储列表,键值对以及层次结构复杂的文档。 BigTable 的列簇式存储 HBase 和 Cassandra 的数据模型都借鉴自 Google 的 BigTable。这种数据模型的

码头工人 2011-12-07   29770   1
NOSQL  

Apache kafka 工作原理介绍 经验

是一个通用型系统。你可以有许多的生产者和消费者分享多个主题。相反地,Flume 被设计成特定用途的工作,特定地向 HDFS 和 HBase 发送出去。Flume 为了更好地为 HDFS 服务而做了特定的优化,并且与 Hadoop 的安

jopen 2015-08-11   22359   0
P23

  分布式运算平台-Hadoop-基础篇 文档

FS。 HDFS是为达到高数据吞吐量而优化的,这有可能会以延迟为代价。 目前,对于低延迟访问,HBase是更好的选择。 大量的小文件 名称节点(namenode)存储着文件系统的元数据, 因此文件数量的限制也由名称节点的内存量决定。

zhpboy 2013-10-12   3298   0

storm简介 经验

出现在实时统计、实时风控、实时推荐等场景中。一般来说,我们从类kafka的metaQ或者基于 hbase的timetunnel中读取实时日志消息,经过一系列处理,最终将处理结果写入到一个分布式存储中,提供给应用程序访问。我们每天的实时消息

jopen 2013-11-04   78329   0

RHadoop环境搭建 经验

mode) 3 HADOOP环境(这里只需要hadoop) hadoop-1.0.3  hbase-0.94.2  hive-0.9.0  pig-0.10.0  sqoop-1.4.2  thrift-0

jopen 2014-10-31   21736   0

GitHub上整理的一些工具 经验

Hadoop:分布式的文件系统,结合其MapReduce编程模型可以用来做海量数据的批处理(Hive,Pig,HBase啥的就不说了),值得介绍的是Cloudera的Hadoop分支CDH5,基于YARN MRv2集

jopen 2015-11-18   110476   0
Github  
1 2 3 4 5 6 7 8 9 10