开源项目,开源代码,开源文档,开源新闻,开源社区

列经过优化处理的MapReduce运算。 Apache HBase : 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

jopen 2014-05-20 52523 0

Hadoop 分布式/云计算/大数据

BigInsights 等工具提供了这类功能。这些工具访问存储在大数据存储系统（比如 BigTable、HBase，等等）中的非结构化数据和结构化数据（例如，JSON 数据）。预处理原始数据模式大数据解决方案主要由基于

jopen 2015-02-01 27853 0

大数据分布式/云计算/大数据

P60

当前有几十种nosql数据库产品。根据数据的存储模型和特点分为很多种类。从存储模型上，大体划分类型部分代表特点列存储 Hbase Cassandra Hypertable 是按列存储数据的。最大的特点是方便存储结构化和半结构

oracleyyc 2013-05-28 2306 0

NoSQL数据库 SQL

P113

reducer 无法完成的复杂的分析工作。Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上，控制分隔符，也允许用户指定数据格式。由于 Hive 采用了 SQL 的查询语言 HQL，因此很容易将

xnbw 2016-01-11 2024 0

分布式/云计算/大数据

2010年5月，Avro脱离Hadoop项目，成为Apache顶级项目。 2010年5月，HBase脱离Hadoop项目，成为Apache顶级项目。 2010年5月，IBM提供了基于Hadoop

fmms 2011-09-11 30305 4

云计算 Hadoop

(例如, HDFS, MapReduce, Flume, Oozie, Hive, Pig, HBase, and YARN) 的技术人员在职场上的需求将越来越大。 2. Apache Spark

jopen 2015-09-02 28240 0

大数据

P11

javascript helloworld hadoop mapreduce java hadoop hbase 当出现org.apache.hadoop.hdfs.server.namenode.SafeModeException:

peixy 2016-11-03 551 0

Hadoop 分布式/云计算/大数据

定制的类型系统，非常灵活，能够直接处理复杂数据类型，如时间序列、 HDF5文件、Apache HBase表和序列化对象（像protocol buffer或 Avro 记录）等。 Crunch并不想阻止

jopen 2013-07-18 18336 0

分布式/云计算/大数据 Apache Crunch

除了我们主要使用的Hive/HDFS后台系统之外，我们也开发了一些连接其他系统的Presto 连接器，包括HBase，Scribe和定制开发的系统插件结构图如下： presto执行过程执行过程示意图：

wdsu5225 2016-11-07 13540 0

Presto 分布式/云计算/大数据

isolation以防止不同版本jar包冲突，比如google Guava在混合使用Hadoop、HBase和Spark时，很容易产生冲突。（https://issues.apache.org/jira/

zfb1226 2016-06-02 26655 0

Hadoop Spark 分布式/云计算/大数据

P30

分布式文件系统HDFS MapReduce框架并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具ChukwaHadoop生态系统

qsf113 2012-05-09 664 0

Hadoop 分布式/云计算/大数据方案 SQL Go

P34

的知识 7. 目录WHY大数据落地被虐实例如何应对案例分享 8. 信心爆棚的进击Hadoop HBase Spark Storm Impala ML 9. 很快感受到森森的恶意 10. 丰富的数据源 11

w327 2015-05-25 473 0

分布式/云计算/大数据方案 SQL

lookout to 2016 译者：郭亚和，从事大数据（spart/storm/hadoop/hbase）相关运维、分析等工作。来自： http://www.iteye.com/news/31347

jopen 2016-02-16 8882 0

Git Apache Flink

uce，而两者只是理论基础，不是具体可使用的高级应用，Hadoop旗下有很多经典子项目，比如 HBase、Hive等，这些都是基于HDFS和MapReduce发展出来的。要想了解Hadoop，就必须知道HDFS和MapReduce是什么。

jopen 2015-01-12 27646 0

Hadoop 分布式/云计算/大数据

软件架构，在这个架构下组织的成员HDFS(Hadoop分布式文件系统)，MapReduce、 Hbase 、Zookeeper(一个针对大型分布式系统的可靠协调系统)，hive(基于Hadoop的一个数据仓库工具)等。

pm45e 2015-08-03 32007 0

Hadoop 分布式/云计算/大数据

he在整个开源界都举足轻重，像我们熟知的Tomcat、HTTP Server、Hadoop、HBase、ZooKeeper、Hive等等，太多大家熟悉的顶级项目。可以这样说，如果没有Apache基

jopen 2015-11-25 16445 0

JStorm

品中，这个后端服务其实叫数据链路处理服务。主要执行类似ETL一类的工作，进行规整化后存入索引，HBase,Redis等存储器中。好处是什么读写分离是能横向扩容的基础其实读写分离本质上是模块化，系统解耦

jopen 2015-04-27 16407 0

分离

让我们通过图1展示的3个节点简单集群来研究这个问题。这个例子中，队列中有两个任务准备由YARN资源管理器调度。资源管理器决定对HBase流关键业务和低优先级ETL任务在集群上同时运行，并对它们进行调度执行。图2展示了没有Q

LukeOlivare 2016-06-17 11606 0

Hadoop 分布式/云计算/大数据

数据库，我在这个世界花了太多的时间。 NoSQL 对于新手而言，无论是 MongoDB、HBase 还是 Cassandra，喜欢兜售它的无模式特性（schema-less）。关系型数据库的旧世界需要僵硬的模式而且狂热！在

jopen 2014-09-09 10252 0

开发人员

是一个内存计算的MapReduce, 通过缓存机制，在性能上要好很多。它自身不带数据系统。但是支持 hdfs,mesos,hbase。文本文件等。从架构和应用角度上看， spark 是一个仅包含计算逻辑的开发库（尽管它提供个

lianzhu3 2016-03-01 39966 0

Spark

Hadoop开发使用备记经验

大数据架构和模式（四） - 了解用于大数据解决方案的原子模式和复合模式经验

以MongoDB为主的NoSQL调研文档

云计算apache HIVE的使用文档

大象的崛起！Hadoop七年发展风雨录资讯

2015年大数据顶尖职位必备的9项技能资讯

hadoop入门教程文档

Apache Crunch：简化MapReduce编程的Java库经验

Presto架构及原理经验

呼之欲出！比Spark快10倍的Hadoop3.0有哪些实用新特性？经验

Hadoop 淘宝方案文档

从“被虐”到“落地” - 明略大数据产品演进实践文档

Apache Flink ：回顾2015，展望2016 资讯

《Hadoop基础教程》之初识Hadoop 经验

大数据与Hadoop之间是什么关系？经验

封仲淹：Storm 2.0将会基于JStorm，阿里巴巴全程参与资讯

读写分离和横向扩容那些事经验

如何让Hadoop支持优先级且性能可预测经验

为什么越简单的技术对于开发人员越难资讯

Spark的Python编程示例代码段

thrift HBase 的相关搜索

关键词

Hadoop开发使用备记 经验

大数据架构和模式（四） - 了解用于大数据解决方案的原子模式和复合模式 经验

以MongoDB为主的NoSQL调研 文档

云计算apache HIVE的使用 文档

大象的崛起！Hadoop七年发展风雨录 资讯

2015年大数据顶尖职位必备的9项技能 资讯

hadoop入门教程 文档

Apache Crunch：简化MapReduce编程的Java库 经验

Presto架构及原理 经验

呼之欲出！比Spark快10倍的Hadoop3.0有哪些实用新特性？ 经验

Hadoop 淘宝方案 文档

从“被虐”到“落地” - 明略大数据产品演进实践 文档

Apache Flink ：回顾2015，展望2016 资讯

《Hadoop基础教程》之初识Hadoop 经验

大数据与Hadoop之间是什么关系？ 经验

封仲淹：Storm 2.0将会基于JStorm，阿里巴巴全程参与 资讯

读写分离和横向扩容那些事 经验

如何让Hadoop支持优先级且性能可预测 经验

为什么越简单的技术对于开发人员越难 资讯

Spark的Python编程示例 代码段

thrift HBase 的相关搜索

关键词

Hadoop开发使用备记经验

大数据架构和模式（四） - 了解用于大数据解决方案的原子模式和复合模式经验

以MongoDB为主的NoSQL调研文档

云计算apache HIVE的使用文档

大象的崛起！Hadoop七年发展风雨录资讯

2015年大数据顶尖职位必备的9项技能资讯

hadoop入门教程文档

Apache Crunch：简化MapReduce编程的Java库经验

Presto架构及原理经验

呼之欲出！比Spark快10倍的Hadoop3.0有哪些实用新特性？经验

Hadoop 淘宝方案文档

从“被虐”到“落地” - 明略大数据产品演进实践文档

大数据与Hadoop之间是什么关系？经验

封仲淹：Storm 2.0将会基于JStorm，阿里巴巴全程参与资讯

读写分离和横向扩容那些事经验

如何让Hadoop支持优先级且性能可预测经验

为什么越简单的技术对于开发人员越难资讯

Spark的Python编程示例代码段