数据技术的回顾与展望 ——写在Hadoop十周年纪念 资讯

编者按 今天是Hadoop十岁生日。于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。InfoQ策

jopen 2016-01-28   56044   0

针对Hadoop数据处理应用程序的新分布式执行框架: Apache Tez 经验

你可能听说过 Apache Tez ,它是一个针对 Hadoop 数据处理应用程序的新分布式执行框架。但是它到底是什么呢?它的工作原理是什么?哪些人应该使用它,为什么?如果你有这些疑问,那么可以看一下

jopen 2014-10-13   30952   0
P6

  大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术 文档

大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术 2014-07-16 13:51 大 数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm

tony2007 2015-06-19   2795   0
P5

  10分钟内理解云计算分布式大数据处理框架Hadoop 文档

家林会带您在10分钟内理解云计算分布式大数据处理框架Hadoop并开始动手实践,倒计时开始…… 第1分钟: Hadoop要解决的问题是什么? 答:Hadoop核心要解决长期IT界乃至人类社会的两大主题: 1, 海量数据的存储:传统

xcxc 2015-08-23   651   0
P25

  Apache Hadoop2.0 下一代数据处理框架介绍 文档

Apache Hadoop 2.0 下一代数据处理框架介绍 2. 主要内容Hadoop 1.0 的局限性 Hadoop 2.0 新特性介绍 Hadoop现状及最新进展 3. Hadoop1.0的局限-

pnx8 2014-08-17   3282   0
P11

  Apache Hadoop入门第一步 文档

Apache Hadoop入门(一) 官方网站http://hadoop.apache.org/ 1 Apache Hadoop概述 Apache Hadoop项目开发可靠的、可扩展的(Scalable)、分布式计算的开源软件。

paradoxlee00 2012-04-11   5446   0
P14

  Hadoop 集群搭建笔记 文档

超人Hadoop网络学习社区—http://bbs.superwu.cn|吴超.沉思录 第4章:Hadoop集群 4.1.分布式集群系统安装 伪分布模式安装比较简单,集群模式是在伪分布模式基础上进行修改的,所以伪分布模式安装必须搞定。

beat_it 2013-11-16   2072   0
P17

  Hadoop1.x以及2.x安装 文档

http://blog.fens.me/hadoop-maven-eclipse/ 阅读导航 1.Hadoop-1.2.1的安装 2.Hadoop-2.6.0的安装 1 Hadoop-1.2.1的安装 1) 伪分布式的安装

小牛牛 2015-03-23   2407   0
P5

  HADOOP-0.20.2 分布式集群配置 文档

HADOOP-0.20.2分布式集群配置 本文以安装和使用hadoop-0.20.2为例。 硬件环境 1. 虚拟机VMWare Workstation 6.5.2build 2. 三台机器均安装redhat

lxj2008 2014-01-19   3462   0
P12

  用Linux和Apache Hadoop进行云计算 文档

用 Linux 和 Apache Hadoop 进行云计算 用 Linux 和 Apache Hadoop 进行云计算 2010-06-21 15:12 |  364次阅读 |  【已有0条评论】发表评论

caoyu152152 2011-07-11   583   0
P

Hadoop 1.0 权威API参考v1.0 文档

Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

kingrom 2013-07-28   2713   0

8个值得关注的SQL-on-Hadoop框架 资讯

数据的操作语言是SQL,因此很多工具的开发目标自然就是能够在Hadoop上使用SQL。这些工具有些只是在MapReduce之上做了简单的包装,有些则是在HDFS之上实现了完整的数据仓库,而有些则介于这两者之间。这样的工具有很多,来自于

jopen 2014-07-01   22905   0
Hadoop  

基于Docker快速搭建多节点Hadoop集群 资讯

一. 项目简介 GitHub地址: https://github.com/kiwenlau/hadoop-cluster-docker 博客地址: http://www.cnblogs.com/kiwenlau/p/4524607

jopen 2015-05-24   18525   0
Docker  

SOA在新兴的Hadoop世界扮演的角色 资讯

新兴且流行的数据即平台(Data-as-a-platform)Hadoop与一定程度上失宠的SOA的联姻,可能么?Joe McKendrick在其最新的 博文 中称,此结合非常有益,尤其对SOA,因为数据即平台可以极大程度上简化数据整合:

openkk 2011-11-05   16214   0
Hadoop   SOA  

Hadoop子项目 ZooKeeper 3.3.4 发布 资讯

ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务

fmms 2011-11-29   17508   1
Hadoop  

MongoDB Hadoop Connector 1.0 正式版发布 资讯

10gen(MongoDB 数据库开发商)今天发布了 MongoDB Hadoop Connector 1.0 正式版本。 MongoDB Hadoop Connector 的核心功能是允许读取 MongoDB

openkk 2012-04-11   21638   1
Hadoop  

Spring for Apache Hadoop 2.3 M3 发布 资讯

Spring for Apache Hadoop 提供了 Spring 框架用于创建和运行 Hadoop MapReduce、Hive 和 Pig 作业的功能,包括 HDFS 和 HBase。如果你需要简单的基于

xdld 2015-09-22   16852   0
P8

  Hadoop集群测试方案及计划 v1.0 文档

Hadoop集群测试方案 1. 引言 随着云计算技术的飞速发展,越来越多的数据密集型企业相继出现.面临着这些海量的数据信息,包括结构化信息、半结构化信息及其非结构化信息,如何存储并对这些信息进行处理将是这些企业面临的巨大挑战.

lygkkk123 2012-08-21   570   0

hadoop框架详细分析 经验

解成map(映射)和reduce(化简)的方式,流程图如下图1所示: 在数据被分割后通过Map 函数的程序将数据映射成不同的区块,分配给计算机机群处理达到分布式运算的效果,在通过Reduce

jopen 2013-11-28   306378   0

Hadoop家族学习路线图 经验

主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN

jopen 2013-11-10   199151   0
1 2 3 4 5 6 7 8 9 10