如何挑选合适的大数据或Hadoop平台? 经验

都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据时,首先碰到的问题就是如何开始以及选择哪一种产品。本文讨论了不同的选择,并推荐了每种选择的适用场合。 Hadoop平台的多种选择

jopen 2015-02-19   45764   0

不得不了解的Hadoop知识 经验

在去年曾经列出了一张应当了解的Hadoop 知识清单。如今2015年也已经少了两个月,我认为我现在应当检查一下大家对Hadoop的了解情况,同时在清单内容中增加一些技术。 首先,我希望大家不要忘记

fn67 2015-03-21   15211   0

Hadoop:分布式计算平台初探 经验

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海 量数据进行分布式计算。Hadoop框架中最核心设计就是:Ma

jopen 2014-12-03   24277   0

Hive:基于hadoop的数据仓库工具 经验

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。其优点是学习成本低,可以通过

jopen 2014-12-03   24098   0

面向Hadoop框架的高级语言: Apache Pig 经验

Apache Pig 是用来处理大规模数据的高级查询语言,配合 Hadoop使用,可以在处理海量数据时达到事半功倍的效果,比使用Java,C++等语言编写大规模数据处理程序的难度要小N倍,实现同样的效果的代码

jopen 2014-12-04   22140   0

Hadoop 之 MapReduce 框架演变详解 经验

所谓的经典版本的MapReduce框架,也是Hadoop第一版成熟的商用框架,简单易用是它的特点,来看一幅图架构图: 上面的这幅图我们暂且可以称谓Hadoop的V1.0版本,思路很清晰,各个Client提交Job给一个统一的Job

jopen 2015-12-16   14385   0
P30

  基于Hadoop的Map/Reduce框架研究报告 文档

1. 基于Hadoop的Map/Reduce框架研究报告黄飞 2. Outline1. 模型介绍: Hadoop 简介 MapReduce 计算模型 2.实例分析 WordCount 3. Hadoop

blue_kite 2012-11-30   541   0
P20

  Hadoop 主要子项目介绍 文档

Bigtable Nosql 2. Hadoop主要子项目介绍(Pig Zookeeper Hbase Sqoop Avro Chukwa Cassandra )Hive 现 在Hadoop已经发展成为包含多个子

706394187 2015-05-23   807   0

Strata + Hadoop World软件开发大会 问答

想法那么恭喜你,8月3号Strata + Hadoop World软件开发大会要开始了,你准备好了吗? 下面我为大家介绍一下Strata + Hadoop World大会的信息吧: 为什么您应该参加

活动家becky 2016-07-28   2665   0
软件开发   C/C++   Go   HTML  
P

Hadoop 1.0 权威入门指南_v1.0 文档

这篇文档的目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等。 GNU/Linux是产品开发和运行的平台。 Hadoop已在有2000个节点的GNU/Linux主机组成的集群系统上得到验证。 Win32平台是作为开发平台支持的。由于分布式操作尚未在Win32平台上充分测试,所以还不作为一个生产平台被支持。

haohaoaiiqian 2013-12-02   2024   0
P11

  Hadoop在ubuntu下安装配置手册 文档

 1. Hadoop在ubuntu下安装配置手册 准备工作: 1. 基本环境部署: 1) 操作系统安装: Ubuntu,版本为12.0.4,安装虚拟机,网络地址配置如下: IP地址:192.168.29

li270606338 2013-08-28   2926   0
P6

  使用 Linux 和 Hadoop 进行分布式计算 文档

Use Only▲ 使用Linux和Hadoop进行分布式计算 发表时间:2012-4-20 Ken.Mann M.Tim.Jones 来源:ibm 关键字:hadoop linux 分布式 人们每天都依赖搜索引擎以从

wwqu1020 2012-09-13   3132   0
P14

  hadoop数据仓库工具--hive介绍 文档

1 简介 1.1 是什么 hive是一个基于hadoop的数据仓库。使用hadoop-hdfs作为数据存储层;提供类似SQL的语言(HQL),通过hadoop-mapreduce完成数据计算;通过HQL

cooltaoism 2011-06-28   650   0

大数据相关技术、Hadoop生态、LinkedIn内部实战 经验

司酷迅,做实时信息检索, 后来进入百度基础架构组,搭建了Baidu App Engine的早期版本,随后去杜克大学留学,攻读硕士期间,做跟Hadoop大数据相关的研究项目Starfish,之后在Amazon

jopen 2015-01-26   192894   0

Hadoop 新 MapReduce 框架 Yarn 详解 经验

Hadoop MapReduce 框架的问题 对于业界的大数据存储及分布式处理系统来说,Hadoop 是耳熟能详的卓越开源分布式文件存储及处理框架,对于 Hadoop 框架的介绍在此不再累述,读者可参考

jopen 2014-05-14   171737   0

Hadoop日志聚合器:White Elephant 经验

White Elephant 是一个 Hadoop 的日志聚合器和操作面板,可对 Hadoop 集群进行可视化监控。目前还不支持 Hadoop 2.0 版本。 项目主页: http://www

jopen 2014-03-27   14518   0

Hadoop深入学习:MapTask详解 经验

我们主要来学习MapTask的内部实现。

yn6e 2015-05-11   16494   0

大数据与Hadoop之间是什么关系? 经验

thebigdata.cn/Hadoop/14797.html 大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 Hadoop等等。那么,大数据是什么、Hadoop是什么,大数据和Hadoop有什么关系呢

pm45e 2015-08-03   32007   0

详解Hadoop核心架构 经验

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。

jopen 2015-07-30   19557   0

CentOS7安装Hadoop2.7完整流程 经验

H登录从服务器,解压安装JDK,解压安装Hadoop,配置hdfs、mapreduce等主从关系。 1、环境,3台CentOS7,64位,Hadoop2.7需要64位Linux,CentOS7

jopen 2015-07-01   413693   0
1 2 3 4 5 6 7 8 9 10