P2

  热点关注:解析云计算的核心技术 文档

(1)编程模型:MapReduce是Google开发的java、Python、C++编程模型,它是一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算。严格的编程模型使云计算环境下的编程十分简单。MapReduce模式的思想是将要执行的问题分解成Map(映射)和Reduce(化简)的方式,先通过Map程序将数据切割成不相关的区块,分配(调度)给大量计算机处理,达到分布式运算的效果,再通过Reduce程序将结果汇整输出。  (2)海量数据分布存储技术:云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式保证数据的可靠性。云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。GFS即Google文件系统(GoogleFileSystem),是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。

jq_one 2011-12-06   499   0
P63

  云计算--云计算概述 文档

云计算(Cloud Computing ):是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。是指基于互联网的超级计算模式--即把存储于个人电脑、移动电话和其他设备上的大量信息和处理器资源集中在一起,协同工作。在极大规模上可扩展的信息技术能力向外部客户作为服务来提供的一种计算方式。

jinoor 2011-11-29   10374   0
P40

  云计算基本概念介绍 文档

云计算(Cloud Computing ):是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。是指基于互联网的超级计算模式--即把存储于个人电脑、移动电话和其他设备上的大量信息和处理器资源集中在一起,协同工作。在极大规模上可扩展的信息技术能力向外部客户作为服务来提供的一种计算方式。

vurtnesc 2011-11-25   603   0
P28

  Hadoop下MapReduce编程 文档

内容:MapReduce概述,MapReduce的数据流,检查点,相关编程要点,Map过程Map过程通过在输入列表中的每一项执行函数,生成一系列的输出列表。Reduce过程Reduce过程在一个输入的列表进行扫描工作,随后生成一个聚集值,作为最后的输出MapReduce的Reduce过程所有不同的颜色代表不同的键值(keys)。

slayerlyy 2011-11-22   4450   0
P29

  分布式存储介绍 文档

分布式存储简介,为什么使用分布式存储系统,实现分布式存储相关的技术,现有分布式存储系统。

sunxlm 2011-11-21   5225   0
P5

  十分钟掌握MapReduce的精髓 文档

作者的目的是讨论MapReduce是否应该继续提供“免费的午餐”,但作者在文中用比较通俗的语言对MapReduce的原理进行了讲解并给了例子,我相信这对不熟悉MapReduce的人来说是个非常不错的入门文章,所以将文章转过来并改名《十分钟掌握MapReduce的精髓》与各位云友分享,希望对大家有用。以下是原文:

wujianhai 2011-11-18   3799   0
P38

  Hadoop项目简介 文档

HDFS为了做到可靠性(reliability)创建了多份数据块(data blocks)的复制(replicas),并将它们放置在服务器群的计算节点中(compute nodes),MapReduce就可以在它们所在的节点上处理这些数据了。

451237450 2011-11-10   4302   0
P10

  分布式计算(Map/Reduce) 文档

布式式计算,同样是一个宽泛的概念,在这里,它狭义的指代,按Google Map/Reduce框架所设计的分布式框架。在Hadoop中,分布式文件系统,很大程度上,是为各种分布式计算需求所服务的。我们说分布式文件系统就是加了分布式的文件系统,类似的定义推广到分布式计算上,我们可以将其视为增加了分布式支持的计算函数。从计算的角度上看,Map/Reduce框架接受各种格式的键值对文件作为输入,读取计算后,最终生成自定义格式的输出文件。而从分布式的角度上看,分布式计算的输入文件往往规模巨大,且分布在多个机器上,单机计算完全不可支撑且效率低下,因此Map/Reduce框架需要提供一套机制,将此计算扩展到无限规模的机器集群上进行。依照这样的定义,我们对整个Map/Reduce的理解,也可以分别沿着这两个流程去看。

萧萧若水 2011-10-30   3954   0
P28

  高性能和分布式计算 文档

内容概要:1、分布式计算和分布式系统。2、P2P计算。3、云计算和网格计算。4、传感器网络和物联网。

萧萧若水 2011-10-30   6695   0
P8

  Lucene+Hadoop分布式 文档

不管程序性能有多高,机器处理能力有多强,都会有其极限。能够快速方便的横向与纵向扩展是Nut设计最重要的原则,以此原则形成以分布式并行计算为核心的架构设计。以分布式并行计算为核心的架构设计是Nut区别于Solr、Katta的地方。 Nut是一个Lucene+Hadoop分布式并行计算搜索框架,能对千G以上索引提供7*24小时搜索服务。在服务器资源足够的情况下能达到每秒处理100万次的搜索请求。  

huaxinmifeng 2011-10-27   7864   0
P20

  计算机网络与云计算服务技术 文档

本文介绍了中国第一个国家范围的学术性计算机互连网络: 中国教育和科研计算机网络CERNET,简要论述了CERNET的现状,包括其网络拓扑结构的描述,CERNET采用的主要技术以及一些技术上的更新,在此基础上,介绍了下一代互联网IPV6以及关键技术,最后介绍了云计算服务的内涵及技术。云计算的发展历史和应用场景, 比较了现有的云计算的定义并给出了新的定义, 以谷歌的云计算技术为例, 总结了云计算的关键技术,并指出了云计算的广阔发展前景。

messishow 2011-10-27   763   0
P46

  云计算之Hadoop 文档

Hadoop核心、Hadoop dfs(Hdfs)、MapReduce 分布式并行计算模型 Hadoop扩展、Hadoop base(Hbase)基于hadoop核心的高扩展性分布式数据库、Pig-一种高级数据流语言和并行计算的执行框架,也基于hadoop核心 、Hive-建立在hadoop之上的数据仓库基础设施,提供数据摘要,adhoc、querying,数据集分析。

qiu.n@sand 2011-10-26   5538   0
P

Hadoop入门手册 文档

MapReduce编程模型的思想来源于函数式编程语言Lisp,由Google公司于2004年提出并首先应用于大型集群。同时,Google也发表了GFS、BigTable等底层系统以应用MapReduce模型。在2007年,Google’s MapReduce Programming Model-Revisted论文发表,进一步详细介绍了Google MapReduce模型以及Sazwall并行处理海量数据分析语言。Google公司以MapReduce作为基石,逐步发展成为全球互联网企业的领头羊。Hadoop作为Apache基金会资助的开源项目,由Doug Cutting带领的团队进行开发,基于Lucene和Nutch等开源项目,实现了Google的GFS和Hadoop能够稳定运行在20个节点的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop项目正式支持HDFS和MapReduce的独立开发。同时,新兴公司Cloudera为Hadoop提供了商业支持,帮助企业实现标准化安装,并志愿贡献社区。Hadoop的最新版本是0.21.0,说明其还在不断完善发展之中。

gopen 2011-10-20   1001   0
P8

  VM下配置Hadoop详细教程 文档

前言:Hadoop是一个分布式系统基础架构,主要是由HDFS、MapReduce和Hbase组成,分别为Google集群系统GFS、MapReduce、BigTable的开源实现。具有扩容能力强,效率高,成本低,可靠性好等特点。配置前最好熟悉一下Linux常用命令的使用,遇到问题时善于利用收索引擎,本教程的Linux版本选择比较常用的Ubuntu。

12csc12 2011-10-19   293   0
P34

  Google云计算原理 文档

很少有一种技术能够像“云计算”这样,在短短的两年间就产生巨大的影响力。Google、亚马逊、IBM和微软等IT巨头们以前所未有的速度和规模推动云计算技术和产品的普及,一些学术活动迅速将云计算提上议事日程,支持和反对的声音不绝于耳。那么,云计算到底是什么?发展现状如何?它的实现机制是什么?它与网格计算是什么关系?。本章将分析这些问题,目的是帮助读者对云计算形成一个初步认识。

ndn4open 2011-10-11   769   0
P20

  分布式计算开源框架Hadoop入门实践 文档

分布式计算开源框架Hadoop介绍 - 分布式计算开源框架Hadoop入门实践(一)在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger Concurrent Practice--日志分析并行分解设计与实现》中有所提到。但是由于统计的内容暂时还是十分简单,所以就采用Memcache作为计数器,结合MySQL就完成了访问控制以及统计的工作。然而未来,对于海量日志分析的工作,还是需要有所准备。现在最火的技术词汇莫过于“云计算”,在Open API日益盛行的今天,互联网应用的数据将会越来越有价值,如何去分析这些数据,挖掘其内在价值,就需要分布式计算来支撑海量数据的分析工作。

softmind 2011-10-08   6215   0
P74

  Hadoop权威指南-中文版(前三章) 文档

Hadoop提供了一个稳定的共享存储和分析系统。存储由HDFS实现,分析由MapReduce实现。纵然Hadoop还有其他功能,但这些功能是它的核心所在。

我是第一de 2011-10-03   3243   0
P6

  Hadoop集群安装步骤简述 文档

Hadoop集群安装。首先我们统一一下定义,在这里所提到的Hadoop是指HadoopCommon,主要提供HDFS(分布式文件存储)与Map/Reduce的核心功能。 

wkz_214 2011-09-14   4893   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档