P37

hadoop存储与计算分离实践 文档

p 传统集群部署实践p 云上集群部署实践p 传统集群部署实践

opentianya 2017-04-10   2958   0
P25
P70

基于hadoop的电影推荐系统研究与实现 文档

本文以实现电影推荐系统为例,首先介绍了Hadoop平台中的两大核心内容HDFS和MapReduce。系统选择HDFS这样一种具有高度容错性的分布式文件系统作为底层文件系统,将其部署到廉价的集群中,同时选择MapReduce作为海量数据处理工具。然后介绍了本课题所用的WEB框架--SpringMVC,它具有灵活易用、逻辑清楚等优点,MVC的三层结构设计也为推荐系统提供了良好的接口。

openlh 2017-01-12   536   0
P5
P16

  cpu并行计算集群设计方案 文档

Hadoop是一个开发和运行处理大规模数据的软件平台,是Apache的一个用java语言实现开源软件框架,Hadoop集群是一种专门为存储和分析海量非结构化数据而设计的特定类型的集群。本质上,它是一种计算集群,即将数据分析的工作分配到多个集群节点上,从而并行处理数据。Hadoop框架中最核心设计就是:HDFS和MapReduce.

勇敢勒小虎 2017-01-10   1939   0
P10

  hadoop&&spark安装教程 文档

本教程使用Ubuntu12.0464位作为系统环境(Ubuntu14.04也行,32位、64位均可),请自行安装系统装好了Ubuntu系统之后,在安装Hadoop前还需要做一些必备工作。

P0

cloudera5简介 文档

botion 2016-12-29   131   0
P20

  hadoop个人理解 文档

ymkyve 2016-12-26   1790   0
P42

field guide to hadoop pentaho 文档

This Preview Edition of Field Guide to Hadoop, Chapters 1 and 2, is a work in progress. The final book is currently scheduled for release in March 2015 and will be available at oreilly.com and other retailers once it is published.

qinghe721 2016-12-25   1483   0
P2

  big资料 文档

架构师和开发人员通常会使用一种软件工具,用于其特定的用途软件开发。例如,他们可能会说,Tomcat是Apache Web服务器,MySQL是一个数据库工具。

fangunun 2016-12-22   119   0
P3

hadoop分布式文件系统原理 文档

Hadoop分布式文件 系统在 大规模存储 和访 问 中具有广阔的应用 空间。从基本概念 、基本结构 、元 数据管理 、数 据 存 储 、文件 管 理 、数 据 容 错 6个 方 面对 HDFS的 实现 原 理 进 行 了探 究 ,可 为 HDFS应 用 研 究奠 定 基 础 。

1540253536 2016-11-30   1469   0
P34

mapreduce学习指导及疑难解惑汇总 文档

我们在学习mapreduce,首先我们从思想上来认识。其实任何的奇思妙想,抽象的,好的想法、都来源于我们生活,而我们也更容易理解我们身边所发生事情。所以下面一篇便是从生活的角度,来让我们理解,什么是mapreduce。

后会有7 2016-11-19   112   0
P11

  hadoop入门教程 文档

第一次搞hadoop,折腾我2天,功夫不负有心人,终于搞好了,现在来分享下,我的环境操作系统:wmv虚拟机中的ubuntu12.04hadoop版本:hadoop-1.0.4(听说是稳定版就下了)eclipse版本:eclipse-jee-indigo-SR2-win321.先安装好jdk,然后配置好jdk的环境变量,在这里我就不累赘了!网上多的是2.安装ssh这个也不用说了

peixy 2016-11-03   100   0
P82

《hadoop技术内幕:深入解析hadoop common和hdfs 文档

Hadoop 是 Apache 基金会下的一个开源分布式计算平台,以 Hadoop 分布式文件系统(Hadoop Distributed File System,HDFS)和 MapReduce 分布式计算框架为核心,为用户提供了底层细节透明的分布式基础设施。HDFS 的高容错性、高伸缩性等优点,允许用户将Hadoop 部署在廉价的硬件上,构建分布式系统 ;MapReduce 分布式计算计算框架则允许用户在不了解分布式系统底层细节的情况下开发并行、分布的应用程序,充分利用大规模的计算资源,解决传统高性能单机无法解决的大数据处理问题。

lfe33 2016-10-27   5035   0
P56

vmware10+centos6.5+hadoop2.2+zookeeper3.4.6+hbase0.96安装过程详解 文档

本次 Hadoop 集群安装实验,采用在 VMware 虚拟机下安装多个 CentOS 系统的方式进行;4 个 CentOS 系统中,其中,1 个为 Master 机,作为 NameNode;另外 3个为 Slave 机,作为 DataNode,均采用独立静态 IP 地址配置

chen_xyun 2016-10-13   90   0
P53

hadoop 操作实战 [中文版] 文档

Hadoop概述Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,HadoopDistributedFilesystem)和MapReduce(GoogleMapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点允许用户将Hadoop部署在低廉的硬件上,形成分布式系统;MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的情况下开发并行应用程序。所以用户可以利用Hadoop轻松地组织计算机资源,从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量数据的处理

xxstong 2016-09-17   614   0
1 2 3 4 5 6 7 8 9 10