开源项目,开源代码,开源文档,开源新闻,开源社区_深度开源

Apache Hadoop 2.6.0发布了，新的稳定版，发布频率和质量越来越高了，增加了很多东西，从安装包的大小就能看出来，直接增加了50M，30%有木有。下面看一下，2.6.0都有啥好东西。

jopen 2014-12-07 6536 0

P83

Hadoop源代码分析（一）关键字: 分布式云计算 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster： http://research

bluesky666 2015-05-05 2182 0

Hadoop 分布式/云计算/大数据

P17

Windows下使用Hadoop实例 1.1 Windows 下使用Hadoop 的环境配置（1）安装Hadoop 前，首先需要安装Cygwin 首先下载Cygwin，当setup.exe 下载

porchidy 2013-09-08 3685 0

Hadoop 分布式/云计算/大数据

Hadoop 集群中有三种作业调度算法，分别为 FIFO ，公平调度算法和计算能力调度算法先来先服务（FIFO） FIFO 比较简单， hadoop 中只有一个作业队列，被提交的作业按照先后顺序

jopen 2012-09-15 18744 0

Hadoop 算法

Hadoop的架构知识 Hadoop是一个能够对大量数据进行分布式处理的软件框架，实现了Google的MapReduce编程模型和框架，能够把应用程序分割成许多小的工作单元，并把这些单元放到任

jopen 2013-05-07 26645 0

Hadoop 分布式/云计算/大数据

在Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起，这样才能够达到目的。在Hadoop生态圈中，有一个相对比较新的组件叫做Oozie，它让我们可以把多个Map/Reduce作

jopen 2014-12-04 21701 0

Hadoop 分布式/云计算/大数据

P30

1Hadoop与数据分析淘宝数据平台及产品部基础研发组周敏日期：2010-05-26 2. OutlineHadoop基本概念 Hadoop的应用范围 Hadoop底层实现原理 Hive与数据分析

qsf113 2012-05-09 664 0

Hadoop 分布式/云计算/大数据方案 SQL Go

P

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束，来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。这个项目的地址是http://hadoop.apache.org/core/。

bmml123 2012-03-21 10514 0

Hadoop 分布式/云计算/大数据

P21

Hadoop HDFS安装和管理 1. HDFS安装 1.1. 环境准备由于相对hdfs的客户端存在相对路径问题，参见《Hadoop HDFS开发参考》，我们修改了hadoop-0.18.1的源码

huafenged 2011-08-17 5478 0

Hadoop 分布式/云计算/大数据

P10

本文档主要是针对Hadoop最基本知识的了解，对于刚刚接触Hadoop学习过程中的总结。 1、 Hadoop是什么 Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分

sweetbaybe 2012-03-14 3088 0

Hadoop 分布式/云计算/大数据

P25

hadoop生产集群规划 # 问题/重标 # 提示 # 文本应用系统 CenOS …..64 hadoop集群中的模块逻辑结构 hadoop运行的软硬件环境标准的X86服务器以太网软件环境 Hadoop-2

sunny-1 2017-02-13 2107 0

Hadoop 分布式/云计算/大数据 x86

P8

桌面(暂不安装) 6. 二．安装hadoop 如果没有装SSH,则 sudo apt-get install openssh-server Setp 1. 设定登入免密码由于Hadoop用ssh作机器间的沟通，因此先设定登入机器免密码

szx85307 2012-05-28 2632 0

Hadoop 分布式/云计算/大数据

P83

Hadoop源代码分析（一）关键字: 分布式云计算 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster： http://research

leroy 2011-08-16 3752 0

Hadoop 分布式/云计算/大数据

4、设置ambari server ambari-server setup 一路按确定即可，ambari-server会用到数据库，自行选择默认使用 PostgreSQL ，如果你选择使用 mysql还需要把jdbc驱动放到/

jopen 2014-01-19 49758 0

Ambari 分布式/云计算/大数据

P8

Hadoop 是2005 Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样，

xfj3526 2012-06-13 5194 0

Hadoop 分布式/云计算/大数据

hadoop 在虚拟机上（远程连接也是一样只需要知道 master 的 ip 和 core-site.xml 配置即可。 Vmware 上搭建了 hadoop 分布式平台： 192.168

jopen 2014-12-10 127194 0

Eclipse Eclipse开发工具

1、下载hadoop，解压这个可以到 http://hadoop.apache.org/ 里面找到 2、配置.bashrc文件 3、创建hadoop数据保存我创建在了hadoop文件里，名字叫做data

jopen 2015-05-09 14544 0

Hadoop 分布式/云计算/大数据

Lucene、Nutch 、Hadoop 等项目的发起人。是他，把高深莫测的搜索技术形成产品，贡献给普罗大众；还是他，打造了目前在云计算和大数据领域里如日中天的 Hadoop。他是某种意义上的盗火者，他就是

jopen 2013-04-25 23794 0

Hadoop

P12

CentOS的Hadoop集群配置参考资料： http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

tony2007 2015-06-20 486 0

Hadoop 分布式/云计算/大数据

P4

Hadoop集群搭建 1. 机器规格 CPU：2个四核 2~2.5 GHz CPU 内存：8~16GB ECC RAM(非ECC会产生校验和错误) 存储器：4*1T SATA硬盘（硬盘大小一般是数据量的3—5倍）

serisboy12 2015-04-02 1475 0

Hadoop 分布式/云计算/大数据

Hadoop招聘数据的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

SQL Eclipse Hadoop x86 Eclipse开发工具分布式/云计算/大数据 Apache Hadoop Ambari