0推荐
31K 浏览

Android(HTC G7) 安装 Hadoop 伪分布

在HTC G7 上运行 ubuntu for android。并安装jdk1.7 arm 和 hadoop。 期间遇到了ssh问题,等各种问题,对于需要安装Ubuntu系统的手机,首先需要获...
0推荐
20K 浏览

CloudStack 4.1.0 安装详解 - 2、KVM

KVM(kernel-based Virtual Machine)是一个开源的系统虚拟化平台,自Linux 2.6.20之后已集成到Linux内核中,因它使用Linux自身的调度器进行管理,所以...
0推荐
115K 浏览

云计算的技术路线探讨

当前的“云计算”一词已经被神话,似乎快成了放之四海皆准的时髦真理,就好比当初言必称“希腊”一般,表面光芒四射,但实际上却无比教条、且越来越令人生厌。 作为“云计算”的一个普通开发者和推...
0推荐
18K 浏览

Apache Crunch:简化MapReduce编程的Java库

Apache Crunch(孵化器项目)是基于Google的FlumeJava库 编写的Java库,用于创建MapReduce流水线。与其他用来创建MapReduce作业的高层工具(如Apac...
0推荐
37K 浏览

开源云(IaaS)计算解决方案 CloudStack 4.1.0 安装详解 - 1、管理节点

CloudStack是一个功能强大、UI友好的开源云(IaaS)计算解决方案。自Ctrix将CloudStack捐献给 apache 后,一直持续高速发展,其社区活跃度已经渐渐赶上风头一时无两的...
0推荐
26K 浏览

Hadoop 实现多文件输出

Hadoop 实现多文件输出
0推荐
39K 浏览

Hadoop 统计文件中某个单词出现的次数

Hadoop 统计文件中某个单词出现的次数
0推荐
84K 浏览

Hadoop HDFS文件操作的Java代码

Hadoop HDFS文件操作的Java代码
0推荐
31K 浏览

HAProxy + Keepalived + Flume 构建高性能高可用分布式日志系统

HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代 理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。HAProxy特别适用于那些负载特大的web站点,这些站点通...
0推荐
29K 浏览

基于FUSE开发用户空间文件系统:kpfs

kpfs是一款基于FUSE开发的用户空间文件系统,实现了在Linux中对快盘的基本操作。当文件系统挂载到Linux的某个文件夹下,用户只需像普通文件一样操作自己快盘中的目录和文件。
0推荐
18K 浏览

文件集群存储系统:Hados

Hados能够将文件存储在一个服务器集群中。它的目标是高可用性得处理存储在多个节点上相同文件的副本。它提供的RESTful API可以轻松存储,检查,或检索文件。使用群集API,你可以检索从哪个...
0推荐
41K 浏览

zookeeper安装

ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关...
0推荐
31K 浏览

云计算服务模型,第 1 部分: 基础架构即服务(IaaS)

本文介绍三个云类别中的第一个:基础架构即服务(infrastructure as a service,IaaS)。对于企业而言,IaaS 的巨大价值通过云爆发(cloudbursting...
0推荐
16K 浏览

MapReduce新版客户端API源码分析

使用MapReduce新版客户端API提交MapReduce Job需要使用 org.apache.hadoop.mapreduce.Job 类。JavaDoc给出以下使用范例。
0推荐
52K 浏览

CloudStack云基础架构的一些概念

一个区域在CloudStack配置中是最大的组织单元。一个区域通常代表一个单独的数据中心,虽然在一个数据中心也允许有多个区域。将基础架构设施加入到区域中的好处是提供物理隔离和冗余。例如,每...
0推荐
15K 浏览

在Ubuntu上安装集群模式的Hadoop

在安装好单机模式的hadoop之后,我们就可以着手来在集群模式下安装hadoop了。在安装了单机版hadoop的机器上将hadoop转成集群模式是很容易的。首先来设置网络。
0推荐
47K 浏览

Python实现的分布式计算框架:DPark

DPark 是 Spark 的 Python 克隆,是一个Python实现的分布式计算框架,可以非常方便地实现大规模数据处理和迭代计算。 DPark 由豆瓣实现,目前豆瓣内部的绝大多数数据分析都...
0推荐
52K 浏览

使用zookeeper实现分布式共享锁

分布式系统中经常需要协调多进程,多个jvm,或者多台机器之间的同步问题,得益于zookeeper,实现了一个分布式的共享锁,方便在多台服务器之间竞争资源时,来协调各系统之间的协作和同步。
0推荐
291K 浏览

Avro简介

Avro是Hadoop中的一个子项目,也是Apache中一个独立的项目,Avro是一个基于二进制数据传输高性能的中间件。在Hadoop的其他项目中例如HBase(Ref)和Hive(Ref)的C...
0推荐
33K 浏览

分布式处理系统:Apache Giraph

Apache Giraph 是一个可伸缩的分布式迭代图处理系统,灵感来自 BSP (bulk synchronous parallel) 和 Google 的 Pregel. Giraph 区别...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档