0推荐
23K 浏览

分布式日志收集系统: Facebook Scribe之配置文件

其实我们研究一个开源的系统,第一步通常是先把它用起来,因为一个开源的系统能够出现在大家的面前肯定是比较出名和流行的,所有功能是比较出色的。所以我们必须很清楚的这些功能,而scribe最大的...
0推荐
30K 浏览

Ubuntu11.10下安装Hadoop1.0.0(单机伪分布式)

Ubuntu11.10下安装Hadoop1.0.0(单机伪分布式)
0推荐
21K 浏览

云计算工具 BitNami Cloud Tools

BitNami Cloud Tools 将 Amazon Web 服务工具和预先配置好的 Java 和 Ruby 语言的运行环境在一起,提供自容器易用的分发版,其目的是:简化 AWS 服务的开发。
0推荐
60K 浏览

Hadoop入门之HDFS与MapReduce

Hadoop的核心就是HDFS与MapReduce
0推荐
77K 浏览

Spark,一种快速数据分析替代方案

虽然 Hadoop 在分布式数据分析方面备受关注,但是仍有一些替代产品提供了优于典型 Hadoop 平台的令人关注的优势。Spark 是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相...
0推荐
105K 浏览

开源云计算系统 Spark

Spark是一个开源的集群计算系统,用于快速数据分析,包括快速运行和快速写操作。
0推荐
243K 浏览

基于ZooKeeper的分布式Session实现

ZooKeeper是一个为分布式应用程序提供高性能协调服务的工具集合。它可以应用在一些需要提供统一协调服务的case中,例如命名、配置管理、同步和组服务等。而在我们的case中,它被作为一个协调...
0推荐
118K 浏览

轻松使用Hadoop RPC

Hadoop RPC是Hadoop的一个重要部分,提供分布式环境下的对象调用功能,源码在org.apache.hadoop.ipc中。而HBase也几乎完全copy了这部分的源码,只是在配置项上...
0推荐
28K 浏览

Hadoop集群数据处理API:Cascading

Cascading是一个架构在Hadoop上的API,用来创建复杂和容错数据处理工作流。它抽象了集群拓扑结构和配置来快速开发复杂分布式的应用,而不用考虑背后的MapReduce。
0推荐
56K 浏览

Hadoop Streaming使用简介

它是hadoop的一个工具,用来创建和运行一类特殊的map/reduce作业。所谓的特殊的map/reduce作业可以是可执行文件或脚本本件(python、PHP、c等)。Streaming使...
0推荐
34K 浏览

淘宝Oceanbase云存储系统实践

通俗地讲,云计算就是把基础设施以服务的形式打包对外销售,它是一种商业模式,而其中的云存储是技术难点。可以从两个维度分析云存储系统的特 性:功能和可扩展性,这是一个“鱼和熊掌”不容易兼得的问题。不...
0推荐
119K 浏览

与ZooKeeper相似的项目BookKeeper介绍

BookKeeper是一个可靠地记录日志流的一个系统, 它是被设计来记录Write Ahead Log的(操作具体数据结构之前先记录日志),Write Ahead Log在数据库里面很常见, 实...
0推荐
35K 浏览

分布式计算框架 Fourinone

FourInOne(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我对分布式计算进行了长时间的思考,也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时,...
0推荐
30K 浏览

基于Web的操作系统 eyeOS

eyeOS 是一个PHP开发的免费的、多平台的,有操作系统性质的个人信息管理系统。这个系统包括完整的操作系统的结构,还有许多应用软件:日历、文件管理器、文本编辑器、内部的 IM、浏览器和计算器。...
0推荐
30K 浏览

Hadoop批处理调度器 Azkaban

Azkaban是个简单的批处理调度器,用来构建和运行Hadoop作业或其他脱机过程。
0推荐
36K 浏览

数据表和存储管理服务 HCatalog

Apache HCatalog是基于Apache Hadoop之上的数据表和存储管理服务。
0推荐
26K 浏览

弹性云计算平台 Cloudxy

CLOUDXY立足于实现虚拟子网(以太网)的弹性云计算平台 该项目主要包含有两个子项目: HLFS - 虚拟机分布式镜像存储 (类似于亚马逊EBS,首先发布出来)
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档