0推荐
15K 浏览

Hadoop YARN中内存和CPU两种资源的调度和隔离

同时支持内存和CPU两种资源的调度(默认只支持内存,如果想进一步调度CPU,需要自己进行一些配置),本文将介绍Hadoop YARN是如何对这些资源进行调度和隔离的。
0推荐
33K 浏览

Dryad 微软的分布式运算框架

Dryad的论文是微软早在2007年就发布的,Tez的核心思想来源于Dryad,差不多可以算是Dryad的开源实现吧。最近正好看到几个有趣的项目是基于Tez实现的,于是顺便追本溯源,学习了一下D...
0推荐
11K 浏览

分布式系统治理:JBoss Overlord

任何计算机系统,无论是集中式或分布式,需要某种形式的治理,即。监控和管理系统的行为。等治理可能简单,确保只有授权用户可以访问的功能(如服务),或保证一样复杂系统及其组件保持可用性或可靠性水平的存...
0推荐
15K 浏览

分布式基础信息管理系统:swall

swall是一个基于zookeeper实现的分布式基础信息管理系统(Infrastructure Management)可以用于管理特别是架构比较灵活的服务,比如游戏。用swall,你不用登陆到...
0推荐
18K 浏览

Moosefs分布式文件系统集群讲解配置

本篇为大家分享一下关于MooseFS的相关知识,以及简单的安装配置介绍。MooseFS是一种分布式文件系统,它通过四个节点服务器来进行整个分布式文件系统的正常运作,包括管理服务器,元数据日志服务...
0推荐
80K 浏览

MongoDB GridFS图片文件存储解决方案

Mongodb GridFS图片文件存储解决方案 之前解决方案是接收图片数据后,将图片直接存储到盘阵,然后通过Apache做服务器,将图片信息存储到数据库,并且存储一个Apach...
0推荐
16K 浏览

云管理软件:ManageIQ

ManageIQ的产品与红帽的开放式混合云战略相一致,可以为红帽带来涵盖不同提供商技术的运营管理能力,比如来自红帽,VMware,微软,亚马逊以及其它厂商的技术。
0推荐
173K 浏览

Zookeeper应用 - 集中配置管理系统的实现

一个带配置的服务程序,部署在若干台机器上,如果配置发生了变化,接下去要进行的操作是停止所有机器上的该程序,修改每一台机器上该程序对应的配置文件。 这个情景会有两个问题:第一,机器多了,逐个修改配...
0推荐
76K 浏览

基于 Hive 的文件格式:RCFile 简介及其应用

Hadoop 作为MR 的开源实现,一直以动态运行解析文件格式并获得比MPP数据库快上几倍的装载速度为优势。不过,MPP数据库社区也一直批评Hadoop由于文件格式并非为特定目的而建,因此序列化...
0推荐
41K 浏览

容器性能分析工具:cAdvisor

cAdvisor 是谷歌公司用来分析运行中的 Docker 容器的资源占用以及性能特性的工具。
0推荐
11K 浏览

HDFS 的优化实现:ADFS

ADFS(Ali Distributed File System)是基于hadoop开源分布式系统HDFS的一种优化 实现,能够将HDFS中单点master namenode节点中的内存数据结构...
0推荐
12K 浏览

MongoDB GridFS 开发库:asyncgridfs

Tornado 非阻塞的 MongoDB GridFS 开发库
0推荐
13K 浏览

56网的视频文件系统:56vfs

56vfs是56网的视频文件系统,包括以下三个不部分: 1,文件分发系统(主要) 2,文件分发信息管理系统 3,文件分发信息查询系统
0推荐
49K 浏览

Spark1.0.0生态圈一览

Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器 (Machines)、人(People)之间通过大规模集成,...
0推荐
15K 浏览

数据存储系统:Cockroach

Cockroach 是一个可伸缩的、支持地理位置处理、支持事务处理的数据存储系统
0推荐
15K 浏览

Spark:一个高效的分布式计算系统

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop Map...
0推荐
41K 浏览

基于Hadoop Yarn的DAG(有向无环图)计算框架:Apache Tez

Apache Tez是基于Hadoop Yarn之上的DAG(有向无环图,Directed Acyclic Graph)计算框架。它把Map/Reduce过程拆分成若干个子过程
0推荐
22K 浏览

基于Hadoop的BSP计算框架:Apache Hama

Apache Hama是一个建立在Hadoop上基于BSP(Bulk Synchronous Parallel)的计算框架,模仿了Google的Pregel。
0推荐
53K 浏览

Hadoop开发使用备记

使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成功,更引发了它本身的加速发展。现...
0推荐
19K 浏览

开源分布式存储系统:katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。 Katta可用于大量、重复、索引的碎片,以满足高负荷和巨大的数据集。这些索引可以是不同的类型。当前该实现在Lucene和H...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档