消息系统kafka及其变种Jafka、Metamorphosis (MetaQ) 经验

-------------------- 以下内容来自oschina的介绍 kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使

jopen 2016-01-05   10274   0

Docker周报第25期 资讯

深入浅出Mesos(一):为软件定义数据中心而生的操作系统 Mesos是Apache下的开源分布式资源管理框架,它被称为是分布式系统的内核。Mesos最初是由加州大学伯克利分校的 AMPLab开发的,后在Twi

phpw34 2015-04-21   19195   0
Docker  

Hadoop集群部署及常见问题超细详解答 经验

1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google

jopen 2013-10-24   69931   0
P16

  zookeeper 理论及使用 文档

2014-07-23 2. 2目录2 分布式系统面临的问题 简介 总体架构 数据模型 Watcher 使用实例 目前使用 3. 3分布式系统面临的问题3分布式协作算法很复杂,实现起来很困难。 分布式系统中更容易出现资源竞争或者死锁现象

dy3168729 2016-04-25   4414   0

新一代弹性云计算平台 Cloudxy 发布 0.1 版 资讯

Cloudxy立足于实现虚拟子网(以太网)的弹性云计算平台, 该项目主要包含有两个子项目: HLFS - 虚拟机分布式镜像存储 (类似于亚马逊EBS,首先发布出来) ECM - 虚拟环境管理系统 (后续发布)

jopen 2011-11-28   8803   0

互联网需尽快推行IPFS协议 资讯

的原因就是 HTTP 通信链上的某个连接出问题了。) 使用 IPFS 重构互联网 行星际文件系统(InterPlanetary File System)这个名字出自利克莱德( J.C.R. Licklider

jopen 2015-10-10   9465   0

“Ceph浅析”系列之(三)—Ceph的结构 经验

, Autonomic, Distributed Object Store,即可靠的、自动化的、分布式的对象存储) 顾 名思义,这一层本身就是一个完整的对象存储系统,所有存储在Ceph系统中的用户

jopen 2014-11-21   52558   0

变不可能为可能,Tachyon帮助Spark变小时级任务到秒 资讯

集群计算和大数据技术已经取得了很多进展,不过现在很多大数据应用使用的还是HDFS这一分布式分件系统。HDFS是一个基于磁盘的文件系统,将数据存储在磁盘上有一些问题,比如说面临法律的监管,由磁盘读写造成的延迟也

jopen 2016-03-03   17142   0

用于大数据的开源预测引擎:H2O 经验

H2O的核心是一个统计分析引擎,它使用Hadoop的分布式文件系统(HDFS)作为其存储平台,但是它们的最终目标是像谷歌的BigQuery一样简单。H 2 O的用户交互是通过一个简单的网络搜索和标准R

jopen 2013-11-19   29336   0
H2O  

Spring Hadoop - 在 Spring 框架下编写 Hadoop 应用的支持。 经验

Hadoop使MapReduce、Streaming、Hive、Pig和级联工作能够通过Spring容器执行。Hadoop分布式文件系统的数据访问是通过JVM的脚本语言,如Groovy和JRuby启用。此外,还计划支持Hadoop

openkk 2012-06-09   27826   0

从零开始学习 Ceph 经验

对象存储 以及 文件系统 服务。 本书将从零开始,介绍Ceph的用法以及CRUSH、RADOS等底层技术。借助Ceph官方提供的容器,任何人都可以在本地体验此教程,学习分布式存储系统就像家庭作业一样简单。

pm45e 2015-08-03   58302   0
Ceph   Docker  
P16

  Map/Reduce工作原理 文档

Hadoop原来是Apache Lucene下的一个子项目,它最初是从Nutch项目中分离出来的专门负责分布式存储以及分布式运算的项目。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。下面列举hadoop主要的一些特点:

jsyzthz 2011-08-13   8574   0

用Apache Spark进行大数据处理——第一部分:入门介绍 经验

需要将所有用例都转换成MapReduce模式。 在下一步开始之前,上一步的作业输出数据必须要存储到分布式文件系统中。因此,复制和磁盘存储会导致这种方式速度变慢。另外Hadoop解决方案中 通常会包含难以安装

jopen 2015-04-02   62295   0

大数据处理框架Apache Spark入门 经验

需要将所有用例都转换成MapReduce模式。 在下一步开始之前,上一步的作业输出数据必须要存储到分布式文件系统中。因此,复制和磁盘存储会导致这种方式速度变慢。另外Hadoop解决方案中 通常会包含难以安装

jopen 2015-11-16   61047   0

使用Docker部署PHP应用的设计方案 经验

M容器和另外三个容器间有耦合关系,MySQL容器最独立。 虽然耦合性比较大,但这种端口耦合,文件系统耦合关系可以通过增加几个运行选项解决掉,后面有介绍。 由于容器对整个架构的划分,使得容器中的

jopen 2015-08-30   14918   0
Docker  

支付宝、微博、阿里云专家联合解读红包浪潮下的核心技术架构 资讯

年以上操作系统以及存储研发经验,在块存储,文件系统等领域为 Linux 内核主线做出了卓越的贡献,在 Linux 内核主线有超过 300 个提交,同时对分布式文件系统分布式存储等领域也有多年深入的研究。目前目前带领团队负责阿里巴巴

jopen 2017-02-14   16933   0

大数据处理框架,Apache Spark 1.5.2 发布 资讯

用例都转换成MapReduce模式。 在下一步开始之前,上一步的作业输出数据必须要存储到分布式文件系统中。因此,复制和磁盘存储会导致这种方式速度变慢。另外Hadoop解决方案中通常会包含难以安装和

jopen 2015-11-15   21282   0

使用etcd+confd管理nginx配置 经验

2、实现框架 看完nginx的配置不难发现,nginx是一个典型的key value类型的,而且与文件系统的非常类似,一个目录下面可以包含其他配置,目录下还可以有目录,嵌套多层。如今key value类

HowardDeCha 2016-11-28   14794   0

Git由浅入深之基础理论 经验

该知道什么是Git,Git是如何工作的,以及Git与SVN等分布式版本控制系统的主要区别。 什么是Git 一言以蔽之,Git是一个分布式版本控制系统(DVCS),大家都知道,那它与其他的集中式版本

znzdl123 2017-01-09   33478   0
P24

  10天掌握MongoDB第六天:进阶指南 文档

提供的用于存储大型二进制数据的机制。它本身就是一个分布式文件系统: GridFS会直接利用已建立的复制、分片机制; GridFS可以避免传统文件系统的某些弊端,例如同一目录下文件数量过多; GridFS不会产生磁盘碎片;

sunzhe336 2012-02-16   552   0
1 2 3 4 5 6 7 8 9 10