图片服务器架构 经验

Ext3 ,怎么也要测试一下吧? 创建文件系统的时候 Inode 问题也要加以考虑,选择合适大小的 inode size ,在空间和速度上做取舍,同时防患于未然,注意单个文件系统下文件个数别达到极限。 图片存储的技巧

jopen 2013-01-06   55165   0
P45

  大数据应用解决方案 文档

16 3.1.1.5. 数据质量和数据管理 17 3.1.2. 存储数据库 17 3.1.3. 分布式计算技术 18 3.2. 大数据处理过程 20 3.2.1. 采集 20 3.2.2. 导入/预处理

guet_lee 2017-01-12   2609   0

初步了解Hadoop平台 经验

重新执行。另外,它还提供了一个分布式文件系统(HDFS) 来在计算节 点上存储数据,为集群提供了非常高的聚合带宽。在本框架中无论是Map/Reduce还是分布式文件系统都被设计为能够自动地处理节点上的错误。

jopen 2014-04-03   32476   0

解秘:百度PaddlePaddle深度学习框架和搜索引擎基础架构 经验

搜索引擎,以及搜索引擎背后的事件。重点部分是百度这套开源的基础架构软件站,它包括分布式数据库、文件系统、管理系统、分布式协调服务、网络通信框架。下面来一一介绍。 当前,用户通过互联网搜索引擎的期望

icanb55sq 2016-10-24   15665   0
P6

  HDFS架构设计 文档

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是

yun007x 2010-12-28   6248   0
P24

  Hadoop 平台结构浅析 文档

1. Hadoop平台结构浅析什么是Hadoop? Hadoop是Apache下面的一个分布式并行计算框架,是从Lunece中抽取出来的一个框架。Hadoop的核心设计思想是MapReduce和HDFS

liu1122 2013-01-20   2848   0
P19

  zookeeper使用简介 文档

zookeeper使用简介 zoomkeeper分布式协作 场景一 有这样一个场景:系统中有大约100w的用户,每个用户平均有3个邮箱账号,每隔5分钟,每个邮箱账需要收取100封邮件,最多3亿份邮件

xnbw 2016-01-11   611   0

大型网站系统架构的演化 经验

对热点数据进行缓存,减少这些数据的访问路径,提高用户体验。 缓 存实现常见的方式是本地缓存、分布式缓存。当然还有CDN、反向代理等,这个后面再讲。本地缓存,顾名思义是将数据缓存在应用服务器本地,可以存在内存

jopen 2015-03-18   17537   0
架构  

解读大型网站系统架构的演化 经验

们可以对热点数据进行缓存,减少这些数据的访问路径,提高用户体验。 缓存实现常见的方式是本地缓存、分布式缓存。当然还有CDN、反向代理等,这个后面再讲。本地缓存,顾名思义是将数据缓存在应用服务器本地,可以存在内存

jopen 2014-12-03   26948   0
架构  

大型网站系统架构演化之路 问答

点数据进行缓存,减少这些数据的访问路径,提高用户体验。 缓 存实现常见的方式是本地缓存、分布式缓存。当然还有CDN、反向代理等,这个后面再讲。本地缓存,顾名思义是将数据缓存在应用服务器本地,可以存

jopen 2015-07-19   14552   1

zookeeper简介 经验

采用Zookeeper完全可以解决我们的问题,分布式计算中的协调员,观察者,分布式锁  都可以作为zookeeper的关键词,在系统中利用Zookeeper来处理事件通知,队列,优先队列,锁,共享锁等功能,利用这些特色在分布式计算中发挥重要的作用。

jopen 2014-11-08   606829   0

Ceph 管理和监控,Calamari 1.3 RC 发布 资讯

新一代自由软件分布式文件系统。自2007年毕业之后,Sage开始全职投入到Ceph开 发之中,使其能适用于生产环境。Ceph的主要目标是设计成基于POSIX的没有单点故障的分布式文件系统,使数据能容错和无缝的复制。2010年3

jopen 2015-01-08   16211   0
Ceph  
P2

  Hadoop API组成 文档

org.apache.hadoop.fs 定义了抽象的文件系统API。 3. org.apache.hadoop.dfs Hadoop分布式文件系统(HDFS)模块的实现。 4. org.apache.hadoop

willfly 2011-08-28   4194   0

数据库与存储方面的经典论文 经验

core components of Google's data infrastructure. GFS is an append-only distributed file system for large

jopen 2014-10-28   20393   0
P3

  大数据分析的流程浅析之一:大数据采集过程分析 文档

算机技术中的分布式计算开始发挥优势,它可以将6000台甚至更多的计算机组合在一起,让它们的硬盘组合成一块巨大的硬盘,这样人们就不用再害怕大数据了,大数据再大,增加计算机就可以了。实现分布式计算的软件有

czh_3104 2015-07-06   608   0
P45

  基于Hadoop的大数据应用分析 文档

大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。 Hadoop是项目的总称,主要是由分布式存储(HDFS)、分布式计算(MapReduce)等组成 。 优点:

xcxc 2015-08-24   782   0

夜话存储:从调侃OpenStack和Ceph谈起 经验

继续预热宣讲尚未解决元数据集群稳定性(也就是高可用)的 CephFS 文件系统;另一方面也听到 HP 内部测试了 Ceph 分布式块存储之后,认为其尚未达到商业部署要求,而在 Helion 中推荐自家的软件定义存储

jopen 2015-01-06   77300   0

阿里巴巴73款开源产品全向图 经验

nginx-tfs :nginx-tfs 是 Nginx 的扩展模块用于访问淘宝的 TFS 文件系统。 transmittable-thread-local :transmittable-thread-local

ZacheryWUN 2016-11-21   11229   0
P17

  Hadoop1.x以及2.x安装 文档

Hadoop-1.2.1的安装 2.Hadoop-2.6.0的安装 1 Hadoop-1.2.1的安装 1) 伪分布式的安装 a.下载hadoop-1.2.1的包,解压 b.配置环境变量 vim /etc/profile

小牛牛 2015-03-23   2407   0
P14

  ubuntu下搭建hadoop服务器集群 文档

xjavasunjava Linux公社 字号:T | T Hadop是一种分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。 AD:2013云计算架构师峰会课程资料下载

larruping 2017-01-03   1082   0
1 2 3 4 5 6 7 8 9 10