百度网盘背后的存储系统atlas 经验

每个机器4核、4GB内存、4个3T硬盘, 2U总共72TB存储, 相比普通机架服务器,存储密度提升1倍。arm存储机的内存量过小, 而文件系统产生的元数据过大, 考虑性能原因不能把文件存储成文件。 甚至也不能采用haystack存储方式,

er74 2015-07-26   20168   0

Hbase的基本概念及交互过程 博客

Hbas 是一个在 HDFS 上实现的面向列的分布式数据库 , 非常适合实时地随机读 / 写超大规模数据集 行 , 列族 , 列 , 主键 Hbase 中的行类似于数据库中的行 , 表中的行根据行的键值

jopen 2012-05-06   3080   0

漫画:什么是大数据? 经验

十或者上百PB级别。 面对这样规模的数据存储量,依靠单台数据库服务器显然是不够的,需要以分布式文件系统(例如 HDFS)作为基石。 在传统的关系型数据库中,所存储的数据都是 结构化

ShePedigo 2016-11-06   12509   0

一个电话 改变大数据命运的故事 资讯

App)并没有真正意义上地运行 Hadoop。 Hadoop 实际上是由两部分组成的软件平台,一个叫做 Hadoop 分布式文件系统的存储系统(HDFS),一个叫 MapReduce 的处理系统。你可以转储大量的数据在这个系统

jopen 2013-07-04   6842   0
P67

  chapter 4 命名与保护 文档

4.1 分布式系统中的命名 名字、标识符和地址 命名是给各种服务、对象和操作起个名字,并提供一种手段把这些名字变换成它们所代表的实体本身。 在分布计算系统中,命名系统的实现本身就是分布式的,是跨越多

dejunw 2013-02-05   1947   0

《京东技术解密》读书笔记:坚持技术十年如一日 经验

求用户极致体验的过程。 (5)刘海锋 带领团队自主研发了分布式文件系统JFS(Jingdong FileSystem)与分布式缓存与高速键值存储服务JimDB,使得京东云技术产生了质的飞跃。他

jopen 2016-01-10   30257   0
京东  

Kafka文件存储机制那些事 经验

Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志

jopen 2015-08-10   9815   0

10 个免费的网络监控工具 资讯

1. Monit Monit 是一个Linux/UNIX系统上开源的进程、文件、目录和文件系统监控和管理工具,可自动维护和修复一些错误的情况。 Monit is a great tool

jopen 2011-11-25   21133   2
P5

  MapR 初体验 文档

Inc的一个产品,号称下一代Hadoop,使Hadoop变为一个速度更快、可靠性更高、更易于管理、使用更加方便的分布式计算服务和存储平台,同时性能也不断提高。它将极大的扩大了Hadoop的使用范围和方式。它包含了开源

sweetbaybe 2012-12-24   2387   0
P34

  全文检索及Lucence原理、使用总结 文档

7. Sphinx一种可以和Mysql配合使用的全文检索系统 优点:高速、海量,算法优秀,支持分布式,功能、接口丰富,发行版本支持多平台。 缺点:有待学习接触。 8. Lucence简介基于 Java

religiose 2012-09-03   10827   0
P25

  Java Application程序基本结构 文档

既是一种解释执行的语言,也是一种编译执行的语言。4 5. Java的基本特点3-1简单 面向对象 分布式 Java的风格类似于C++,因而对C++程序员而言非常容易掌握Java编程技术; Java摒弃了

瑶瑶瑶 2016-11-20   4683   0
Java开发   HTTP   Java   C/C++   Go  

微博图床架构揭秘 经验

片数已经超过100亿,并持续保持一个高速增长的态势。 跨IDC的分布式存储系统 微 博图床平台是一个跨IDC的大规模分布式对象存储系统,也是新浪第一个实现跨IDC多主写入容灾,以实现全网服务可用性的技术平台。跨IDC多主写入意味

jopen 2015-01-25   22665   0

Flume安装操作使用 经验

制)的能力。 Flume 是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。它的主要目标是把应用程序中的数据传送到 Hadoop 的分布式文件系统( HDFS )。它基于数据流构建了一

jopen 2015-11-08   24413   0
Flume  

Kafka文件存储机制那些事 经验

Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以 当做MQ系统),常见可以用于web/nginx日

jopen 2015-01-13   162476   0

超越线程池:Java并发并没有你想的那么糟糕 经验

重载机器学习算法类似。谈到Hadoop,不得不说这个应用广泛的框架及它的组 件:Hadoop分布式文件系统(HDFS)、资源管理平台(YARN)、数据处理模块(MapReduce)和其他所需的类库和工具(Common)。

jopen 2015-03-24   17806   0
P34

  全文检索及Lucence 文档

7. Sphinx一种可以和Mysql配合使用的全文检索系统 优点:高速、海量,算法优秀,支持分布式,功能、接口丰富,发行版本支持多平台。 缺点:有待学习接触。 8. Lucence简介基于 Java

gongandkai 2011-08-16   6056   0

使用Docker、CoreOS、Mesos部署可扩展的Web应用 经验

Docker简化了人们使用Linux容器的方式,并且提供一些非常实用的特性,比如Dockerfiles、Docker Hub、分层文件系统。在本文中,我将使用使用Amazon S3 API的VIPR搭建私有的Docker Registry以存储镜像(如我

Docker 1.10:新的Compose文件、安全性增强、网络功能以及更多 资讯

10,其中满载着大量各位朋友一直期待的全新功能特性。 现在我们已经能够更轻松地利用Docker Compose定义并运行复杂的分布式应用。Compose所带来的强大容器编排能力如今已经可用于网络及分卷的设置。在大家的开发设备当中,

jopen 2016-02-05   7214   0
Docker  
P11

  大数据方案介绍 文档

部署配置监控、可视化处理等等方方面面。 大数据分析平台 一、海量数据存储及扩展能力 基于分布式HDFS文件系统存储,HA高可用配置, 数据多副本,异地备份容灾能力,以最经济的硬件成本支持海量数据存储和扩容。

guet_lee 2017-01-12   1929   0

Facebook是如何存储每天20亿张照片的 - Cold Storage系统揭秘 资讯

Facebook还对数据存取进行了彻底改造。由于大多数现代文件系统在设计上的缺陷,这些文件系统基本上 无法胜任短时间内进行大量频繁的加载与卸载操作。而且而且由于文件系统处在非常底层的位置,导致错误调试非常困难。Facebook的做法是跳过文件系

jopen 2015-05-12   9842   0
1 2 3 4 5 6 7 8 9 10