P50

  从零到十亿 - 大型网站架构设计变迁 文档

大量上传文件的存储日益成为显著问题 没有系统日常跟踪,无法判断系统日常运行状态 32. 解决设计中间层服务(分布式架构) 分布式缓存系统 分布式存储系统 数据的水平划分 搜索引擎系统 日志系统 开放平台 33. 中间层服务设计设计目标

kaka4523 2012-08-23   2996   0

Hadoop之父Doug Cutting 资讯

为支持自家的搜索引擎而开发的软件平台。这两个平台一个是 GFS(Google File System),用于存储不同设备所产生的海量数据;另一个是 MapReduce,它运行在 GFS 之上,负责分布式大规模数据。基于这两个平台,Cutting

jopen 2013-04-25   23794   0
Hadoop  
P50

  Java计算池技术架构 文档

数据库集群-Continuent,squeoia,mysql 自动化维护管理-cfengine+SVN 监控系统-分布式集群监控系统ganglia 管理系统 13. SVN/监控/配置引擎自动化管理Java应用LVS,入口LVS

huafenged 2011-08-18   518   0

大型网站运维探讨和心得 经验

c、大规模集群管理工具的开发,如1万台机器如何在1分钟内完成密码修改、或运行指定任务?2000台服务器如何快速安装操作系统?各分布式IDC、存储集群中数PT级的数据如何快速的存储、共享、分析?等一系列挑战都需运维工程师的努力。

fmms 2012-02-22   52499   0

15 位健在的牛叉程序员,你知道哪几位? 资讯

主要成就:Lucene 的缔造者 上榜理由:他开发了Lucene搜索引擎,Nutch网络爬虫引擎以及Hadoop分布式大数据处理工具。他是开源项目的拥趸(Lucene,Nutch和Hadoop都是开源的)。他还担任过Apache软件基金会的总监。

jopen 2016-01-10   24043   0

超神们:15 位健在的世界级程序员! 资讯

Lucene 生平: 开发了 Lucene 搜索引擎以及 Web 爬虫 Nutch 和用于大型数据集的分布式处理套件 Hadoop 。一位强有力的开源支持者(Lucene、Nutch 以及Hadoop 都是开源的)。前

jopen 2017-02-14   15094   0

超神们:15 位健在的世界级程序员! 资讯

Lucene 生平: 开发了 Lucene 搜索引擎以及 Web 爬虫 Nutch 和用于大型数据集的分布式处理套件 Hadoop 。一位强有力的开源支持者(Lucene、Nutch 以及 Hadoop 都是开源的)。前

jopen 2015-11-25   19277   0

在Google使用Borg进行大规模集群的管理 1-2 资讯

是有一个控制器,可以提交job。前2个框架类似于YARN的应用管理器[76]。我 们的分布式存储系统,例如GFS[34]和他的后继者CFS、Bigtable[19]、Megastore[8]都是跑在Borg上的。

jopen 2015-10-12   11897   0
Google  

2011年最具影响力的16个开源项目 资讯

HBase HBase是一款开源的非关系数据库,主要基于Google BigTable分布式数据库并使用Java语言编写,并运行在HDFS(Hadoop Distributed Filesy

jopen 2012-01-28   34341   1
开源  
P24

  Apache Hadoop介绍 文档

HadoopApache Hadoop 是一个用java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。 4. Hadoop 组成Hadoop corePIGHBaseZooKeeper

观光阁 2011-05-15   17718   0
P20

  hadoop个人理解 文档

在独立模式中,会用到本地文件系统和本地MapReduce任务运行器 在分布模式,HDFS和MapReduce守护进程会启动 初识Hadoop Hadoop的子项目 Core 一系列分布式文件系统和通用I/O的组件和接口(序列化,Java

ymkyve 2016-12-26   2233   0

盘点大数据开源软件Google Trends指数 资讯

理或虚拟机器中抽离了CPU,内存,存储以及其它计算资源, 很容易建立和有效运行具备容错性和弹性的分布式系统。 Ambari 作为Hadoop生态系统的一部分,提供了基于Web的直观界面,可用于配置

jopen 2017-04-06   46308   0
P32

  Hadoop 学习总结 文档

1. Hadoop---------------分布式开发框架 2. 目录 3. 数据纽约证券交易所每天产生1TB的交易数据 社交网站facebook的主机存储着约10亿张照片,占据PB级存储空间 互

orangeking 2012-06-29   8911   0
P32

  Hadoop学习总结 文档

1. Hadoop---------------分布式开发框架 2. 目录 3. 数据纽约证券交易所每天产生1TB的交易数据 社交网站facebook的主机存储着约10亿张照片,占据PB级存储空间 互

lxj2008 2014-01-19   553   0

部署大数据?请参考大数据分析平台架构(Big Data Analytics Platform) 经验

思想来源 于Google Dremel,充分利用分布式的集群和高效存储方式来加快大数据集上的查询速度,这也就是我上面说到的近似实时查询;底层的文件系统当然是HDFS独大, 也就是Hadoop的底层存储

jopen 2015-04-03   72981   0
P13

  Hadoop官方文档0.18 文档

或者浏览一下存档邮件。 · Hadoop快速入门 · Hadoop集群搭建 · Hadoop分布式文件系统 · Hadoop Map-Reduce教程 · Hadoop本地库 · API参考 · 维基

pkuxiaoq 2011-05-31   519   0
P64

  MongoDB .NET 开发 文档

很大或写频率过高,单台主服务器无法处理的应用程序,可以使用MongoDB的自动分片模式,分片相于分布式存储,有点像关系SQL中的分表操作,但这些分表都可同时写操作,这种方式可有效缓解对单台服务器的压力

叶荣军 2012-08-22   4394   0
P38

  备份管理 文档

看消耗很大,但是简化了恢复过程。 三、备份周期 1. 周循环 2. 日循环 3. 月循环 4. GFS循环 1. 周循环 每周开始完成依次完全备份,在随后的每天进行增量备份。这样包含备份数据的磁带相对较少,恢复相对简单。

zuoxt 2012-07-23   2019   0
P6

  无线音乐俱乐部wap门户日志系统云计算应用解决方案 文档

编程工具和分布式文件系统,与MapReduce和Google档案系统的概念类似。 Ø HDFS(Hadoop Distributed File System):是hadoop的分布式文件系统。 Ø N

iloveyepp 2012-11-07   436   0
P11

  迅捷英翔-12530云计算平台解决方案 文档

。 Ø hadoop:Hadoop是Apache软件基金会所研发的开放源码并行运算编程工具和分布式文件系统,与MapReduce和Google档案系统的概念类似。 / 11 e8a573d672f450915679847d05a36d01

iloveyepp 2012-11-07   4390   0
1 2 3 4 5 6 7 8 9 10