P10

  HBase Architecture(中) 文档

path。   最终,当memstore的达到一定大小后,或者过了特定时间段后,数据就会异步地持久化到文件系统中。在此期间数据都是保存在内存中的。WAL可以保证数据不会丢失,即使是在服务端完全失败的情况下。

lanbocui 2012-08-21   2232   0
P44

  最全面的门户网站架构设计方案 文档

案,提高系统的鲁棒性,同时可供了灵活的虚拟VIP配置和管理功能,可以同时满足多种应用需求,这对于分布式的系统来说必不可少。 一个典型的使用负载均衡的策略就是,在软件或者硬件四层交换的基础上搭建squi

909910149 2011-07-07   23356   0
P43

  国内各大门户网站架构设计方案 文档

案,提高系统的鲁棒性,同时可供了灵活的虚拟VIP配置和管理功能,可以同时满足多种应用需求,这对于分布式的系统来说必不可少。 一个典型的使用负载均衡的策略就是,在软件或者硬件四层交换的基础上搭建squi

xntdev 2012-06-28   960   0

hadoop框架详细分析 经验

mapreduce是一种模式,一种什么模式呢?一种云计算的核心计算模式,一种分布式运算技术,也是简化的分布式编程模式,它主要用于解决问题的程序开发模型,也是开发人员拆解问题的方法。 如下图所示

jopen 2013-11-28   306378   0
P44

  中国移动Big Cloud平台(经分培训)v1.0 文档

能力打造互联网神话大规模数据处理和存储(五大巫术) 分布式文件系统 GFS 并行计算框架 MapReduce 分布式数据库 BigTable 分布式锁服务 Chubby 云计算集群管理和调度系统创新数据中心技术

ljp123456 2014-03-22   2311   0
P21

  海量数据分析:sawzall并行处理 文档

于研究这些超大数据集来说那就是没有意义的。此外,对于这些数据集的分析可以展示成为应用简单的,便于分布式处理的计算方法:比如过滤,聚合,统计抽取,等等。我们在这里介绍这样一种这样的自动化分析系统。在过滤

freemark 2010-09-12   3398   0
P55

  Hadoop入门实战手册 文档

下载 7 3.4 运行Hadoop集群的准备工作 7 3.5 单机模式的操作方法 7 3.6 伪分布式模式的操作方法 8 3.6.1 配置 8 3.6.2 免密码ssh设置 9 3.6.3 执行 9 4

somnus_sta 2012-09-13   629   0

GitLab 的高可用性 经验

幸运的是,GitLab 提供了一个稳定的设置,即使实在一个没有特别措施的服务器上也能应用. 而由于分布式的天然特性,即使GitLab不能使用,git使用者也仍然能够提交代码. 不过,GitLab的一些特

jopen 2014-12-15   37928   0
P67

  Hadoop源码分析-HDFS部分 文档

2008-11-04 Hadoop源代码分析(一)总括 关键字: 分布式 云计算 经济不行啦,只好潜心研究技术。 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。

dishad631 2010-10-01   492   0

开源大数据处理系统/工具大全 经验

是用来进行大数据查询的补充工具。 Impala 并没有取代像Hive这样基于MapReduce的分布式处理框架。Hive和其它基于MapReduce的计算框架非常适合长时间运行的批处理作业,例 如那些涉及到批量

ew45 2015-03-12   325553   0

大数据基础架构总结 经验

简介 :本文是对大数据领域的基础论文的阅读总结,相关论文包括GFS,MapReduce、BigTable、Chubby、SMAQ。 大数据出现的原因 : 大多数的技术突破来源于实际的产品需要,大数据最初诞生于谷歌的搜索引擎中。随着web2

jopen 2015-01-28   48655   0

Hadoop之父祝贺黄色小象的十岁生日快乐 资讯

ache Nutch项目时,Doug他们有了另外一个见解。当时正试图构建一个可以处理数十亿网页的分布式系统。但是,不如人意的是该过程进展相当缓慢:很难开发和运行这个软件。他们听到传闻说,谷歌公司(Go

jopen 2016-01-29   9843   0
Hadoop  

nutch2.0初体验------三大亮点 资讯

添加了对nosql存储层的支持,nutch和google原先的模型很像了,google的分布式文件系统GFS,nutch的HDFS,同样是使用 mapreduce算法处理,存储层google的big

jopen 2012-06-02   17048   0
nutch  

BigTable论文学习笔记 经验

Bigtable为Google设计的一个分布式结构化数据存储系统,用来处理Google的海量数据。Google内包括Web索引、Google地球等项目都在使用Bigtable存储数据。尽管这些应用需求

jopen 2013-12-09   47592   0

13款开源Java大数据工具 经验

HDFS HDFS是Hadoop应用程序中主要的分布式储存系统, HDFS集群包含了一个NameNode(主节点),这个节点负责管理所有文件系统的元数据及存储了真实数据的DataNode(数据节点,可以有很

jopen 2014-04-30   52548   0
开源  
P8

  HBase 简介 文档

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

songyl525 2013-12-11   3157   0
P9

  HBase 技术介绍 文档

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

hypermusic 2013-05-30   3005   0

HBase技术详细介绍 经验

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

fmms 2012-02-08   128579   0
P8

  HBase 技术介绍 文档

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

duchengli 2012-09-12   438   0

HBase技术介绍 经验

HBase简介 HBase - Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google

jopen 2015-03-25   23633   0
1 2 3 4 5 6 7 8 9 10