P7

  大数据存储和处理技术 文档

大数据存储和处理技术 • Hadoop:分布式存储和计算平台 • HDFS:分布式文件系统 • MapReduce:分布式计算框架 • NOSQL:分布式数据库 • MPP、内存计算与流计算平台 •

loveqiqi 2015-05-09   693   0
P53

  Oracle大数据解决方案- 文档

海量数据“经济方案”------经济便宜的X86服务器 海量数据“分而治之”------批量分布式并行计算Hadoop 海量数据“灵活多变”------实时分布式高吞吐高并发数据存取处理NoSQL 海量数据“跨越鸿沟”------大数据超高速装载进数据库

xiao_xiong 2013-05-14   3836   0

大数据与Hadoop之间是什么关系? 经验

的一个开源项目,它是一个对大量数据进行分布式处理的软件架构,在这个架构下组织的成员HDFS(Hadoop分布式文件系统),MapReduce、 Hbase 、Zookeeper(一个针对大型分布式系统的可靠协调系统),

pm45e 2015-08-03   32007   0

Apple使用Apache Mesos重建Siri后端服务 资讯

Mesos 将CPU、内存、存储介质以及其它计算机资源从物理机或者虚拟机中抽象出来,构建支持容错和弹性的分布式系统,并提供高效的运行能力。Mesos使用与 Linux内核 相同的系统构建原则,只是他们处在不同

jopen 2015-06-04   8823   0

Facebook的“大数据”到底有多大? 资讯

每半小时通过 Hive 扫描的数据 100+PB (1PB=1024TB) 单个 HDFS(分布式文件系统)集群中的磁盘容量 FB 的工程总监 Parikh 解释了这些数据对于 Facebook

openkk 2012-08-23   9281   0

大数据技术大合集:Hadoop家族、Cloudera系列、spark、storm 经验

种工具,如:配置文件和日志操作等。 HDFS: 是Hadoop应用程序中主要的分布式储存系统, HDFS集群包含了一个NameNode(主节点),这个节点负责管理所有文件系统的元数据及存储了真实数据的DataNode(数据节点,可以有很

jopen 2014-11-22   190566   0

HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝(TFS) 经验

(2)      设计目的是为了存储超大文件,主要是针对几百MB,GB,甚至TB的文件 (3)      该分布式系统构建在普通PC机组成的集群上,大大降低了构建成本,并屏蔽了系统故障,使得用户可以专注于自身的操作运算。

openkk 2012-03-01   244496   0
P14

  HDFS小文件处理解决方案总结+facebook(HayStack)+淘宝(TFS) 文档

(2)      设计目的是为了存储超大文件,主要是针对几百MB,GB,甚至TB的文件 (3)      该分布式系统构建在普通PC机组成的集群上,大大降低了构建成本,并屏蔽了系统故障,使得用户可以专注于自身的操作运算。

平江夜弹 2012-08-23   5511   0

谷歌技术"三宝"之MapReduce 博客

FS)为上层提供高效的非结构化存储服务,HBase(或 BigTable)是提供结构化数据服务的分布式数据库,Hadoop MapReduce(或Google MapReduce)是一种并行计算的编程模型,用于作业调度。

openkk 2012-05-04   5497   0

Hadoop的架构知识 经验

Hadoop的架构知识 Hadoop是一个能够对大量数据进行分布式处理的软件框架,实现了Google的MapReduce编程模型和框架,能够把应用程序分割成许多小的工作单元,并把这些单元放到任

jopen 2013-05-07   26645   0
P15

  ImDFS 存储解决方案 文档

ImDFS简介ImDFS系统架构ImDFS特性ImDFS扩容和容错ImDFS和其它文件系统对比目 录 3. ImDFS简介ImDFS是一个类似google GFS轻量级的开源分布式文件系统,采用纯C语言开发,简洁高效,支持Linux、FreeBSD等UNIX系统。

akunmath 2012-04-19   4087   0
P5

  JVM调优总结(十一) - 反思 文档

也会相应减少。     我认为这是可能的。     解决之道   数据库、文件系统     把所有数据都放入数据库或者文件系统,这是一种最为简单的方式。在这种方式下,Java应用的内存基本上等于处理一

chenyong860722 2012-08-21   2572   0

大型网站架构演化 资讯

减少数据库访问压力,提高网站的数据访问速度 。缓存又可以分为:本地缓存和远程缓存(可以是分布式的),本地缓存访问速度快,但数据量有限;远程分布式缓存可以集群,因此容量不受限制; (4)使用应用服务器集群改善网站并发处理能力:

jopen 2015-07-04   22429   0
网站  
P34

  Google云计算原理 文档

不同在于,它是通过互联网进行传输的。 云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展

ndn4open 2011-10-11   769   0
P44

  中国移动Big Cloud平台(经分培训)v1.0 文档

能力打造互联网神话大规模数据处理和存储(五大巫术) 分布式文件系统 GFS 并行计算框架 MapReduce 分布式数据库 BigTable 分布式锁服务 Chubby 云计算集群管理和调度系统创新数据中心技术

ljp123456 2014-03-22   2311   0
P3

  hadoop常见错误总结 文档

在重新格式化一个新的分布式文件时,需要将你NameNode上所配置的dfs.name.dir这一namenode用来存放NameNode 持久存储名字空间及事务日志的本地文件系统路径删除,同时将各DataNode上的dfs

419133824 2012-02-18   5004   0

一位老码农的编程简史 博客

2004,全面开始学习Linux系统,深入学习文件系统,同时在Windows/Linux大量编写程序,编译和裁剪Linux内核,编写了BootU工具。 2005,研究课题正式开题,研究网格计算与分布式存储,Globus/A

jopen 2012-05-30   2306   0

开源大数据处理系统/工具大全 经验

是用来进行大数据查询的补充工具。 Impala 并没有取代像Hive这样基于MapReduce的分布式处理框架。Hive和其它基于MapReduce的计算框架非常适合长时间运行的批处理作业,例 如那些涉及到批量

ew45 2015-03-12   325553   0
P24

  大数据分析系统架构之探讨 文档

Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。HDFS是Hadoop分布式文件系统(Hadoop Distributed

guet_lee 2017-01-12   2237   0
P24

  大数据分析系统架构 文档

Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。HDFS是Hadoop分布式文件系统(Hadoop Distributed

wzf1118 2016-11-04   2940   0
1 2 3 4 5 6 7 8 9 10