0推荐
19K 浏览

Apache Hadoop YARN的一个抽象层:Twill

Twill是 Apache Hadoop YARN 的一个抽象层。它能够减少开发分布应用程序的复杂性,让开发人员可以更加关注他们的业务逻辑。它通过一个类似于Java线程的简单而直观的编程模型来暴...
0推荐
48K 浏览

基于hive的日志数据统计实战

hive 是一个基于 hadoop 的开源数据仓库工具,用于存储和处理海量结构化数据。 它把海量数据存储于 hadoop 文件系统,而不是数据库,但提供了一套类数据库的数据存储和处理...
0推荐
33K 浏览

MapReduce论文学习笔记

* 大数据计算问题的提出:如何处理并行计算、如何分发数据、如何处理错误等等。这些问题合起来使得大数据处理变得复杂 * 为了解决这些问题,需要设计新的计算抽象模型:只要表述想要执行的运算,而屏蔽...
0推荐
48K 浏览

GFS论文学习笔记

GFS(Google文件系统)作为一个分布式文件系统,为Google提供基础的海量数据存储服务。虽然GFS并没有开源,但Google在其 04年发表的论文《The Google File Sys...
0推荐
48K 浏览

BigTable论文学习笔记

Bigtable为Google设计的一个分布式结构化数据存储系统,用来处理Google的海量数据。Google内包括Web索引、Google地球等项目都在使用Bigtable存储数据。尽管这些应...
0推荐
20K 浏览

Hadoop2.2.0安装配置手册

Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件,所以如果需要在64位系统上部署则需要单独下载src 源码自行编译(1...
0推荐
56K 浏览

Hadoop完全分布式搭建

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Goo...
0推荐
29K 浏览

Hadoop上时实类SQL查询系统对比

以前只用过Hive与impala两个类SQL查询系统,最近又将Hortonworks开源的Stinger与Apache的Drill做了些调研。累死累活搞了一天的资料,头都大了。为了纪念我那逝去的...
0推荐
15K 浏览

GridFS:基于MongoDB的分布式文件存储系统

GridFS是MongoDB之上的分布式文件系统,其利用了MongoDB的分布式存储机制并通过MongoDB来存储文件数据和文件元数据,兼具文档型数据库和文件系统的优势。GridFS是当前大数据...
0推荐
306K 浏览

hadoop框架详细分析

mapreduce是一种模式,一种什么模式呢?一种云计算的核心计算模式,一种分布式运算技术,也是简化的分布式编程模式,它主要用于解决问题的程序开发模型,也是开发人员拆解问题的方法。
0推荐
49K 浏览

Openstack Swift 原理、架构与 API 介绍

Swift 最初是由 Rackspace 公司开发的高可用分布式对象存储服务,并于 2010 年贡献给 OpenStack 开源社区作为其最初的核心子项目之一,为其 Nova 子项目提供虚机镜像...
0推荐
32K 浏览

Cloud Foundry 技术全貌及核心组件分析

历经一年多的发展,Cloud Foundry的架构设计和实现有了众多改进和优化。为了便于大家了解和深入研究首个开源PaaS平台——Cloud Foundry,《程序员》杂志携手Cloud Fou...
0推荐
33K 浏览

Hadoop完全分布式模式的安装和配置

Hadoop完全分布式模式的安装和配置
0推荐
36K 浏览

Spring hadoop之发散之Storm云计算学习摘录总结

Storm是一个分布式的、容错的实时计算系统,它被托管在GitHub上,遵循 Eclipse Public License 1.0。Storm是由BackType开发的实时处理系统,BackTy...
0推荐
54K 浏览

一个高效的分布式计算系统:Spark

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop Map...
0推荐
199K 浏览

Hadoop家族学习路线图

主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增...
0推荐
74K 浏览

淘宝分布式的文件系统TFS的原理及应用

TFS是taobao filesystem的简称,是一个分布式的文件系统,目前最新的版本是TFS2.X TFS和NAS相比,具有线性扩容好,高并发性能好。和HDFS相比更适合小文件,和F...
0推荐
78K 浏览

storm简介

伴随着信息科技日新月异的发展,信息呈现出爆发式的膨胀,人们获取信息的途径也更加多样、更加便捷,同时对于信息的时效性要求也越来越高。举个搜索 场景中的例子,当一个卖家发布了一条宝贝信息时,他希望的...
0推荐
70K 浏览

Hadoop集群部署及常见问题超细详解答

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Goo...
0推荐
20K 浏览

CloudStack云基础架构的一些概念

一个区域在CloudStack配置中是最大的组织单元。一个区域通常代表一个单独的数据中心,虽然在一个数据中心也允许有多个区域。将基础架构设施加入到区域中的好处是提供物理隔离和冗余。例如,每...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档