0推荐
30K 浏览

分布式对象存储系统:LeoFS

LeoFS是一个高可靠性,最终一致性的分布式对象存储系统
0推荐
15K 浏览

开源分布式存储之我见

相信很多公司和乐视一样,本就不充足的研发队伍,由于种种历史和政治原因,在同一个领域里充斥了大量类似的开源项目,在我们的分布式存储系统里,目前就采用了HDFS,Gluster,Swift和Ceph...
0推荐
19K 浏览

Hadoop yarn完全分布式安装笔记

Hadoop yarn完全分布式安装笔记
0推荐
18K 浏览

Google Mesa论文笔记

Mesa是Google用于广告的数据仓库系统, 拥有准实时的数据更新能力, 和低延迟的数据查询性能。 系统高可用性、可靠性、扩展性都非常优秀, 数据规模可达PB级别, 支持每秒数百万行写入。 每...
0推荐
14K 浏览

Hive运行架构及配置部署

由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具; 构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;
0推荐
14K 浏览

【Hadoop】HDFS的运行原理

HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Go...
0推荐
26K 浏览

OpenStack的REST API:Barbican

Barbican 是为安全储存、配置和隐私管理而设计的REST API,它主要目的是使用于所有环境,包括大规模临时云。
0推荐
17K 浏览

MapReduce简单使用

MapReduce简单使用
0推荐
254K 浏览

Ubuntu下Spark开发环境搭建

配置Ubuntu下使用Python开发Spark应用
0推荐
56K 浏览

开源大数据利器汇总

开源大数据利器汇总
0推荐
42K 浏览

ZooKeeper 监控管理系统:​Exhibitor

Exhibitor 是 ZooKeeper 实例监控,备份,恢复,清理和可视化工具, 是 ZooKeeper 的监控管理系统。
0推荐
57K 浏览

Storm Trident 详细介绍

Storm是一个实时的可靠地分布式流计算框架。 具体就不多说了,举个例子,它的一个典型的大数据实时计算应用场景:从Kafka消息队列读取消息(可以是logs,clicks...
0推荐
14K 浏览

Hadoop完全分布式模式的配置与安装

接下来有可能会用到Hadoop相关的知识, 所以这几天就在Vmware里面尝试着搭建了一下. 感觉还行. 所以趁着还记得, 就写下这篇博客, 帮助自己以后回顾, 也帮助那些准备接触Hadoop的...
0推荐
23K 浏览

Elasticsearch、MongoDB和Hadoop比较

IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性,避免落大部队太 远,我们看到了不同技术之间的边际的模糊化。假如你有诸如...
0推荐
15K 浏览

Glance中文文档

Glance项目提供了服务让用户可以上传和发现用于其他服务的数据资源。这目前包括镜像和元数据定义(Metadata Definition)。 Glance镜像服务包括了发现、注册和获得虚...
0推荐
41K 浏览

Zookeeper原理及简介

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可 以基于它实现同步服务,配置维护和命名服务等。Zookeeper是hadoop的一个子...
0推荐
11K 浏览

基本hadoop文件操作

基本hadoop文件操作
0推荐
16K 浏览

Hadoop深入学习:MapTask详解

我们主要来学习MapTask的内部实现。
0推荐
15K 浏览

ubuntu14.04 安装hadoop

ubuntu14.04 安装hadoop
0推荐
211K 浏览

Spark 入门(Python、Scala 版)

本文中,我们将首先讨论如何在本地机器上利用Spark进行简单分析。然后,将在入门级水平探索Spark,了解Spark是什么以及它如何工作(希望可以激发更多探索)。最后两节将开始通过命令行与Spa...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档