分布式/云计算/大数据 - 开源经验 - 第30页

0推荐

17K 浏览

今天早上一同事微信说奇虎360开源了一套配置管理系统。地址在这： https://github.com/Qihoo360/QConf 。正好我们之前也做了一套配管系统，于是点进去看了看，基于...

jopen 11年前

大数据分布式/云计算/大数据

0推荐

130K 浏览

【译者预读】面对海量小文件的存储和检索，Google发表了GFS，淘宝开源了TFS，而Facebook又是如何应对千亿级别的图片存储、每秒百万级别的图片查询？Facebook与同样提供了海量图片...

jopen 11年前

TFS 存储系统分布式/云计算/大数据

0推荐

23K 浏览

Apache Hadoop 2.6.0安装部署

b36g 11年前

Apache Hadoop 分布式/云计算/大数据

0推荐

34K 浏览

Apache Storm是一个免费、开源的分布式实时计算系统，不久前刚刚升级为Apache顶级项目。近日，该项目创建者Nathan Marz撰文回顾了Storm的发展历史以及相关的经验教训。他认...

jopen 11年前

Storm 分布式/云计算/大数据

0推荐

73K 浏览

数据源：除该种方法之外，还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构，而特别要说的是流数据，它的核心就是数据的连续性和快速分析性；

jopen 11年前

大数据分布式/云计算/大数据

0推荐

84K 浏览

3月31日是 Spark 五周年纪念日，从第一个公开发布的版本开始，Spark走过了不平凡的5年：从刚开始的默默无闻，到13年的鹊起，14年的大爆发。Spark核心之上有分布式的机器学习，SQL...

jopen 11年前

Spark 分布式/云计算/大数据

0推荐

62K 浏览

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一。与Hado...

jopen 11年前

Apache Spark 分布式/云计算/大数据

0推荐

18K 浏览

今天谈谈分布式事务的时序问题。在说这个问题之前首先说说这为什么是个问题。

yne7 11年前

分布式分布式/云计算/大数据

0推荐

9K 浏览

三台机器，centos6.5， master、slave1、slaver2分布式安装hadoop1.2

yne7 11年前

Hadoop 分布式/云计算/大数据

0推荐

17K 浏览

Paracel是豆瓣开发的一个分布式计算框架，它基于参数服务器范式，最初是为机器学习算法设计的。 Paracel支持数据和模型的并行，为用户提供简单易用的通信接口，比mapreduce式的系统要...

yne7 11年前

分布式/云计算/大数据 Paracel

0推荐

15K 浏览

Yelp工程师团队表示，面对团队和代码库规模不断增长的情况，他们通过实践向面向服务架构迁移，得以使开发过程同步具备扩展能力，并且保持了快速的软件交付。这一切取决于以下因素，包括对团队灌输分布式...

cd33 11年前

yelp 分布式/云计算/大数据

0推荐

38K 浏览

用了一段时间Storm后的笔记。发现可以记的东西不多，证明Storm挺简单的，你只要遵循一些简单的接口与原则，就能写出大规模实时消息处理的程序。

jopen 11年前

Storm 分布式/云计算/大数据

0推荐

17K 浏览

hadoop安装配置

jopen 11年前

Hadoop 分布式/云计算/大数据

0推荐

18K 浏览

Tera 是一个高性能、可伸缩的数据库系统，被设计用来管理搜索引擎万亿量级的超链与网页信息。为实现数据的实时分析与高效访问，我们使用按行键、列名和时间戳全局排序的三维数据模型组织数据，使用多级...

cwf8 11年前

分布式/云计算/大数据 Tera

0推荐

25K 浏览

最近团队中有分析的场景，用到了JStorm来做数据的实时分析，于是花时间对于一些概念做了了解。

jopen 11年前

Storm 分布式/云计算/大数据

0推荐

14K 浏览

ZooKeeper 是一个分布式的，开放源码的分布式应用程序协调服务，它包含一个简单的原语集，分布式应用程序可以基于它实现同步服务，配置维护和命名服务等。 Zookeeper是hadoop...

jopen 11年前

ZooKeeper 分布式/云计算/大数据

0推荐

22K 浏览

zookeeper是一个开源分布式的服务,它提供了分布式协作,分布式同步,配置管理等功能. 其实现的功能与google的chubby基本一致.zookeeper的官方网站已经写了一篇非常经典的概...

jopen 11年前

ZooKeeper 分布式/云计算/大数据

0推荐

22K 浏览

在hadoop2中新的NameNode不再是只有一个，可以有多个（目前只支持2个）。每一个都有相同的职能。一个是active状态的，一个是standby状态的。当集群运行时，只有active...

xmnx 11年前

Hadoop 分布式/云计算/大数据

0推荐

88K 浏览

本文作者通过ZooKeeper与Eureka作为 Service发现服务（注：WebServices 体系中的UDDI就是个发现服务）的优劣对比，分享了Knewton在云计算平台部署服务的经验。...

jopen 11年前

ZooKeeper 分布式/云计算/大数据

0推荐

38K 浏览

RDD是Spark中的抽象数据结构类型，任何数据在Spark中都被表示为RDD。从编程的角度来看，RDD可以简单看成是一个数组。和普通数组的区别是，RDD中的数据是分区存储的，这样不同分区的数...

jopen 11年前

Spark 分布式/云计算/大数据

大数据技术栈之配置&发布系统

facebook海量图片存储系统与淘宝TFS系统比较

Apache Hadoop 2.6.0安装部署

Storm是如何成为Apache顶级项目的

部署大数据？请参考大数据分析平台架构(Big Data Analytics Platform)

Spark 伪分布式 & 全分布式安装指南

用Apache Spark进行大数据处理——第一部分：入门介绍

分布式存储系统事务时序

linux分布式安装hadoop1.2

Paracel：豆瓣开发的大型分布式计算框架，用于机器学习、图算法

Yelp研发实践：使用服务拆分单块应用

Storm笔记

hadoop安装配置

分布式表格系统：Tera

什么是Storm，它可以用来做什么？

Zookeeper工作原理

Zookeeper研究和应用

hadoop2.5.2HA高可靠性集群搭建(zookeeper3.4.6+hbase0.98.11)

为什么不应该使用ZooKeeper做服务发现

Spark RDD API详解(一) Map和Reduce

热门问答

热门文档