分布式/云计算/大数据 - 开源经验 - 第34页

0推荐

26K 浏览

Storj 是基于 blockchain 技术和点对点协议来提供最安全，私有和加密的云存储。

jopen 11年前

存储系统分布式/云计算/大数据 Storj

0推荐

49K 浏览

简介：本文是对大数据领域的基础论文的阅读总结，相关论文包括GFS，MapReduce、BigTable、Chubby、SMAQ。

jopen 11年前

架构分布式/云计算/大数据

0推荐

20K 浏览

Packet是一家成立不久的公司，他们主要是为用户提供基于裸机服务器的IaaS，本文的作者是Packet平台的VP，作者在文中讲述了他们构建Packet平台的动机以及在构建过程中遇到了哪些问题。...

jopen 11年前

OpenStack 分布式/云计算/大数据

0推荐

193K 浏览

大数据相关技术、Hadoop生态、LinkedIn内部实战

jopen 11年前

Hadoop 分布式/云计算/大数据

0推荐

38K 浏览

把分布式系统中各个组件的工作汇总起来，就可以得到一个全面的跟踪系统。每个公司都会有一套自己的分布式跟踪系统。Google的Dapper，Twitter的zipkin，淘宝的鹰眼，新浪的...

jopen 11年前

分布式分布式/云计算/大数据

0推荐

85K 浏览

讲给硅谷创业者的大数据精华集合

jopen 11年前

大数据分布式/云计算/大数据

0推荐

17K 浏览

Orleans是一个提供构建分布式高伸缩性计算应用的简单方法的框架，不需要学习和应用复杂并发或者其它伸缩模式。

jopen 11年前

Orleans 分布式/云计算/大数据

0推荐

41K 浏览

Ceph读写流程

jopen 11年前

Ceph 分布式/云计算/大数据

0推荐

24K 浏览

Apache Falcon 提供了一个用于治理和编排 Hadoop 内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核...

jopen 11年前

分布式/云计算/大数据 Apache Falcon

0推荐

31K 浏览

ceph 集群访问权限配置

f824 11年前

Ceph 分布式/云计算/大数据

0推荐

24K 浏览

本文详细总结Spark分布式集群的安装步骤，帮助想要学习Spark的技术爱好者快速搭建Spark的学习研究环境。

jopen 11年前

Spark 分布式/云计算/大数据

0推荐

24K 浏览

前段时间在为内部自研的计算框架设计算子层，参考对比了一些开源的计算框架的算子层，本文做一个粗粒度的梳理。下面这张图是我对计算框架抽象层次的一个拆分，具体可以参考上周日杭州S...

jopen 11年前

分布式/云计算/大数据算子层

0推荐

18K 浏览

本文是我对分布式计算的算子这层的一些认识和想法。因为最近自己的开发任务也是这方面相关的，公司内部有自研的类流式计算框架需要做一层算子层。我主要分析的是流式系统上实现算子这一点入手，对比现有计算框...

jopen 11年前

分布式/云计算/大数据布式计算

0推荐

45K 浏览

本文尝试从源码层面梳理Spark在任务调度与资源分配上的做法。

jopen 11年前

Spark 分布式/云计算/大数据

0推荐

17K 浏览

散仙在上篇文章中，介绍过如何使用Pig来进行词频统计，整个流程呢，也是非常简单，只有短短5行代码搞定，这是由于Pig的内置函数TOKENIZE这个UDF封装了单词分割的核心流程，当然，我们的需求...

fmwg 11年前

分布式/云计算/大数据 Pig

0推荐

25K 浏览

典型大数据计算模式与系统

jopen 11年前

大数据分布式/云计算/大数据

0推荐

23K 浏览

Hive 是基于 Hadoop 的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的 sql 查询功能，可以将 sql 语句转换为 MapReduce 任务进行运行。其优...

jopen 11年前

分布式/云计算/大数据 Hadoop2

0推荐

21K 浏览

Zookeeper 是一个分布式。开放源码的分布式应用程序协调服务，是Google Chubby的一个开源实现，大多数的分布式应用都需要Zookeeper的支持，这篇文章先简单的和大家分享如何...

jopen 11年前

分布式/云计算/大数据 Apache Zookeeper

0推荐

58K 浏览

Spark 基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark 部署在大量廉价硬件之上，形成集群。

jopen 11年前

Spark 分布式/云计算/大数据

0推荐

29K 浏览

本文记录在Hive 0.14 + hadoop 2.4.1 环境下，如何时用 jdbc连接到hive hive 的JDBC驱动还是比较好找的，在hive的包里就有 hive-jdbc-0....

jopen 11年前

Hadoop 分布式/云计算/大数据

云存储平台：Storj

大数据基础架构总结

使用OpenStack构建Packet平台过程中的经验和教训

大数据相关技术、Hadoop生态、LinkedIn内部实战

分布式跟踪系统调研

讲给硅谷创业者的大数据精华集合

分布式Actor模型：Orleans

Ceph读写流程

Hadoop 数据管理平台：Apache Falcon

ceph 集群访问权限配置

搭建Spark完全分布式集群

常见计算框架算子层对比

谈谈分布式计算的算子层

Spark的任务调度

如何使用Pig集成分词器来统计新闻词频？

典型大数据计算模式与系统

Hadoop2.3、 Hbase0.98、 Hive0.13架构中Hive的安装部署配置以及数据测试

Apache Zookeeper 集群环境搭建

Spark初探

Hive 0.14 + hadoop 2.4.1 环境下的 jdbc连接

热门问答

热门文档