分布式/云计算/大数据 - 开源经验 - 第24页

0推荐

31K 浏览

本文详细介绍了 Storm 集群的安装配置方法。如果需要在 AWS 上安装 Storm，你应该先了解一下 storm-deploy 项目。 storm-deploy 可以自动完成 E2 上 St...

jopen 11年前

Storm 分布式/云计算/大数据

0推荐

46K 浏览

微博平台研发作为微博的底层数据及业务支撑部门，已经经历了5年的发展历程。伴随着从数据及业务暴发式增长，我们在海量数据存储方面遭遇了诸多挑战，与此同时也伴随着丰富经验的积累。本文主要面...

jopen 11年前

分布式/云计算/大数据海量数据存

0推荐

9K 浏览

storm集群配置

jopen 11年前

Storm 分布式/云计算/大数据

0推荐

23K 浏览

简单分析一下GraphX是怎么为图数据建模和存储的。

jopen 11年前

分布式/云计算/大数据 GraphX

0推荐

162K 浏览

Openshift是一个非常有前途的私用PAAS解决方案，它可以减少从项目开始时到自动构建应用和布署的时间，它支持绝大多数的WEB架构，将成为基于容器的私有平台即服务的一个参照。

jopen 11年前

Docker 分布式/云计算/大数据

0推荐

12K 浏览

MORPHiS 现在是早期阶段，主要目标是成为一个全局加密分布式存储，为了替代云存储。MORPHiS 现在包含一个 DMAIL（分布式邮件），内置垃圾邮件拦截，内置加密，免费发送信息。

jopen 11年前

分布式/云计算/大数据 MORPHiS

0推荐

32K 浏览

大数据在近些年来越来越火热，人们在提到大数据遇到了很多相关概念上的问题，比如云计算、 Hadoop等等。那么，大数据是什么、Hadoop是什么，大数据和Hadoop有什么关系呢?

pm45e 11年前

Hadoop 分布式/云计算/大数据

0推荐

23K 浏览

关于 Ceph 的介绍网上一大堆，这里就不重复了。Sage Weil 读博士的时候开发了这套牛逼的分布式存储系统，最初是奔着高性能分布式文件系统去的，结果云计算风口一来，Ceph 重心转向了分布...

pm45e 11年前

CentOS 分布式/云计算/大数据

0推荐

19K 浏览

构建一个分布式系统是很困难的。它需要可扩展性、容错性、高可用性、一致性、可伸缩以及高效。为了达到这些目的，分布式系统需要很多复杂的组件以一种复杂的方式协同工作。例如，Apache Hadoop在...

pm45e 11年前

Docker 分布式/云计算/大数据

0推荐

17K 浏览

本文介绍了 Storm 命令行客户端中的所有命令操作。如果想要了解怎样设置你的 Strom 客户端和远程集群的交互，请按照配置开发环境一文中的步骤操作。

jopen 11年前

Apache Storm 分布式/云计算/大数据

0推荐

13K 浏览

hyflow-go是一款可进行地理复制、主内存main-memory的高一致性数据存储，其最大特点是将低延时和高事务完美统一。

jopen 11年前

存储系统分布式/云计算/大数据 hyflow-go

0推荐

20K 浏览

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。

jopen 11年前

Hadoop 分布式/云计算/大数据

0推荐

16K 浏览

嗨，大家好。今天我们来学一学Swarm相关的内容吧，我们将学习通过Swarm来创建Docker原生集群。Docker Swarm是用于Docker的原生集群项目，它可以将一个Docker主机池转...

jopen 11年前

Docker 分布式/云计算/大数据

0推荐

15K 浏览

在网络流量的分析中，基于流的分析被大多数ISP所采用，分析系统一般部署在一台高配置的服务器中。如由CERT网络势态感知团队(CERT-NetSA)开发的用于大规模网络安全分析的网络交互分析工具...

jopen 11年前

Hadoop 分布式/云计算/大数据

0推荐

41K 浏览

Spark能够自动推断出Json数据集的“数据模式”（Schema），并将它加载为一个SchemaRDD实例。这种“自动”的行为是通过下述两种方法实现的：

jopen 11年前

Spark 分布式/云计算/大数据

0推荐

73K 浏览

本文主要记录最近一段时间学习和实现Spark MLlib中的协同过滤的一些总结，希望对大家熟悉Spark ALS算法有所帮助。更新：

jopen 11年前

Spark 分布式/云计算/大数据

0推荐

48K 浏览

以下是我参与蓝鲸数据平台的建设过程中的一些心得体会，关于整个蓝鲸平台的更多内容，请见

jopen 11年前

腾讯分布式/云计算/大数据

0推荐

20K 浏览

TDW（Tencent distributed Data Warehouse，腾讯分布式数据仓库）基于开源软件Hadoop和Hive进行构建，打破了传统数据仓库不能线性扩展、可控性差的局限，并且...

jopen 11年前

Hadoop 分布式/云计算/大数据

0推荐

20K 浏览

Spark Kernel 的最主要目标：提供基础给交互应用程序联系和使用 Apache Spark。

ynnc 11年前

Apache Spark 分布式/云计算/大数据

0推荐

54K 浏览

做软件开发的都知道模块化思想，这样设计的原因有两方面：一方面是可以模块化，功能划分更加清晰，从“数据采集--数据接入--流失计算--数据输出/存储”

fefre 11年前

HDFS 分布式/云计算/大数据

Storm 集群安装配置

海量数据存储基础

storm集群配置

GraphX 图数据建模和存储

OpenShift 3 : 基于docker的私有平台即服务

高性能分布式数据存储：MORPHiS

大数据与Hadoop之间是什么关系？

在 CentOS 7.1 上安装分布式存储系统 Ceph

通过Mesos、Docker和Go，使用300行代码创建一个分布式系统

Apache Storm 命令行操作

Go 开发的高一致性分布存储：hyflow-go

详解Hadoop核心架构

如何配置一个 Docker Swarm 原生集群

基于Hadoop的大规模网络流量分析

Spark处理Json格式数据（Python）

如何使用Spark ALS实现协同过滤

腾讯蓝鲸数据平台之告警系统

腾讯TDW:大型Hadoop集群应用

提供程序使用 Apache Spark 的基础：Spark Kernel

大数据架构：flume-ng+Kafka+Storm+HDFS 实时系统组合

热门问答

热门文档