0推荐
31K 浏览

Storm 集群安装配置

本文详细介绍了 Storm 集群的安装配置方法。如果需要在 AWS 上安装 Storm,你应该先了解一下 storm-deploy 项目。 storm-deploy 可以自动完成 E2 上 St...
0推荐
46K 浏览

海量数据存储基础

微博平台研发作为微博的底层数据及业务支撑部门,已经经历了5年的发展历程。伴随着从数据及业务暴发式增长,我们在海量数据存储方面遭遇了诸多挑战,与此同时也伴随着丰富经验的积累。 本文主要面...
0推荐
9K 浏览

storm集群配置

storm集群配置
0推荐
23K 浏览

GraphX 图数据建模和存储

简单分析一下GraphX是怎么为图数据建模和存储的。
0推荐
162K 浏览

OpenShift 3 : 基于docker的私有平台即服务

Openshift是一个非常有前途的私用PAAS解决方案,它可以减少从项目开始时到自动构建应用和布署的时间, 它支持绝大多数的WEB架构,将成为基于容器的私有平台即服务的一个参照。
0推荐
12K 浏览

高性能分布式数据存储:MORPHiS

MORPHiS 现在是早期阶段,主要目标是成为一个全局加密分布式存储,为了替代云存储。MORPHiS 现在包含一个 DMAIL(分布式邮件),内置垃圾邮件拦截,内置加密,免费发送信息。
0推荐
32K 浏览

大数据与Hadoop之间是什么关系?

大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 Hadoop等等。那么,大数据是什么、Hadoop是什么,大数据和Hadoop有什么关系呢?
0推荐
23K 浏览

在 CentOS 7.1 上安装分布式存储系统 Ceph

关于 Ceph 的介绍网上一大堆,这里就不重复了。Sage Weil 读博士的时候开发了这套牛逼的分布式存储系统,最初是奔着高性能分布式文件系统去的,结果云计算风口一来,Ceph 重心转向了分布...
0推荐
19K 浏览

通过Mesos、Docker和Go,使用300行代码创建一个分布式系统

构建一个分布式系统是很困难的。它需要可扩展性、容错性、高可用性、一致性、可伸缩以及高效。为了达到这些目的,分布式系统需要很多复杂的组件以一种复杂的方式协同工作。例如,Apache Hadoop在...
0推荐
17K 浏览

Apache Storm 命令行操作

本文介绍了 Storm 命令行客户端中的所有命令操作。如果想要了解怎样设置你的 Strom 客户端和远程集群的交互,请按照配置开发环境一文中的步骤操作。
0推荐
13K 浏览

Go 开发的高一致性分布存储:hyflow-go

hyflow-go是一款可进行地理复制、主内存main-memory的高一致性数据存储,其最大特点是将低延时和高事务完美统一。
0推荐
20K 浏览

详解Hadoop核心架构

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。
0推荐
16K 浏览

如何配置一个 Docker Swarm 原生集群

嗨,大家好。今天我们来学一学Swarm相关的内容吧,我们将学习通过Swarm来创建Docker原生集群。Docker Swarm是用于Docker的原生集群项目,它可以将一个Docker主机池转...
0推荐
15K 浏览

基于Hadoop的大规模网络流量分析

在网络流量的分析中,基于流的分析被大多数ISP所采用,分析系统一般部 署在一台高配置的服务器中。如由CERT网络势态感知团队(CERT-NetSA)开发的用于大规模网络安全分析的网络交互分析工具...
0推荐
41K 浏览

Spark处理Json格式数据(Python)

Spark能够自动推断出Json数据集的“数据模式”(Schema),并将它加载为一个SchemaRDD实例。这种“自动”的行为是通过下述两种方法实现的:
0推荐
73K 浏览

如何使用Spark ALS实现协同过滤

本文主要记录最近一段时间学习和实现Spark MLlib中的协同过滤的一些总结,希望对大家熟悉Spark ALS算法有所帮助。 更新:
0推荐
48K 浏览

腾讯蓝鲸数据平台之告警系统

以下是我参与蓝鲸数据平台的建设过程中的一些心得体会,关于整个蓝鲸平台的更多内容,请见
0推荐
20K 浏览

腾讯TDW:大型Hadoop集群应用

TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且...
0推荐
20K 浏览

提供程序使用 Apache Spark 的基础:Spark Kernel

Spark Kernel 的最主要目标:提供基础给交互应用程序联系和使用 Apache Spark。
0推荐
54K 浏览

大数据架构:flume-ng+Kafka+Storm+HDFS 实时系统组合

做软件开发的都知道模块化思想,这样设计的原因有两方面: 一方面是可以模块化,功能划分更加清晰,从“数据采集--数据接入--流失计算--数据输出/存储”
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档