登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
分布式/云计算/大数据
(共
1277
篇经验)
0
推荐
21K
浏览
Spark Internals
本文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“...
jopen
11年前
Spark
分布式/云计算/大数据
0
推荐
42K
浏览
有关云架构建设和选型的思考
最近在负责公司内部私有云的建设,一直在思考怎么搞云计算,怎么才能够把云架构设计得好一些。本文尽量全面的列出了云架构建设和选型的考量因素。
jopen
11年前
分布式/云计算/大数据
云架构
0
推荐
12K
浏览
一个全面的、用于Apache Hadoop数据保护的安全框架:Rhino
Rhino项目是由Cloudera、Intel和Hadoop社区合力打造的一个项目。这个项目旨在为数据保护提供一个全面的安全框架。
jopen
11年前
分布式/云计算/大数据
Rhino
0
推荐
13K
浏览
为Hadoop数据细粒度的、基于角色的认证功能:Apache Sentry
Apache Sentry 是一个高度模块化的系统。它为存储在Apache Hadoop集群中的数据和元数据提供了细粒度的、基于角色的认证功能。
jopen
11年前
Apache Sentry
分布式/云计算/大数据
0
推荐
163K
浏览
Spark编程指南
总的来说,每一个Spark应用程序,都是由一个驱动程序组成,它运行用户的main函数,并且在一个集群上执行各种各样的并行操作。Spark提供的主要的抽象(概念)是一个弹性分布式数据集,它是一个元...
jopen
11年前
Spark
分布式/云计算/大数据
0
推荐
15K
浏览
Cloudbreak - 基于Hadoop的Docker service API
Cloudbreak 是首个基于hadoop的docker service API。Cloudbreak 建立于Apache Ambari, Docker containers, Serf 和 ...
jopen
11年前
分布式/云计算/大数据
Cloudbreak
0
推荐
28K
浏览
OpenStack All in One
OpenStack All in One
jopen
11年前
OpenStack
分布式/云计算/大数据
0
推荐
32K
浏览
Hadoop Sentry 学习
Sentry 是Cloudera 公司发布的一个Hadoop开源组件,它提供细粒度基于角色的安全控制
jopen
11年前
Hadoop
分布式/云计算/大数据
0
推荐
51K
浏览
什么是spark
Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala,项目的co...
jopen
11年前
Spark
分布式/云计算/大数据
0
推荐
52K
浏览
hadoop-2.2.0+spark1.1.0安装过程
hadoop-2.2.0+spark1.1.0安装过程
jopen
11年前
Hadoop
Spark
分布式/云计算/大数据
0
推荐
34K
浏览
Hadoop、Spark、HBase与Redis的适用性讨论(全文)
最近在网上又看到有关于Hadoop适用性的讨论[1]。想想今年大数据技术开始由互联网巨头走向中小互联网和传统行业,估计不少人都在考虑各种“纷繁复杂”的大数据技术的适用性的问题。这儿我就结合我这几...
jopen
11年前
Hadoop
Redis
HBase
Spark
分布式/云计算/大数据
0
推荐
28K
浏览
Hadoop的辉煌还能延续多久?
Hadoop技术已经无处不在。不管是好是坏,Hadoop已经成为大数据的代名词。短短几年间,Hadoop从一种边缘技术成为事实上的标准。看来,不仅现在Hadoop是企业大数据的标准,而且在未来,...
jopen
11年前
Hadoop
分布式/云计算/大数据
0
推荐
26K
浏览
Openstack 云平台提供块存储服务:OpenStack Cinder
Openstack 从 Folsom 开始使用 Cinder 替换原来的Nova-Volume服务,为 Openstack 云平台提供块存储服务。
jopen
11年前
存储系统
分布式/云计算/大数据
OpenStack Cinder
0
推荐
43K
浏览
hadoop HDFS 的PHP扩展:phdfs
phdfs是一个采用C语言的实现的PHP扩展,能够使用PHP来操作Hadoop HDFS文件系统。
jopen
11年前
分布式/云计算/大数据
phdfs
0
推荐
14K
浏览
Hadoop 迭代式计算框架:Guagua
Hadoop 迭代式计算框架 Guagua 是 PayPal 的一个开源机器学习框架 Shifu 的子项目。Guagua 主要解决了模型训练的分布式问题。同时 Guagua 并没有将自己局限在分...
jopen
11年前
分布式/云计算/大数据
Guagua
0
推荐
42K
浏览
构建大型云计算平台分布式技术的实践
1. 云计算的挑战与需求 2. ECS的分布式存储设计 3. SLB、RDS与OCS的设计 4. 全链路监控与分析系统 5. 未来工作展望 云计算的挑战与需求
jopen
11年前
云计算
分布式/云计算/大数据
0
推荐
20K
浏览
Twitter Storm: DRPC简介
Storm里面引入DRPC主要是利用storm的实时计算能力来并行化CPU intensive的计算。DRPC的storm topology以函数的参数流作为输入,而把这些函数调用的返回值作为t...
jopen
11年前
Storm
分布式/云计算/大数据
0
推荐
23K
浏览
hadoop分布式部署
hadoop分布式部署
jopen
11年前
Hadoop
分布式/云计算/大数据
0
推荐
26K
浏览
分布式监控系统:Watchy
Watchy 是一个分布式的系统,用于监控应用程序和服务器。该系统非常简单和易于管理。Watchy 提供一个分布式的架构和每个服务器之间守护进程的通讯,通过 UDP 获取不懂服务器上的数据并在同...
jopen
11年前
分布式/云计算/大数据
Watchy
0
推荐
14K
浏览
基于key/value+Hadoop HDFS 设计的存储系统的shell命令接口
对于hadoop HDFS 中的所有命令进行解析
jopen
11年前
Hadoop
分布式/云计算/大数据
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档