P3

  ZooKeeper 能做什么 文档

1. ZooKeeper能做什么命名服务 在zookeeper的文件系统里创建一个目录,即有唯一的path 配置管理 程序总是需要配置的,如果程序分散部署在多台机器上, 要逐 个改变配置就变得困难。现

xuezd 2013-12-26   6371   0

OpenShift 增加对 Node.js 的支持 资讯

Framework、Twisted、Django和Java E。它包含SQL和NoSQL数据存储和一个分布式文件系统。 OpenShift 平台日前进行了增强,增加对 Node.js 的支持,同时改进了

fmms 2012-03-22   7749   0
Node.js  

给Java开发者的10个大数据工具和框架 经验

1、MongoDB——最受欢迎的,跨平台的,面向文档的数据库。 MongoDB是一个基于分布式文件存储的数据库,使用C++语言编写。旨在为Web应用提供可扩展的高性能数据存储解决方案。应用性能

fkol7746 2017-05-16   44594   0
P45

  zookeeper 集群安装 文档

zookeeper集群安装 2010-07-19 15:43:22|  分类: 分布式 |字号  订阅 Linux/OS X下: 1 install 1.1) 建立安装目录 mkdir -p /lo

efeil 2012-09-07   2739   0

大数据分析查询引擎Impala 资讯

Dremel系统进行设计的。 Dremel是Google的交互式数据分析系统,它构建于Google的GFS(Google File System)等系统之上,支撑了Google的数据分析服务BigQuer

jopen 2015-11-09   51967   1
Impala  
P65

  Cassandra 概要指南 文档

面向未来 3. NoSql背景 随着互联网大规模的Web2.0应用的兴起,随着云计算需要的大规模分布式服务和分布式存储的发展,传统的关系数据库面临着诸多全新的挑战,特别是在那些超大规模和高并发的SNS类型的

wei5445 2012-03-21   2411   0

Spark Streaming使用Kafka保证数据零丢失 经验

通过上面描述,WAL有两个缺点: 降低了receivers的性能,因为数据还要存储到HDFS等分布式文件系统 对于一些resources,可能存在重复的数据,比如Kafka,在Kafka中存在一份数据,在Spark

jopen 2016-01-16   8823   0

Spark Streaming使用Kafka保证数据零丢失 经验

通过上面描述,WAL有两个缺点: 降低了receivers的性能,因为数据还要存储到HDFS等分布式文件系统 对于一些resources,可能存在重复的数据,比如Kafka,在Kafka中存在一份数据,在Spark

什么是Docker? 经验

的依赖包到一个标准化单元中用于软件开发。 Docker容器将一块应用打包到一个完成的文件系统中,在该文件系统中包含了该应用要运行的所有要求:代码,运行时,系统工具,系统库 - 任何你安装在服务器上

icm 2016-04-21   10154   0
Docker  
P43

  Hbase教案 文档

scalable, big data store. Apache Hbase 是hadoop数据库,一个分布式的,可扩展的大数据存储。 Use Apache HBase™ when you need random

hz.love 2017-08-03   866   0

大数据常见术语表 资讯

这类数据也被称为元数据(meta data),是描述数据的数据 云计算(Cloud computing) – 构建在网络上的分布式计算系统,数据是存储于机房外的(即云端) 聚类分析(Clustering analysis) –

jopen 2015-02-22   47724   0

大数据工具比较:R语言和Spark谁更胜一筹? 资讯

[译[译者注 :RDD , Resilient Distributed Datasets , 弹性分布式数据集 ] 支持的基本框架和运算。然后也要弄明白Spark中不同的机器学习程序,并且在上面进行编程

jopen 2015-12-06   87108   0
R语言  

推荐引擎mahout安装与配置 经验

clusters-6 clusters-7 clusters-8 clusters-9 data 四、单节点向全分布式转换 Mahout没有Hadoop那么繁琐与复杂,只要你在一台单机上配好环境之后,当你将这个系

mx3y 2015-06-30   14524   0

Hadoop家族学习路线图 经验

Apache Hadoop : 是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架构。 Apache Hive : 是基于H

jopen 2013-11-10   199151   0

Hadoop生态系统学习路线 经验

Apache Hadoop : 是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架构。 Apache Hive : 是基于H

jopen 2014-10-29   43441   0

java高并发解决方案 经验

能、质量等等才是 一个开发人员最该关心的。今天我所说的是高并发,我的解决思路是,1、采用分布式应用设计2、分布式缓存数据库3、代码优化 一个小型的网站,比如个人网站,可以使用最简单的html静态页

JulianaMarc 2016-10-12   16534   0

我在mesos上运行docker的经验 资讯

MapReduce 作业。我同时使用运行于 mesos 之上的 Kafka 和 Storm,与 MapR 文件系统一起使用,或跟当前环境协同使用。 MapR 提供了极大的帮助当其运行 mesos 之上 Docker

jopen 2015-07-07   7919   0
Mesos  

Apache Spark 1.6.1 发布,集群计算环境 资讯

可以像操作本地集合对象一样轻松地操作分布式数据集。 尽 管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoo 文件系统中并行运行。通过名为 Mesos

jopen 2016-03-11   27731   0

优秀PHP程序员应具备的5大能力 问答

置并加以调试,分析数据库运行状态。 (4)精通:简单地说具备以上所有能力的同时,有多年高负载分布式环境下的优化管理经验。 据观察以及交往经验,70%的PHPer处在了解阶段,25%处于熟悉阶段

jopen 2015-01-08   11189   2
PHP   数据库   ci   缓存   C/C++  
P12

  Spark 核心技术剖析 文档

Lustre Page 4RDD Resilient Distributed Dataset 弹性分布式数据集 5. Spark RDD Page 5 6. How Spark Work Page 6 7

xcn4 2014-11-29   472   0
1 2 3 4 5 6 7 8 9 10