FiloDB:用于大数据分析的分布式数据 资讯

Chan 详细介绍 了用于大数据分析的分布式数据库FiloDB,对其主要特点和所包含模块进行了分析。 在当今的大数据时代,越来越多的企业需要对结构化的数据进行分析和查询,需要对流数据进行快速处理和更新。以

jopen 2015-11-05   24157   0
FiloDB  
P21

  途牛多数据中心分布式数据库同步 文档

(本页无文本内容) 2. 多机房分布式数据库同步谭俊青@途牛 mysqlab.net 3. 背景 南、北数据同步存在延时 南、北专线可能会意外中断 南、北业务都不能中断 本地读取数据一致性不能得到保证 灾备需要

byc2 2014-11-19   2879   0

HDFS 原理、架构与特性介绍 经验

本文主要讲述 HDFS原理-架构、副本机制、HDFS负载均衡、机架感知、健壮性、文件删除恢复机制 1:当前HDFS架构详尽分析 HDFS架构 •NameNode •DataNode •Sencondary

jopen 2013-08-11   192163   0
P8

  HDFS 用户指南中文版 文档

英文原版下载地址(http://hadoop.apache.org/hdfs/docs/r0.21.0/hdfs_user_guide.html) HDFS用户指南 HDFS用户指南 (HDFS Users Guide)

chenfeng_0829 2013-04-17   2826   0
P2

  Hadoop 认识 文档

一.Hadoop核心角色 hadoop框架 Hadoop使用主/从(Master/Slave)架构,主要角色有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracker组成。

zhezi7 2012-10-08   2833   0
P

Hadoop API 文档

Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。<br> Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

mimosa1987 2013-01-04   1259   0
P3

  hadoop 安装 文档

 一、安装sun的jdk和hadoop,不要使用open-jdk 本人安装的jdk1.7.0.rpm包(默认安装路劲为/usr/java/jdk1.7.0) 解压hadoop-0.20.2到:/home/hadoop/

gps2012 2013-01-14   525   0
P6

  Hadoop入门 文档

007/02/09/1506112.aspx Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超

ck614 2010-11-10   4010   0
P

Hadoop 入门 文档

Hadoop作为Apache基金会资助的开源项目,由Doug Cutting带领的团队进行开发,基于Lucene和Nutch等开源项目,实现了Google的GFS和Hadoop能够稳定运行在20个节点的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop项目正式支持HDFS和MapReduce的独立开发。同时,新兴公司Cloudera为Hadoop提供了商业支持,帮助企业实现标准化安装,并志愿贡献社区。Hadoop的最新版本是0.21.0,说明其还在不断完善发展之中。<br> Hadoop由分布式存储HDFS和分布式计算MapReduce两部分组成。HDFS是一个master/slave的结构,就通常的部署来说,在master上只运行一个Namenode,而在每一个slave上运行一个Datanode。MapReduce是Google的一项重要技术,它是一个编程模型,用以进行大数据量的计算。MapReduce的名字源于这个模型中的两项核心操作:Map和Reduce。Map是把一组数据一对一的映射为另外的一组数据,Reduce是对一组数据进行归约,映射和归约的规则都由一个函数指定。

Bluth 2012-12-25   321   0
P83

  Hadoop 源码 文档

 Hadoop源代码分析(一) 关键字: 分布式 云计算 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。 GoogleCluster: http://research

xnbw 2016-01-12   2076   0
P4

  Hadoop 集群 文档

Hadoop集群搭建 1. 机器规格 CPU:2个四核 2~2.5 GHz CPU 内存:8~16GB ECC RAM(非ECC会产生校验和错误) 存储器:4*1T SATA硬盘(硬盘大小一般是数据量的3—5倍)

serisboy 2013-04-09   2702   0
P19

  MapReduce与Hadoop 文档

1. MapReduce与Hadoop 2. 大多数运算所包含的操作在输入数据的“逻辑”记录上应用Map操作得出一个中间Key/value pair集合在所有具有相同key值的value值上应用Red

loyoo 2012-08-28   2554   0
P150

  Hadoop 入门 文档

1. Hadoop入门aokinglinux@hotmail.com 2. hadoop(1)Google (2)Hadoop (3)HDFS (4)MapReduce (5)Cloudera (6)Hadoop的使用

robinzhang 2012-03-22   713   0
P3

  Hadoop Streaming 文档

Streaming框架允许任何程序语言实现的程序在Hadoop MapReduce中使用,方便已有程序向Hadoop平台移植。因此可以说对于hadoop的扩展性意义重大,今天简单说一下。 Streami

misterle 2012-10-07   2751   0

hadoop优化 博客

1. 网络带宽 Hadoop集群的服务器在规划时就在统一的交换机下,这是在官方文档中建议的部署方式。 但是我们的这台交换机和其他交换机的互联带宽有限,所以在客户端遇到了HDFS访问速度慢的问题。

jopen 2012-09-22   1054   0
thinkjs  
P40

  Hadoop 讲解 文档

1. HADOOP 讲解 2. Mapreduce hadoop hive三者关系 3. Hadoop 是2005 Google MapReduce的一个Java实现。 MapReduce是一种简化的

hans511002 2012-06-24   728   0

Apache Hadoop 开源项目

Apache Hadoop是一个用java语言实现的软件框架,在由大量计算机中运行海量数据分布式计算,它可以让应用程序支持上千个节点和PB级 Hadoop是从google的MapReduce和Google文件系统的论文获得的灵

码头工人 2019-01-17   727   0

数据库SQL优化总结之 百万级数据库优化方案 经验

select id from t where num is null 最好不要给数据库留NULL,尽可能的使用 NOT NULL填充数据库. 备注、描述、评论之类的可以设置为 NULL,其他的,最好不要使用NULL。

jopen 2015-12-17   17568   0
SQL  

数据时代的 9 Key-Value存储数据 资讯

司也积累了 TB 量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。 一个解决方案是使用键值(Key-Value)存储数据库,这是一种 NoSQL

jopen 2013-04-23   25672   0
NOSQL  

数据时代的九Key-Value存储数据 经验

公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。 一个解决方案是使用键值(Key-Value)存储数据库,这是一种NoSQL

jopen 2014-04-26   72520   0
1 2 3 4 5 6 7 8 9 10