开源项目,开源代码,开源文档,开源新闻,开源社区

Chan 详细介绍了用于大数据分析的分布式数据库FiloDB，对其主要特点和所包含模块进行了分析。在当今的大数据时代，越来越多的企业需要对结构化的数据进行分析和查询，需要对流数据进行快速处理和更新。以

jopen 2015-11-05 24157 0

FiloDB

P21

(本页无文本内容) 2. 多机房分布式数据库同步谭俊青@途牛 mysqlab.net 3. 背景南、北数据同步存在延时南、北专线可能会意外中断南、北业务都不能中断本地读取数据一致性不能得到保证灾备需要

byc2 2014-11-19 2879 0

本文主要讲述 HDFS原理-架构、副本机制、HDFS负载均衡、机架感知、健壮性、文件删除恢复机制 1：当前HDFS架构详尽分析 HDFS架构 •NameNode •DataNode •Sencondary

jopen 2013-08-11 192163 0

HDFS 分布式/云计算/大数据

P8

英文原版下载地址（http://hadoop.apache.org/hdfs/docs/r0.21.0/hdfs_user_guide.html） HDFS用户指南 HDFS用户指南 (HDFS Users Guide)

chenfeng_0829 2013-04-17 2826 0

分布式/云计算/大数据

P2

一．Hadoop核心角色 hadoop框架 Hadoop使用主/从（Master/Slave）架构，主要角色有NameNode，DataNode，secondary NameNode，JobTracker，TaskTracker组成。

zhezi7 2012-10-08 2833 0

Hadoop 分布式/云计算/大数据

P

Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。<br> Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性（fault-tolerent）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求（requirements）这样可以流的形式访问（streaming access）文件系统中的数据。

mimosa1987 2013-01-04 1259 0

Hadoop 分布式/云计算/大数据

P3

一、安装sun的jdk和hadoop，不要使用open-jdk 本人安装的jdk1.7.0.rpm包（默认安装路劲为/usr/java/jdk1.7.0）解压hadoop-0.20.2到：/home/hadoop/

gps2012 2013-01-14 525 0

Hadoop 分布式/云计算/大数据

P6

007/02/09/1506112.aspx Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超

ck614 2010-11-10 4010 0

Hadoop 分布式/云计算/大数据

P

Hadoop作为Apache基金会资助的开源项目，由Doug Cutting带领的团队进行开发，基于Lucene和Nutch等开源项目，实现了Google的GFS和Hadoop能够稳定运行在20个节点的集群；2006年1月，Doug Cutting加入雅虎公司，同年2月Apache Hadoop项目正式支持HDFS和MapReduce的独立开发。同时，新兴公司Cloudera为Hadoop提供了商业支持，帮助企业实现标准化安装，并志愿贡献社区。Hadoop的最新版本是0.21.0，说明其还在不断完善发展之中。<br> Hadoop由分布式存储HDFS和分布式计算MapReduce两部分组成。HDFS是一个master/slave的结构，就通常的部署来说，在master上只运行一个Namenode，而在每一个slave上运行一个Datanode。MapReduce是Google的一项重要技术，它是一个编程模型，用以进行大数据量的计算。MapReduce的名字源于这个模型中的两项核心操作：Map和Reduce。Map是把一组数据一对一的映射为另外的一组数据，Reduce是对一组数据进行归约，映射和归约的规则都由一个函数指定。

Bluth 2012-12-25 321 0

Hadoop 分布式/云计算/大数据

P83

Hadoop源代码分析（一）关键字: 分布式 云计算 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster： http://research

xnbw 2016-01-12 2076 0

Hadoop 分布式/云计算/大数据

P4

Hadoop集群搭建 1. 机器规格 CPU：2个四核 2~2.5 GHz CPU 内存：8~16GB ECC RAM(非ECC会产生校验和错误) 存储器：4*1T SATA硬盘（硬盘大小一般是数据量的3—5倍）

serisboy 2013-04-09 2702 0

Hadoop 分布式/云计算/大数据

P19

1. MapReduce与Hadoop 2. 大多数运算所包含的操作在输入数据的“逻辑”记录上应用Map操作得出一个中间Key/value pair集合在所有具有相同key值的value值上应用Red

loyoo 2012-08-28 2554 0

Hadoop 分布式/云计算/大数据 Go ini

P150

1. Hadoop入门aokinglinux@hotmail.com 2. hadoop(1)Google (2)Hadoop (3)HDFS (4)MapReduce (5)Cloudera (6)Hadoop的使用

robinzhang 2012-03-22 713 0

Hadoop 分布式/云计算/大数据方案报告 Apache

P3

Streaming框架允许任何程序语言实现的程序在Hadoop MapReduce中使用，方便已有程序向Hadoop平台移植。因此可以说对于hadoop的扩展性意义重大，今天简单说一下。 Streami

misterle 2012-10-07 2751 0

Hadoop 分布式/云计算/大数据

1. 网络带宽 Hadoop集群的服务器在规划时就在统一的交换机下，这是在官方文档中建议的部署方式。但是我们的这台交换机和其他交换机的互联带宽有限，所以在客户端遇到了HDFS访问速度慢的问题。

jopen 2012-09-22 1054 0

thinkjs

P40

1. HADOOP 讲解 2. Mapreduce hadoop hive三者关系 3. Hadoop 是2005 Google MapReduce的一个Java实现。 MapReduce是一种简化的

hans511002 2012-06-24 728 0

Hadoop 分布式/云计算/大数据报告 Apache C/C++

Apache Hadoop是一个用java语言实现的软件框架，在由大量计算机中运行海量数据的分布式计算，它可以让应用程序支持上千个节点和PB级 Hadoop是从google的MapReduce和Google文件系统的论文获得的灵

码头工人 2019-01-17 727 0

Apache项目

select id from t where num is null 最好不要给数据库留NULL，尽可能的使用 NOT NULL填充数据库. 备注、描述、评论之类的可以设置为 NULL，其他的，最好不要使用NULL。

jopen 2015-12-17 17568 0

SQL

司也积累了 TB 量级的数据。各种规模的组织开始有了处理大数据的需求，而目前关系型数据库在可缩放方面几乎已经达到极限。一个解决方案是使用键值（Key-Value）存储数据库，这是一种 NoSQL

jopen 2013-04-23 25672 0

NOSQL

公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求，而目前关系型数据库在可缩放方面几乎已经达到极限。一个解决方案是使用键值（Key-Value）存储数据库，这是一种NoSQL

jopen 2014-04-26 72520 0

数据库 NoSQL数据库

FiloDB：用于大数据分析的分布式数据库资讯

途牛多数据中心分布式数据库同步文档

HDFS 原理、架构与特性介绍经验

HDFS 用户指南中文版文档

Hadoop 认识文档

Hadoop API 文档

hadoop 安装文档

Hadoop入门文档

Hadoop 入门文档

Hadoop 源码文档

Hadoop 集群文档

MapReduce与Hadoop 文档

Hadoop 入门文档

Hadoop Streaming 文档

hadoop优化博客

Hadoop 讲解文档

Apache Hadoop 开源项目

数据库SQL优化大总结之百万级数据库优化方案经验

大数据时代的 9 大Key-Value存储数据库资讯

大数据时代的九大Key-Value存储数据库经验

Hadoop的分布式文件系统HDFS属于大数据的相关搜索

关键词

FiloDB：用于大数据分析的分布式数据库 资讯

途牛多数据中心分布式数据库同步 文档

HDFS 原理、架构与特性介绍 经验

HDFS 用户指南中文版 文档

Hadoop 认识 文档

Hadoop API 文档

hadoop 安装 文档

Hadoop入门 文档

Hadoop 入门 文档

Hadoop 源码 文档

Hadoop 集群 文档

MapReduce与Hadoop 文档

Hadoop 入门 文档

Hadoop Streaming 文档

hadoop优化 博客

Hadoop 讲解 文档

Apache Hadoop 开源项目

数据库SQL优化大总结之 百万级数据库优化方案 经验

大数据时代的 9 大Key-Value存储数据库 资讯

大数据时代的九大Key-Value存储数据库 经验

Hadoop的分布式文件系统HDFS属于大数据 的相关搜索

关键词

FiloDB：用于大数据分析的分布式数据库资讯

途牛多数据中心分布式数据库同步文档

HDFS 原理、架构与特性介绍经验

HDFS 用户指南中文版文档

Hadoop 认识文档

hadoop 安装文档

Hadoop入门文档

Hadoop 入门文档

Hadoop 源码文档

Hadoop 集群文档

Hadoop 入门文档

hadoop优化博客

Hadoop 讲解文档

数据库SQL优化大总结之百万级数据库优化方案经验

大数据时代的 9 大Key-Value存储数据库资讯

大数据时代的九大Key-Value存储数据库经验

Hadoop的分布式文件系统HDFS属于大数据的相关搜索