用Hadoop进行分布式并行编程(二) 博客

程序实例与分析 Hadoop 是一个实现了MapReduce 计算模型的开源分布式并行编程框架,借助于Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。在本文中,详

Hadoopp 2012-09-28   1535   0

Hadoop 0.20的配置过程和配置文件(分布式) 博客

4、文件masters存放NameNode的机器,slaves中是DataNode机器,这两个文件分别写上环境中不同的机器。在我配置的这个环境里 只有两台机器,在masters里面的内容是hadoop1,在slaves文件里是hadoop2。

Hadoopp 2012-09-28   1086   0

高性能分布式数据库系统 OceanBase 问答

OceanBase 是一个支持海量数据的高性能分布式数据库系统,实现了数千亿条记录、数百TB数据上的跨行跨表事务,由淘宝核心系统研发部、运维、DBA、广告、应用研发等部门共同完成。 !OceanBase解决什么问题

fmms 2011-10-24   16248   0

Sensei:分布式, 实时, 半结构化数据库 经验

Wang的一个采访. 来大致了解一下Sensei. Sensei是什么? 开源, 灵活, 实时, 分布式数据库, 原生支持搜索, 能操作非结构化文本和结构化数据. 它主要用户处理海量复杂半结构化查询和经常变化的数据结构

jopen 2012-02-04   32906   0

淘宝分布式数据库 OceanBase 经验

OceanBase是一个支持海量数据的高性能分布式数据库系 统,实现了数千亿条记录、数百TB数据上的跨行跨表事务,由淘宝核心系统研发部、运维、DBA、广告、应用研发等部门共同完成。在设计和实现 Oce

fmms 2011-12-10   20885   0

高性能的分布式的内存对象缓存系统 Memcache 简介 经验

Memcache是一个高性能的分布式的内存对象缓存系统,通过在内存里维护一个统一的巨大的hash表,它能够用来存储各种格式的数据,包括图像 、视频、文件以及数据库检索的结果等。简单的说就是将数据调用到

fmms 2012-02-07   49576   0

分布式文档存储数据库 MongoDB 经验

可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。 它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有: 面向集合存储,易存储对象类型的数据。 模式自由。 支持动态查询。

openkk 2011-11-30   16367   0

Ruby开发的分布式K/V存储系统 ROMA 经验

ROMA是日本乐天(和yahoo并列的网络店铺)公司用Ruby开发的分散型KeyValue存储结构。

fmms 2012-01-25   12182   0

Hadoop入门 - Linux下伪分布式计算的安装与wordcount的实例展示 经验

的主要配置都在hadoop-0.20.1/conf 下。 (1)在conf/hadoop-env.sh 中配置Java 环境(namenode 与datanode 的配置相同): $ gedit hadoop-env.sh

fmms 2012-02-23   26987   0

MySQL的分布式数据库前端代理层 Amoeba 经验

amoeba是一个以MySQL为底层数据存储,并对应用提供MySQL协议接口的proxy。

openkk 2012-03-07   36240   0

Mantaray - 分布式点对点服务器消息和通信解决方案 经验

MantaRay基于peer-2-peer 技术。它既支持点对点(point-to-point)的域,又支持发布/订阅(publish/subscribe)类型的域。

fmms 2012-05-11   14039   0

分布式发布订阅消息系统 Kafka 经验

kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。 高吞吐量:即使是非常普通的

fmms 2012-05-12   32054   0

Drill 一个分布式系统用于大型数据集的互动分析 经验

Drill是一个分布式系统用于大型数据集的互动分析,类似于 Google 的 Dremel。 据Hadoop厂商MapR Technologies公司产品经理Tomer Shiran介绍,“Dri

openkk 2012-08-22   17499   0

分布式数据库管理系统 Mnesia 经验

Mnesia是一个分布式数据库管理系统(DBMS),适合于电信和其它需要持续运行和具备软实时特性的Erlang应用,是构建电信应用的控制系统平台开放式电信平台(OTP)的一部分。 Mnesia试图

openkk 2012-03-07   17745   0

.Net实时分布式搜索引擎 Lucandra.NET 经验

Lucene Solandra = Solr + Cassandra Solandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建. 在线PPT演示:

openkk 2012-03-07   23944   0

分布式缓存框架 xcache-j 经验

xcache是我研究分布式缓存期间,利用工作外的时间写的一个分布式缓存。它由三部分组成,xcache本身是一个本地缓存,xcache-server、xcache-client分别实现了缓存的服务端和客户端。

fmms 2012-04-27   13567   0

分布式缓存系统Memcached简介与实践 经验

Memcached是什么? Memcached是由Danga Interactive开发的,高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提升访问速度。 Memcached能缓存什么?

openkk 2012-05-17   19947   0

轻量级分布式数据访问层 CobarClient 经验

Cobar Client是一个轻量级分布式数据访问层(DAL)基于iBatis(已更名为MyBatis)和Spring框架实现。 主要特性: 可以支持垂直和水平数据切分数据库集群的访问; 支持双机热备的HA解决方案

openkk 2012-06-09   39953   0

Spanner - Google的全球化分布式数据库 经验

section 1 介绍 优点: 高可用、可扩展、(中间态的?tmp)多版本、全分布式、同步复制、对外一致的分布式事务 应用: F1 高可用 vs 低延迟:大多数应用使用3-5个datacenter

jopen 2012-09-20   19688   0

pybit - 一个Python的分布式构建系统 经验

Python 构建集工具包。一个分布式,跨平台,基于AMQP的构建系统。 Packaging requirements * rabbitmq-server http://packages.qa.debian

jopen 2012-11-04   29687   0
1 2 3 4 5 6 7 8 9 10