分布式key/value存储系统 BeansDB

openkk 12年前

BeansDB 是一个主要针对大数据量、高可用性的分布式KeyValue存储系统,采用HashTree和简化的版本号来快速同步保证最终一致性(弱),一个简化版的 Dynamo (Dynamo 是 Amazon 公司的一个分布式存储引擎。)。

它采用类似memcached的去中心化结构,在客户端实现数据路由。目前只提供了 Python版本的客户端,其它语言的客户端可以由memcached的客户端稍加改造得到。

主要特性包括:

  • 高可用:通过多个可读写的用于备份实现高可用;
  • 最终一致性:通过哈希树实现快速完整数据同步(短时间内数据可能不一致);
  • 容易扩展:可以在不中断服务的情况下进行容量扩展;
  • 高性能:异步IO和高性能的Key Value数据Tokyo Cabinet;
  • 可配置的可用性和一致性:通过N,W,R进行配置;
  • 简单协议:Memcached兼容协议,大量可用客户端。

客户端

目前只提供了Python版本的客户端,在python目录中,该目录中各文件的左右如下:

dbclient.py BeansDB的客户端,由memcached的客户端简单封装而成

status.py 查看BeansDB的状态,各个节点的数据分布,以及同步状态

sync.py 同步各节点

httpd.py HTTP方式访问BeansDB的内容(目前只有GET方式)


项目主页:http://www.open-open.com/lib/view/home/1331130545530