斯坦福大学开发 RAMCloud 或成传统硬盘终结者

fmms 12年前
     <p> 科技网站 arstechnica.com 日前发表文章称,斯坦福大学计算机系的一个研究小组正在创建一种名为 RAMCloud(内存云)的系统,试图以 DRAM(动态随机存储器)取代传统硬盘。以下是原文主要内容:</p>    <p> 用闪存取代传统硬盘,已经成了 IT 业界的发展趋势。但是斯坦福大学的一个研究小组进一步提出:DRAM 才是传统硬盘的“终结者”。</p>    <p> 为了实现这一目标,这个研究小组正在开展一项名为“RAMCloud”(内存云)的项目,它能够聚合上千台服务器的内存,从而极大地提高数据访问速度。由于 DRAM 一旦断电就会丢失数据,硬盘(或许还有闪存)仍可用于数据备份。但在日常运行中,所有信息应用访问都直接来自 DRAM。</p>    <p> 对于 RAMCloud 所面临的潜在障碍,项目负责人、斯坦福大学计算机系教授约翰·欧斯特霍特(John Ousterhout)也并不避讳。他表示,障碍之一是超低延迟网络的发展——现有网络性能需在未来三五年内取得极大进步,RAMCloud 才能有用武之地。</p>    <p> 但是 RAMCloud 一旦成功,也将带来巨大的收益。DRAM 价格昂贵,但是它的速度比闪存快5-10倍,比传统硬盘快100-1000倍。而企业使用传统机械硬盘时,很少会把硬盘的存储容量塞满,但却在数据访问速度上备受限制。所以尽管 DRAM 每字节的存储成本比硬盘贵50-100倍,但欧斯特霍特教授认为,DRAM 的每次读写操作成本依然低于硬盘。</p>    <p> 一些厂商已经认识到 DRAM 的性能优势,其实 VoltDB 等数据公司已经建立了内存型数据库,主要用于某些交易繁多的专业应用。欧斯特霍特相信,随着技术发展和价格下降,DRAM 未来将有更广泛的用途。</p>    <p> <strong>RAMCloud:数据新家园</strong></p>    <p> 2009年12月和2011年10月发表的两篇论文,描述了 RAMCloud 在数千台服务器和数百 TB 数据上的应用。 2009 年的论文中写道:“所有信息一直保存在 DRAM 中,DRAM 是数据的永久家园,而磁盘仅用于备份。”此外,RAMCloud 必须自动形成一定规模,从而支持数以千计的存储服务器;应用程序所看到的只有存储系统,而与存储服务器的数量无关。该论文称,装有 RAMCloud 的网络每秒钟可处理 100 万次服务请求。</p>    <p> 现在,欧斯特霍特和和他的研究团队已经做出了由80台各装有24GB DRAM 的服务器组成的2TB 原型系统,虽然离目标还有一定差距,但是它一旦遇到系统崩溃,仅需5微秒就能恢复基本的读取操作。研究团队从一年半以前开始为该系统编写代码,但是该系统的“1.0版”仍需6到12个月才能投入商业使用。</p>    <p> 欧斯特霍特认为 RAMCloud 系统的首批用户,会是那些在创建前沿互联网应用程序时受到存储系统局限的团队——对于他们而言,传统数据库不能保障数据的实时访问。例如 非死book 这样的网站,就很可能从 RAMCloud 中受益,欧斯特霍特表示他已经和 非死book 的高管进行过相关讨论。普通用户或许感觉不出什么区别,但 非死book 网页上生成的显示内容,的确受到了数据访问速度的限制。“他们现在受到很大局限,因为他们没有足够快的存储系统。”</p>    <p> 但是,就算技术已经成熟,非死book 也不可能在一夜之间将其存储系统全部换成 RAMCloud。不过欧斯特霍特表示,他们团队的研究工作已经吸引了一些闪存设备厂商和存储系统公司。欧斯特霍特认为,从长远来看,RAMCloud 有望被用于亚马逊 Elastic Compute Cloud 或者 Windows Azure 等云网络,甚至被用于企业数据中心。</p>    <p> <strong>磁盘将被取代</strong></p>    <p> 研究机构 Enterprise Strategy Group(企业战略集团)的创始人兼高级分析师史蒂夫·杜普雷西(Steve Duplessie)认为,未来存储系统终将抛弃机械硬盘,但这一淘汰过程需要多长时间,还是一个未知数。“与其说这是一个技术问题,不如说这是一个经济学问题。这取决于我们何时能降低成本、让它变得更实用。</p>    <p> SSD(固态硬盘)产业近年来方兴未艾。虽然将全部传统磁盘替换成固态硬盘的花费过于高昂,但是在分级系统中将传统硬盘与闪存联用,再利用数据压缩与重复删除技术,是一种既有效又可行的方法。杜普雷西表示:“虽然才刚刚开始,但是这是世界性的发展趋势。”</p>    <p> RAMCloud 是一种大胆创新,不过最近被戴尔收购的 RNA Network 公司也曾经提出过类似的构想——RNA Network 曾试图汇聚所有服务器的 DRAM,创建一个每台服务器都能访问或被访问的超大虚拟 DRAM。但是,这一构想目前还没有实现商业化。</p>    <p> 虽然 DRAM 价格昂贵,但是杜普雷西指出,现在的数据中心 DRAM 利用率很低,很多 DRAM 都被闲置。他表示:“既然已经买了它(DRAM),就该好好利用起来。”</p>    <p> 欧斯特霍特表示,几年之内,RAMCloud 所适用的服务器将拥有多达256GB 的 DRAM。他相信 RAMcloud 不是那种停留在论文和简易原型阶段的“典型研究项目”:“我们做的东西是供他人使用的。它们是开源的。如果这一系统真的有用,我们希望它能得到广泛的应用。”</p>