六问Ceph:在中国的发展还有哪些障碍?

jopen 9年前
 

中国首场Ceph Day于2015年6月6日在北京由Intel和RedHat联合举办,吸引了约200人参加。《 Ceph Day中国首秀,哪些技术趋势最值得关注? 》一文总结了当日演讲嘉宾和圆桌会议谈到的Ceph重要技术趋势,本文基于与Intel和Redhat相关负责人的交流,补充说明Cpeh的一些发展问题,并分享Ceph Day的调查问卷结果汇总,让大家对Ceph在中国的发展和应用状况有一个更清晰的认识。

为什么是Ceph

Intel大数据技术组总经理马子雅分享的一项调查结果显示,Ceph是非常受欢迎的开源存储软件, Ceph RBD 在块存储层面受欢迎的程度远远超过了LVM、GlusterFS等,并且最近半年中这个差距正在扩大。这个结果,与原本预计百人规模的Ceph Day活动却迎来近200人到场的情况相吻合。按照马子雅的观点,开源存储是数据量及数据复杂性疯长的良药,但开源存储为什么一定是Ceph呢?Ceph 和其他的存储技术各自最终的市场份额会是多少?

六问Ceph:在中国的发展还有哪些障碍?

Ceph RBD大受欢迎

Intel亚太研发中心云计算及大数据实验室经理段建刚认为,首先开源技术在云计算大数据领域的未来很好,其次存储是非常基础的需求,Ceph具 有同时支持块、文件和对象的先进架构,在稳定性、可管理性上有很强的优势,同时性能也可以满足用户需求,已经获得很多国外用户的青睐,所以Intel看好 Ceph的未来。这也是Intel从2012年开始选择大力投入Ceph社区的原因。

来自RedHat的Ceph社区总监Patrick McGarry谈到,所有人都需要存储,尤其是在这个大数据时代,而Ceph是不错的技术,如沃尔玛、Yahoo!等,基本各个行业都有用户在使用Ceph。

六问Ceph:在中国的发展还有哪些障碍?

Ceph社区总监Patrick McGarry

Patrick McGarry认为,商业存储和开源存储当前各有市场。但开源代表创新的方向,传统企业的一些痛点,需要Ceph这样的技术来解 决。开源技术发展很快,而传统企业非常care稳定性、安全性,又不能像互联网企业一样在试错中不断改进,RedHat的开源商业化定位,就是做一个“稳 定器”,让用户可以更好地消费开源技术,让传统企业更加容易接受开源。

对于GlusterFS,Patrick McGarry谈到,GlusterFS和Ceph都是RedHat先后并购的技术,由于发展路线不 同,前者在FileSystem更强一些,后者在object更强,用户可以看usecase选择。但RedHat将会在GlusterFS和Ceph之 上提供一个USM统一存储管理产品,为同时使用两个技术的用户提供更上一层的管理工具。

相对于Swift,Patrick McGarry认为,Ceph具有框架或者platform的优势,提供block、object层和文件系 统的支持,可扩展性也非常好,在一个大的cluster中只要加一个OSD就可以扩展,device损坏也可以自动添加和修复,不需要用户配置,而 Swift只是OpenStack底层的对象存储支持。

Ceph的近期规划

Patrick McGarry强调了Ceph的独立性与开放性。RedHat收购了inktank,Ceph的研发仍遵循LGPL开源协议,不 会有太多的商业行为。RedHat也信奉100%开源的文化,重视贡献、分享,同时也欢迎更多的人参与到Ceph的开发,而不是要像独裁者一样控制 Ceph,现在的KVM就是很好的例子。在特性方面,加强文件的支持,也就是CephFS将是今年的重点。而CephFS和容器的整合,也是与会人员期待 的一个方向。

Ceph与其他开源技术

这里说的其他开源技术主要指OpenStack,Ceph的发展与OpenStack的关系比较紧密,经过一年多的发展,Ceph已经成为 OpenStack的首选存储方案,并且目前Ceph80%的代码都来自于与OpenStack相关的项目,Cpeh会在block层和object层和 OpenStack结合。不过根据Patrick McGarry的经验,Ceph已经不仅仅应用于OpenStack环境之中,在OpenStack领 域之外Ceph也获得了快速的增长。同时Ceph有一个Gateway,支持读取Swift、Amazon S3的存储,使得用户可做不同的选择。

其次是Container,尤其是Docker,已经成为云计算领域绕不开的开源技术。Patrick McGarry表示,Docker快速地 集成发布,从pull到push,Ceph将在后端的backup提供支持,同时我们还可以在Docker中做Ceph的一些镜像测试。此 外,CephFS今年也将要实现用于生产环境的目标。RedHat相信,Ceph作为最流行的开源存储技术,未来与最流行的容器技术Docker的结合, 将会更加紧密。

Ceph在中国

中国Ceph社区的贡献者主要来自RedHat和Intel。RedHat的主导地位不用多说,在上海有研发团队。Intel的Ceph研发团队 都在中国,投入30多人,包括两位core(其中一位是分享NewStore存储后端的设计与实现的陈晓熹),代码贡献量在2015年排名第二,其中包括 一些重要特性。Intel主要做三个方向的工作:原始的应用性能提升,企业级特性(如NewStore),以及相关工具的开发(如CeTune性能分析和 调优工具,由女性工程师薛晨迪研发,预计今年更加成熟之后开源)。

段建刚表示,希望有更多的开发者能够参与到开源社区的开发工作中,包括开源存储生态系统的建设,而不仅仅是索取——这确实是中国特殊的国情。

来自麒麟云的汪黎博士用团队的工作证实了中国开发者的进步。据了解,该团队向Ceph社区提交100+commits,在v0.93版本中,团队代码贡献排名第2。此外,海云捷迅、UnitedStack也做出了各自的贡献。

用户眼中的Ceph

从调查问卷结果来看,整体上国内Ceph的部署还处于开发与QA测试阶段(46%),在生产环境中部署的达30%,大部分集群的规模在10到50 个节点之间(36%),应用模式RBD仍占主导地位(50%)。当然,参加调查的人群是本来关注Ceph的参会者,实际上整体应用情况应该会低于这个数 据,但这个数据也已经足以说明,Ceph确实在一些国内企业的生产环境中发挥了作用。

完美世界的副总经理张晓宜分享了完美世界一步一步地解决使用Ceph所遇到的问题,他认为,Ceph技术确实不错,但在知识、易用性、中文资料方 面还需要加强,他还希望薛晨迪介绍的CeTune,可以实现检测、分析之后的在线调优,也就是不需要重启Ceph。完美世界的优化过程,张晓宜的PPT谈 的非常清楚,在此不再多说。

六问Ceph:在中国的发展还有哪些障碍?

完美世界副总经理张晓宜

Ceph的面临的挑战

调查问卷结果表明,Ceph当前面临的最主要的三个问题,依次是性能(27%),代码复杂(26%),以及过多未成熟功能(17%)。

在圆桌讨论中,嘉宾们对性能问题吐槽颇多。海云捷迅CTO李华表示,Ceph由于存在已久,没有针对SSD优化,最大只能发挥40%的SSD性能 (Intel DC S3500)。平安科技(已部署50节点,3个集群)基础架构管理部存储与备份组经理王欣也认为性能需要提高,同时他还提到可靠性不足、企业级的特性(容 灾、快照、压缩、去重)缺失、运维人员成本高、3副本带来的额外开销等多种不足,他表示,测试结果传统存储的成本其实还是低于分布式存储的。清华大学助理 教授徐葳(部署了60节点)关注的是软件定义存储的特性还不能真正用上,还需要一些API;此外Ceph还不是一站式解决方案,调优需要很繁琐的步骤。

汪黎提到,Ceph的理念很好,SDS和扩展性不错,自动添加和删除节点都是优势,但是存在可靠性和性能的矛盾,当前代码本身的开销还是比较重, 代码路径太差,多个队列多个副本拖累写性能,加入一块磁盘,集群的写带宽并没有增加多少,延迟也还需要优化;另外,Ceph对自己状态的监控和管理,如提 前告警之类,还缺乏产品化的工具,还是纯手动运维。

Intel 云存储技术组经理张建认为,用户发现的这些不同的问题,可以及时反馈给社区,通过社区交流和社区分享,实现开发者和用户的沟通,并鼓励用户的贡献,来解决这些问题。热衷于社区贡献的开发者认为,贡献对于用户跟上Ceph的版本升级也非常有好处。

附:北京Ceph Day 用户调查结果

为了更好的了解Ceph目前在中国的部署现状,向Ceph社区收集下一步Ceph开发和优化的相关建议,主办方设计了一份由16个问题组成的调查问卷,包括3个开放性问题。

本次调查问卷共收到有效问卷110份,问卷的汇总结果如下(由Intel云存储技术组经理张建整理):

1. 您或您公司的定位。39%的与会人员是私有云服务提供商。排在其后的是17%的先关上下游厂商。

六问Ceph:在中国的发展还有哪些障碍?

2. 正在使用的云操作系统。 OpenStack占主导地位,高达59%。

六问Ceph:在中国的发展还有哪些障碍?

3. 除Ceph之外采用的其他存储系统解决方案:商业存储方案达26%,HDFS占到19%。

六问Ceph:在中国的发展还有哪些障碍?

4. Ceph部署阶段:整体上国内Ceph的部署还处于开发与QA测试阶段(46%),在生产环境中部署的达30%。

六问Ceph:在中国的发展还有哪些障碍?

5. Ceph部署规模:大部分集群的规模在10到50个节点之间(36%),1-10个节点的占到30%。

六问Ceph:在中国的发展还有哪些障碍?

6. Ceph的应用模式,RBD仍占主导地位(50%),对象存储占23%,文件系统16%。

六问Ceph:在中国的发展还有哪些障碍?

7. Ceph版本:31%的人在使用最新的Hammer版本。

六问Ceph:在中国的发展还有哪些障碍?

8. 数据可靠性机制:三副本仍是主流(49%)。

六问Ceph:在中国的发展还有哪些障碍?

9. 关注的Ceph技术方向:Cache Tiering是大家最关注的技术(26%),Erasure Coding也占到了19%。全SSD集群和海量小文件也是大家关注的重点。

六问Ceph:在中国的发展还有哪些障碍?

10. 最关注的性能指标:稳定性是最关注的性能指标(30%),接下来是IOPS,延迟和带宽。

六问Ceph:在中国的发展还有哪些障碍?

11. Ceph部署工具:50%的人采用了Ceph-deploy。

六问Ceph:在中国的发展还有哪些障碍?

12. Ceph集群监控、管理工具:35%的人采用了Calamari,33%的人没有使用任何监控和管理工具。

六问Ceph:在中国的发展还有哪些障碍?

13. Ceph前三大问题:依次是性能(27%),代码复杂(26%),过多未成熟功能(17%)。

六问Ceph:在中国的发展还有哪些障碍?

14. 对于Ceph开发和优化的建议:主要集中在完善文档,CephFS优化,全SSD 系统优化等方面。

六问Ceph:在中国的发展还有哪些障碍?

15. 选择Ceph的原因:功能全面,社区活跃等。

六问Ceph:在中国的发展还有哪些障碍?

16. QoS 要求:多种多样。

六问Ceph:在中国的发展还有哪些障碍?

(责编/周建丁)