Java开发者PaaS指南

openkk 12年前

PaaS(Platform-as-a-Service)是云服务的一种,服务提供商不仅提供按需索取的硬件和操作系统服务,还提供了应用程序平台和解决方案栈。对开发者而言,PaaS极大程度上减少了IT部署的开销和痛苦,按需为应用程序提供资源,让其更易伸缩。
                </span>
  JVM、应用服务器和部署包(例如,WAR和EAR)为Java应用程序提供了天然的隔离,允许不同开发者在同一套基础设施中部署应用程序,因此Java 平台十分适合PaaS。但是,过去几年里,大多数PaaS产品都围绕着Ruby和Python这样的平台,当时Google App Engine是唯一为Java开发者提供PaaS服务的。幸运的是,现在的情况已经大为改善了。
差不多从去年开始,多家商业服务商进入了Java PaaS领域。这一举动很有意义,因为Java开发者差不多有1000万之多,也许是世界上最大的开发者群体之一。本文中,我们将从开发者的角度来比较这些服务提供商。特别要说明一下,具体比较以下4个方面:

  • 对技术平台和技术栈的支持。
  • 对开发者生产力和开发过程的支持。
  • 性能和可伸缩性。
  • 价格和其他商业考量。
文中我们会比较以下Java PaaS产品(按字母排序)。
  • Amazon Elastic Beanstalk是 Amazon构建于EC2云上的Java PaaS产品。其中提供了运行于EC2上的受管Tomcat实例,带有负载均衡器,还可按需提供伸缩能力。Amazon Elastic Beanstalk集成了Amazon Web Services的其他服务,能访问受管关系型数据库(RDS)、大数据存储(SimpleDB)、消息队列、电子邮件和其他服务。
  • CloudBees 是一家风投的创业公司,成员由JBoss和Sun的前雇员组成,最近在两轮融资中共募得1400万美元。CloudBees也许是个新名字,不过它在这个领域中的影响力正在不断扩大,为Java PaaS带来了多项独特的特性,尤其是持续集成——一个完整的云端开发/部署周期管理。此外,和Heroku一样,它还包含一个第三方插件和服务的市场。
  • Cloud Foundry 是VMware发起的一个开源产品。VMware软件驱动着虚拟化数据中心,这是大多数PaaS产品的基础。VMware还是Spring Framework的拥有者,它是在企业Java中非常流行的一个平台栈。Cloud Foundry的一个独一无二的特性是它根本无需成为受托管的PaaS,你可以下载其代码,自己托管PaaS!这样一来,它既是一个托管平台,也是一个受托管PaaS服务。
  • Google App Engine for Java 也许是市面上问世时间最长(也是最成熟)的Java PaaS产品。它的目标是提供线性伸缩性,而且不担心对Java平台本身做出巨大变化。
  • Heroku for Java 是PaaS大厂Heroku最近才推出的产品,Heroku在Ruby社区颇受欢迎。
  • Red Hat OpenShift 是Red Hat试水PaaS的实验性产品。Red Hat的JBoss Application Server (AS)是最流行的Java应用服务器之一,OpenShift服务提供了全面的JBoss AS支持。
支持的技术平台和技术栈Java PaaS提供商最重要的属性之一就是它所支持的技术平台和技术栈。总而言之,技术平台是Java PaaS区别于其他PaaS产品的地方。在Java平台的长期进化中,涌现了很多颇有竞争力的技术栈。对于Java PaaS厂商而言,我相信尽可能多地支持不同技术栈是十分重要的。
这方面OpenShift和CloudBees对技术的支持面最广,从简单的Servlet容器(一般是Tomcat)到完整的Java EE 6 Web Profile(JBoss AS 7)都有支持。Java PaaS先驱,Google App Engine,在标准支持方面与后来者的差距最大。Google App Engine不支持完整的Java SE平台,因此对很多流行框架的支持都很差。它还要求用户使用Google App Engine自己的网络和持久化API,而不是支持公开标准,这让应用程序很难迁移。类似的,Heroku for Java要求应用程序围绕它自己的Jetty实例做封装,打破了传统Java EE应用程序的部署模型。
Cloud Foundry项目支持Tomcat容器,但它的应用程序开发和部署针对Spring Framework做了大量优化,创建了一个半外置的依赖。因为VMware拥有Spring Framework,所以Cloud Foundry很适合基于Spring的应用程序。此外,它还支持使用RabbitMQ 的消息队列,这是基于 </span>AMQP 标准的。但它对其他Java框架(例如Java EE)的支持很弱。</span>
              Amazon Beanstalk
            
            CloudBees
            
            Cloud Foundry
            
            Google App Engine
            
            Heroku for Java
            
            OpenShift
            
            Tomcat
            
            是
            
            是
            
            是
            
            否
            
            否
            
            是
            
            Java SE
            
            是
            
            是
            
            是
            
            否
            
            是
            
            是
            
            Java EE
            
            否
            
            是
            
            否
            
            否
            
            否
            
            是
            
            支持标准 Java库
            
            是
            
            是
            
            是
            
            否
            
            是
            
            是
            
            文件系统访问
            
            是
            
            是
            
            是
            
            否
            
            是
            
            是
            
            线程访问
            
            是
            
            是
            
            是
            
            否
            
            是
            
            是
            
            对外网络连接
            
            是
            
            是
            
            是
            
            受限
            
            是
            
            是
            
            MySQL
            
            RDS
            
            是
            
            是
            
            付费方案
            
            是
            
            是
            
            商业关系型数据库
            
            RDS
            
            外置
            
            外置
            
            否
            
            外置
            
            外置
            
            Big Data支持
            
            SimpleDB
            
            外置
            
            外置
            
            BigTable
            
            外置
            
            外置
            
            部署时无需特殊框架
            
            是
            
            是
            
            否
            
            否
            
            是
            
            是
            
            方便迁移现有应用
            
            是
            
            是
            
            否
            
            否
            
            否
            
            是
            
            应用可移植性
            
            高
            
            高
            
            中
            
            低
            
            低
            
            高
            
            可用于生产环境
            
            是
            
            是
            
            Beta阶段
            
            是
            
            Beta阶段
            
            Beta阶段
            
对开发者生产力和开发过程的支持PaaS的关键价值之一,是让应用程序开发者的生活更简单,因为它消除了应用程序和资源管理的开销。所以说,对开发者友好,有工具集成是我们的一个重要考量点。
在这方面CloudBees无疑是赢家。它不仅是一个PaaS运行时环境,还是一个完整的构建和测试环境。开发者可以利用 Jenkins服务让CloudBees自动并持续地签出、构建、测试并报告代码库中的代码。这个持续集成过程已经被运用于多个大型团队,作为他们软件开发过程的重要环节。但是,构建服务器管理对QA团队而言是一项费时费力的工作。CloudBees替QA团队承担了这份痛苦,让这一过程对开发者更加透明。最近,Red Hat OpenShift通过支持Maven和Jekins集成,在这个领域里慢慢追上CloudBees了。
Amazon Beanstalk、OpenShift和Google App Engine都提供了开发工具、SDK和IDE插件,与其他市面上的基于Java的工具保持一致。
相比Java开发者,Cloud Foundry和Heroku for Java提供了更适合Ruby开发者的工具。试用了这些工具后,我怀疑很多Java开发者可能要花一些时间来适应其中的惯例和术语。另外,Cloud Foundry目前还缺乏文档,举个例子,它的很多文档还是视频教程形式的。虽然视频教程很容易让开发者上手,但在部署重要应用或希望了解视频场景之外的内容时,这些内容显然缺乏深度。尽管Cloud Foundry平台在最近几年里经历了重大变更,但官方入门指南文档的日期还停留在2007年。目前已经有了更多的文档——比如 </span>这篇 ,但它们不该这么难找。</span>
另一个重要的问题,Cloud Foundry允许开发者配置自己的云环境,部署Micro Cloud可比仅仅安装一套SDK麻烦多了。这也是一个障碍,让很多开发者对Cloud Foundry望而却步。
              Amazon Beanstalk
            
            CloudBees
            
            Cloud Foundry
            
            Google App Engine
            
            Heroku for Java
            
            OpenShift
            
            IDE工具
            
            是
            
            是
            
            是
            
            是
            
            否
            
            是
            
            命令行工具
            
            是
            
            是
            
            是
            
            是
            
            是
            
            是
            
            基于Web的控制台
            
            是
            
            是
            
            否
            
            是
            
            否
            
            是
            
            开发机上进行测试
            
            简单
            
            简单
            
            困难
            
            困难
            
            是
            
            简单
            
            构件时无非标准依赖
            
            是
            
            是
            
            否
            
            否
            
            否
            
            是
            
            源码控制集成
            
            否
            
            是
            
            是
            
            否
            
            否
            
            部分
            
            集成构建
            
            否
            
            是
            
            否
            
            否
            
            否
            
            是
            
            集成测试
            
            否
            
            是
            
            否
            
            否
            
            否
            
            否
            
            通过Web访问日志
            
            否
            
            是
            
            是
            
            是
            
            是
            
            是
            
            第三方开发者/测试服务
            
            否
            
            是
            
            否
            
            否
            
            否
            
            否
            
            API访问
            
            是
            
            是
            
            否
            
            否
            
            是
            
            否
            
            文档
            
            好
            
            好
            
            差
            
            好
            
            好
            
            好
            
性能和可伸缩性PaaS最重要的特性之一是平台自动伸缩的能力,就是基于实时流量需求增加或减少服务器容量。这要求平台提供商在众多服务器之间对请求做负载均衡,监控各台服务器的负载,适时启动新服务器。
所有PaaS提供商都在一定程度上支持自动伸缩。但自动扩展远比看上去困难。对入门用户而言,Java EE应用程序必须被配置为访问中心化外部数据库,而不是访问部署在同一台服务器上的数据库。所有PaaS提供商的编程范式和工具都要强制开发者遵循这种方式。
更大的问题是HTTP会话。在Java应用服务器上,HTTP会话的会话状态默认是在内存里管理的。要构建能在不同服务器之间负载均衡的应用程序,开发者必须使用以下的某个方法:
  • 配置负载均衡器支持“粘性会话”(sticky session),负载均衡器会检查所有流入请求的会话ID,总是把同一会话的请求发给相同的服务器。这是最简单的方法,不过也有自己的问题:负载均衡器需要完成更多的工作,久而久之负载分发会变得不再均衡,而且在负载下降时,很难撤下扩上去的基础设施,因为每台服务器都有自己的会话。出于这些原因,很少有PaaS提供商支持这一方法。
  • 为内存中的HTTP会话配置一个共享的缓存。如此一来,每时每刻所有服务器都能在内存里拥有全部HTTP会话。但是,在集群中复制内存会话这项任务既耗费带宽,又消耗计算资源。它要求应用程序开发者配置共享缓存和复制策略。
  • 还可以配置应用程序,将所有HTTP会话持久化到外部关系型数据库中。
上述所有的PaaS平台中,Google App Engine对这一问题的处理是最好的。它在架构上就将单一服务器的概念抽象了出来,会自动在不同的服务器上创建数据存储,并默认将HTTP会话保存到数据存储中,这一过程对开发者是透明的。但是,Google App Engine的问题是原生的性能太差,一个Web请求要花1至3秒才能完成一次对数据库的访问。
Heroku for Java的每个服务器实例都封装了一个自定义的Jetty实例,因此它也提供了跨服务器实例自动共享会话的能力。然而,Heroku并不提供透明的自动伸缩,你需要观察仪表盘,适时为应用添加资源。
剩余的标准Java PaaS产品都强制要求开发者在专门的数据库服务器上创建数据表,这也是部署过程的一部分。对于HTTP会话,Cloud Foundry在负载均衡器中使用了粘性会话。正如上文讨论的那样,这种做法为开发者带来了便利,也有一些严重的问题。其他PaaS产品虽然没有明说,但都把会话管理的工作留给了应用程序开发者。
              Amazon Beanstalk
            
            CloudBees
            
            Cloud Foundry
            
            Google App Engine
            
            Heroku for Java
            
            OpenShift
            
            内建负载均衡器
            
            是
            
            是
            
            是
            
            是
            
            是
            
            是
            
            负载均衡器自定义域名
            
            是
            
            是
            
            否
            
            Google Apps
            
            是
            
            是
            
            自动伸缩应用服务器
            
            是
            
            是
            
            计划支持
            
            是
            
            否
            
            是
            
            自动伸缩数据库
            
            否
            
            否
            
            否
            
            是
            
            否
            
            否
            
            用户定义性能标准
            
            是
            
            是
            
            计划支持
            
            否
            
            否
            
            是
            
            基于Web的监控仪表盘
            
            是
            
            是
            
            计划支持
            
            是
            
            是
            
            是
            
            集群HTTP会话
            
            手工
            
            手工
            
            手工
            
            自动
            
            自动
            
            手工
            
价格及其他商业考量对开发者而言,PaaS产品的价格是十分重要的。大多数服务提供商都有免费服务供开发者试用,这些免费服务对较小的Java Web站点来说就是很好的选择。
但是,正如Google App Engine最近的涨价风波所反映的那样,大型Web应用程序使用PaaS的成本还是很高的。
另一个要考虑的重要因素是支持。Google App Engine和Amazon Web Services在支持方面表现糟糕。开发者只能自己在论坛上寻找答案。稍小的专注于Java的提供商提供了更好的技术支持,在公共论坛上亦是如此。在我看来CloudBees提供的支持最为出色,很好地结合了付费问题单的支持和支持人员间的Java专业技术秘诀。
              Amazon Beanstalk
            
            CloudBees
            
            Cloud Foundry
            
            Google App Engine
            
            Heroku for Java
            
            OpenShift
            
            是否有免费服务
            
            是
            
            是
            
            N/A
            
            是
            
            是
            
            免费
            
            低流量入门级Web应用成本
            
            高
            
            免费
            
            免费
            
            免费
            
            免费
            
            免费
            
            跨云提供商
            
            否
            
            否
            
            计划支持
            
            否
            
            否
            
            计划支持
            
            私有云
            
            否
            
            Beta阶段(OpenStack或vSphere)
            
            是
            
            否
            
            否
            
            计划支持
            
            支持
            
            论坛
            
            电子邮件和电话
            
            论坛 / Web支持问题单
            
            论坛
            
            电子邮件和电话
            
            论坛
            
            支持质量
            
            差
            
            好
            
            好
            
            差
            
            一般
            
            好
            
下一步文中我们讨论了Java PaaS领域的6个知名厂商,当然,现在还有一些稍小的或不那么有名的提供商,比如:
  • Jelastic:它支持很多应用服务器和数据库的组合,包括MySQL数据库的多个变种和NoSQL数据库。
  • WSO2 StratosLive:它是构建于WSO2应用服务器上的PaaS产品,WSO2是一款符合Java EE规范的应用服务器。
  • CumuLogic:它提供的Java 应用服务PaaS可以运行于很多私有云和公有云解决方案上,包含CloudStack、 OpenStack和Eucalyptus。
我们会密切注意这些小厂商,因为它们很轻松地就能成长起来挑战大厂商的市场份额和关注度。
Java PaaS在过去的12个月里经历了很多,各种产品仍在快速发展,这对那些寻找低价、可伸缩、甚至是免费托管解决方案的Java开发者来说是个天大的好消息。对Java EE开发者而言,我相信CloudBes和OpenShift是目前市面上最好的产品,考虑到OpenShift仍处在Beta阶段,所以 CloudBees成为了这场比赛的赢家。如果你愿意尝试一下Java专业户以外的选择,Heroku for Java和Cloud Foundry(Beta)是老牌Google App Engine的有力竞争对手。

转自:http://blog.csdn.net/zhoujianghua_2008/article/details/7472901