推升R成为支持企业端与云端跨平台分析的企业标准

jopen 8年前

推升R成为支持企业端与云端跨平台分析的企业标准

英文原文:Making R the Enterprise Standard for Cross-Platform Analytics, Both On-Premises and in the Cloud

不到一年前,我们决定买下 R,最广为采用的统计运算与分析预测程序语言,在商用软件与服务领域的领导厂商 Revolution Analytics 公司 ( 请参考:decided to acquire Revolution Analytics ),在那时候,我们就致力于将 R 及其划时代的技术建构在我们广大的产品线,包括资料库、巨量资料分析、以及商业智慧中 ( 请参考:we committed to ),让我们的客户和学生,在企业端或是 Azure 云端,以及新的平台都能够使用到统计,分析,与预测的功能,形成竞争的优势。

到目前为止,我们已经发布了以下许多新功能,同时也更新了一些原有的功能,让我们的客户和伙伴也都能够享受 R 的威力:

  1. 在 2015 年 6 月,我们成为 R Consortium  的创始会员之一,宣告了我们对 R 专项的承诺。
  2. 在 2015 年 10 月,我们以 SQL Server 2016 CTP3 技术为基础,发布了 SQL Server R Service 功能,这是 SQL Server 2016 CTP3 内建的功能,将先进的分析技术整合到数据库。
  3. 在 2015 年 11 月,我们开始支持本机安装的 Power BI 使用者管理并检视 R 处理的资料 ( 请参考:visualize and operationalize data in R  )。

这次,有更多令人感到兴奋的新功能要公佈,这些功能可以协助新的平台、开发者、或是 R 社群提供以 R 为基础的分析技术,包括:

在多种平台提供 Microsoft R Server,可以支持我们的企业客户不管是否使用那一种版本的 Hadoop 版本 ( Hortonworks、Cloudera、或是 MapR),那一种版本的 Linux ( Red Hat 或是 SUSE ),或是 Teradata,都能够只使用一种核心工具,标准化进阶分析的作业。对 Windows 的使用者,Microsoft R Server 会内建在 SQL Server 2016 中,也就是 SQL Server R Service 服务 – 内建 Microsoft R Server 的 SQL Server 的售价会比两者分开购买的价格更加优惠。但是在 SQL Server 2016 正式发布前,Revolution R Enterprise for Windows 都能够以独立的方式进行采购。

IDC 的商业分析和资讯管理部门的程序开发副总裁 Dan Vesset 说:" 进阶的预测与分析必须发展新的开发与测试模型,但是也需要开发者的努力,才能够创造出具自动化决策支持功能的产品,进而为整个企业提供有效的决策支持。透过 Microsoft 对 R 分析决策技术的承诺与支持,Microsoft 在导入分析模型,提供具生产力的工具与程序开发支持方面,扮演了很重要的角色,成功地降低了使用进阶的预测分析技术的门槛"。

除了近期发布的新功能以外,我们将会持续不断地在我们的产品中提供最佳的整合服务,以及更创新的功能,包括:

  1. 整合 Revolution 的 scalable R distribution 功能到  Azure HDInsight 和 Azure Machine Learning
  2. 在 Microsoft Azure 云端提供安装妥 Microsoft R Server 的虚拟机器。
  3. 支持使用功能类似 Python Tools for Visual Studio (PTVS) 的 R Tools for Visual Studio (RTVS) 快速开发 R 模型。

加上这些我们将要释出的功能,就是我们对企业、R 开发者、资料科学家提供大规模的进阶分析预测平台,协助建立企业端与云端分析预测功能的应用程式的高成本效益解决方桉的承诺。

认识 Microsoft R Server

Microsoft R Server 是一个以 R 为基础,支持在不同环境部署的企业级分析平台,提供以 R 为基础、高延展性、以及高安全性的运算环境。为了支持各种巨量资料统计运算,预测模型,以及机器学习的能力,R Server 支持完整的分析技术 – 探索 (exploration),分析 (analysis),视觉呈现 (visualization),以及建立模型 (modeling)。Microsoft R Server 使用开放源代码 R,并加以扩充,但是仍保有与 R script、函式、与 CRAN 套件完整的相容性,提供企业层级的资料分析功能。除此之外,Microsoft R Server 也运用平行运算技术与分段处理资料的技术解决了开放源代码 R 在 in-memory 运算的限制,协助使用能够顺利地对资料量比电脑主记忆体更大的资料进行分析与预测。

Microsoft 在买下 Revolution Analytics 公司之后,投注了很多心力加入了许多新功能 (详细资料可以参考:Microsoft R Server – What is New?),并且在开发新功能的时候努力让 Revolution Analytics 的产品更加安全,更加国际化,降低入门使用门槛,同时也很容易安装。以最新发布的版本为例,其功能包括:

  • R 语言 3.2.2 版
  • Microsoft 提供的企业级支持
  • 符合 Microsoft's Security Development Cycle 软件开发规范的企业层级安全性,包括威胁模型和攻击层面分析,程式码分析,以及延伸的模煳测试等等
  • 符合 Microsoft Accessibility Standards 规范的可用性
  • 支持中国政府 GB18030 编码标准

使用 Hadoop 的客户可使用 Microsoft R Server for Hadoop 在分散式的 Microsoft R Server 丛集建立和执行 R 模型,不需要放弃客户原本喜好的R开发环境。Microsoft R Server for Hadoop 能够自动将分析与预测的工作延展到 Hadoop 节点,不需要写作複杂的程式码。

Hortonworks 公司的执行长 Rob Bearden 说:“ 在 Hortonworks,我们允许我们的客户从动态的资料和静态的资料建立具决策智慧的现代化资料分析应用程式。Microsoft’s R Server 和我们公司的 HDP 与 HDF 平台搭配之后可以提供一个以 R 语言为基础的高延展性,企业层级的巨量资料与分析解决方桉,作为数以百万计的 R 开发者开发各种预测与分析应用程式的基石,分析来自网际网路数以 10 亿计的各种资料来源,并转换成有用的资料供企业参考"。

客户可以利用 Microsoft R Server for Teradata 享受在 Teradata 提供的设备与资料库中直接执行进阶分析模型,对资料库中的资料进行分析与预测的好处,不需要付出从资料库取出欲分析的资料才能够进行分析的代价。

Teradata 公司 Product and Services Marketing 部门的副总裁 Chris Twogood 说:“ 我们非常高兴 Microsoft 发布了企业等级,具高延展性,以非常受欢迎的 R 语言为基础的的巨量资料分析平台。 在 Microsoft 发布了 Microsoft R Server for Teradata 之后,两家公司共同的客户就能够在 Teradata 整合的资料仓储设备,利用我们的硬件强大的威力和延展性执行进阶的统计和预计分析运算。有了 Microsoft R Server for Teradata,我们的客户能够建立和部署适用于零售业的应用程式,提供诈骗侦测,智慧型客户关系管理,以及以 IoT 物联网为基础的预测维护等功能”。

我们提供的  Microsoft Data Science Virtual Machine 将会包含预先安装,并设定妥当的 Microsoft R Server 开发者版本,支持 R 使用者能够借助于 Microsoft Azure 云端平台,立即开始使用资料探索与建立模型等功能,不需要自行耗费精神和物力在企业端安装和设定支持执行资料分析的环境。

认识 Microsoft R Open

虽然 Revolution R Open 现在叫做 Microsoft R Open,但是 Microsoft 将会持续遵守自己的承诺,包括支持R开放源代码专项,定期发表更新版,以及支持免费散佈 R 平台。Microsoft R Open 利用 Intel Math Kernel Libraries (MKL) 提供,适用于多执行绪处理器的最佳化运算,大幅地改良了 R 的执行效率,特别是矩阵相关的运算速度。除此之外,透过 Microsoft R Open 提供的简化 R 套件版本管理功能,可以让 R 使用者更容易地在 Microsoft Windows、Mac、以及 Linux 平台开发可靠的 R 解决方桉。Microsoft R Open 百分之百相容于所有的 R script 和套件,而且和 R 一样採取开放源代码的形式,支持有需要的人免费下载,使用,和分享。

R 社群是 R 语言会成功的关键因素,也是资料科学家、统计学家、以及企业的重要资源。自从买下 Revolution acquisition 之后,Microsoft 持续支持 R 社群,包括扩展对 R 使用者社群和研讨会的赞助,而且也增加了在 R 开放源代码专项的投资,提供 Microsoft R Open 和 DeployR Open (支持以 Web 服务的方式发行 R 的服务器)的定期更新,提供包括检查点 (checkpoint) 功能的新版本和更新版本的 R 套件,提供 R 套件的时间机器,支持在丛集执行 R 平行运算的 ParallelR,以及支持将 R 函式部署到 Azure 云端平台当做 API 的 Azure ML。除此之外,成为 R Consortium 创始成员之一就是 Microsoft 对支持 R Project 最明确的承诺。

RStudio 公司的执行长 JJ Allaire 说:“ 身为 R Consortium 的成员,我们非常高兴看到 Microsoft 加入支持 R 语言的行列,有像 Microsoft 这样产品一流的公司在 R 的投资,R 语言已经准备妥跨足企业应用。我们期待能够和 Microsoft 合作,提供容易部署的环境、具商品品质的工具、以及基础建设,为客户创造成功的环境”。

对 Microsoft R Open 有兴趣的读者可以阅读 R Community 社群领导 David Smith 发表的文章:the post。有意开始学习 Microsoft R Server 与 Microsoft R Open 的读者可以到 upcoming webinar series 网站注册参与以下的网路研讨会。

January 28, 2016

Intro to Microsoft R Open

David Smith

February 4, 2016

Using Microsoft R Server to Address Scalability Issues in R

Derek Norton

February 11, 2016

Data Mining with Microsoft R Server

Derek Norton

February 18, 2016

Best Practices for using Microsoft R Server with Hadoop

Jamie Olson

February 25, 2016

Using Microsoft R Server to Operationalize your Analytics

Jamie Olson

学习参考资料链接

来自: blogs.msdn.com