10 月,开发者不可错过的开源大数据大会-2021 WeDataSphere 社区大会深圳站 了解详情
写点什么

Facebook 开源基于 Torch 的一组深度学习插件

2015 年 1 月 25 日

深度学习是机器学习研究中的一个新的领域,它能够模仿人脑的机制来解释数据。近日,Facebook 人工智能研究院(FAIR)宣布开源了一组深度学习工具,这些工具主要是针对 Torch 机器学习框架的插件,包括 iTorch fbcunn fbnn fbcuda fblualib 。这些插件能够在很大程度上提升神经网络的性能,并可用于计算机视觉和自然语言处理(NLP)等场景。目前,Torch 已被 Google、Twitter、Intel、AMD、NVIDIA 等公司采用。

其中的 fbcunn 包含了 Facebook 用于 GPU 的高度工程化深度学习模块,该模块可用来加快深度学习的速度。fbcunn 对对像识别、自然语言的处理以及其他大规模的深度学习系统(如卷积神经网络)有很大的帮助。

本次开源的内容包括用于大型卷积网(ConvNets)的 GPU 优化模块、在自然语言处理领域常用的网络。其中的 ConvNets 模块包括一个快速的基于 FFT 的卷积层,采用基于 NVIDIA 的 cuFFT 库构建的自定义 CUDA 内核。除此之外,还包括许多其他基于 CUDA 的模块和容器(container)。本次发布的最重要部分包括基于 FFT 的卷积层代码,Facebook 已经花了相当大的工程努力提高 GPU 卷积层。这项工作已达到目前公布的最快代码的 23.5 倍,如下图所示是 13x13 内核情况:

该热力图显示了采用 Facebook 的 ConvolutionFFT 相对于采用 NVIDIA 的 CuDNN 完成一个训练的相对速度,红色代表 Facebook 慢,绿色代表 Facebook 更快,颜色增强代表加速的幅度。对于小尺寸的内核(3×3),增速适中,最高速度比 CuDNN 快 1.84 倍;对于较大尺寸的内核,从(5×5)开始,增速相当可观;更大尺寸的内核(13x13),最高速度为比 CuDNN 快 23.5 倍, 更多的技术细节,读者还可以阅读在 Arxiv 上发表的一篇论文

深度学习算法是让机器拥有智能的最佳途径,Facebook 开源的这些学习工具将会推动深度学习算法的普及并降低相关应用的门槛,从而使得模式识别、神经网络等变得更加简单。除了Facebook 开源的这些学习工具外,读者还可以阅读下InfoWorld 公布值得大家参考学习的机器学习领域11 个最受欢迎的开源项目


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2015 年 1 月 25 日 09:007535
用户头像

发布了 46 篇内容, 共 47.5 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

「 优秀主题征文名单公布 」—— InfoQ 写作平台【 1 周年盛典 】

InfoQ写作平台官方

活动专区 1 周年盛典

公有云成本节省神器!京东云共享带宽包正式上线

京东科技开发者

公有云 带宽

亿网嘉元是做什么的?

飞亚科技

Python变量作用域与LEGB规则

大奎

语法 Python Monad 作用域

AI数学基础之:确定图灵机和非确定图灵机

程序那些事

人工智能 AI 程序那些事 图灵机

数据分析与数据增长核心逻辑杂谈

小飞象@木木自由

数据分析

Linux rmdir 命令

一个大红包

linux命令 4月日更

WebRTC基础知识详解

IT酷盖

签约计划

Android中的图像格式

如浴春风

android 音视频 安卓 签约计划

华为帐号服务学习笔记(三):10分钟完成Authorization Code模式客户端Demo开发

Coding狙击

android HMS

区块链电子合同技术方案,区块链电子合同存证

13828808769

区块链 区块链+

云小课 | 不了解EIP带宽计费规则?看这里!

华为云开发者社区

带宽 弹性公网IP 带宽变更 计费模式

最详细的基于 Prometheus 的 Azure 指标监控

耳东@Erdong

azure Prometheus 4月日更

「 最佳内容公布」—— InfoQ 写作平台【 1 周年盛典 】

InfoQ写作平台官方

活动专区 1 周年盛典

「免费开源」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之业务数据增删改查(七)

crudapi

Vue API crud crudapi quasar

一文带你剖析LiteOS互斥锁Mutex源代码

华为云开发者社区

mutex LiteOS 互斥锁 互斥锁结构体

Cloudreve 自建云盘实践,我说了没人能限得了我的容量和速度!

小傅哥

Java 小傅哥 Cloudreve 自建云盘

划重点丨详解Java流程控制语句知识点

华为云开发者社区

Java 流程控制语句

线上服务 CPU 100% ?一键定位 so easy!

Java小咖秀

性能 cpu 服务器 负载 紧急问题

创建索引,这些知识应该了解

Simon

MySQL 索引

对前端趋势的一些理解

葱小白

前端

模块二作业

c

架构实战营

Spark原理与实战之部署模式与运行机制

小舰

spark Spark调优 4月日更

MySQL多表查询详解

若尘

MySQL 查询

更简的并发代码,更强的并发控制

万俊峰Kevin

Go 并发 go-zero

浪潮签约“数字基建”合作伙伴共促工业互联网创新发展

浪潮云

工业互联网

SumSwap在市场上的强大突破是否会成为DEX领域最大的黑马?

币圈资讯

派出所重点人员管控系统开发,建设智慧警务

13828808769

智慧组工

从石器时代到田园牧歌:如何对 API 统一建模

李宇飞

API

2D+1D | vivo官网Web 3D应用开发与实战

vivo互联网技术

前端 WebGL 3D数据可视化 Draco 3D

智慧公安情报综合研判平台开发,助推公安信息化发展

13828808769

智慧城市

Facebook开源基于Torch的一组深度学习插件-InfoQ