看看数据科学家们都在用什么:Github上的十大深度学习项目

jopen 8年前

本文作者Matthew May是一位正在进行并行式机器学习算法研究的计算机硕士研究生,同时Matthew也是一位数据挖掘研习者,数据发烧友,热忱的机器学习科学家。开源工具在数据科学工作流中起到了愈发重要的作用。Github十大深度学习项目,其中包含了大量的代码库,框架以及学习资料。看看Github上的人们都在使用哪些工具,都在从哪些资源那里进行学习。

最新KDnuggets软件调查结果表明,在过去12个月,73%的数据科学家都会使用免费的数据科学工具。不言而喻,Python和R语言(两者皆为开源)以及各自的生态系统,是这些免费的数据科学工具中,数据科学家们运用的最突出、最必不可少的。

看看数据科学家们都在用什么:Github上的十大深度学习项目

Github已成为名副其实的开源软件交流中心,其上寄存了几乎所有想得到的项目类型。深度学习在学术、研究和兴趣方面的普及程度越来越高,并在数据科学方面越来越重要,我们将探索一下Github里出类拔萃的深度学习项目。

需要注意的是,大部分人认为属于深度学习的一些重要项目并没有出现在该名单上,原因在于在Github搜索「深度学习」时并没有涉及到这些项目。

1. Caffe

看看数据科学家们都在用什么:Github上的十大深度学习项目

Caffe是利用Python和MATLAB两者结合创建的深度学习程序库。由伯克利大学的伯克利视觉与学习中心创办,如果人们仅把Caffe当做计算机视觉应用是情有可原的;事实上,这是一个通用的深度学习程序库,能够开发卷积网络,并创建其他视觉、语音等应用。

2. Data Science IPython Notebooks

看看数据科学家们都在用什么:Github上的十大深度学习项目

这是由Donne Martin策划收集的IPython笔记本。话题涵盖大数据、Hadoop、scikit-learn和科学Python堆栈以及很多其他方面的内容。至于深度学习,像是TensorFlow、Theano和Caffe之类的框架也均被涵盖其中,当然还有相关的特定构架和概念等。

3. ConvNetJS

由斯坦福博士生Andrej Karpathy写就,他也一直维持着博客更新。ConvNetJS是一个由Javascript实现的神经网络及其通用模块,并且包括大量的基于浏览器的实例。这些文档和实例数不胜数,且非常完整。不要让javascript和神经网络结合在一起的想法把你吓跑了,这可是个非常受欢迎而且非常有用的项目。

4. Keras

Keras也是一种Python深度学习程序库,但它利用了TensorFlow和Theano,这也意味着它可以在目前已知最受欢迎的2个深度学习研发库中的任一个上运行。也是那些越来越多的被形容为非常高级的库之一,而所有这些高等级库都非常相似:抽象化底层的深度学习引擎,使使用者可以更快、更便捷以及更灵活地部署神经网络。Keras支持主流深度学习架构,自带30秒的快速入门指南,并有着完善的文档。

5. MXNet

作为一个深度学习框架,MXNet旨在灵活和高效,并且通过允许混合使用指令式编程及符号式编程的技巧来提高代码生产力。这个项目可以和多种语言绑定,如Python, R, 以及 Julia。同时MXNet还附带了一系列神经网络指南和蓝本。另外值得注意的是,一个相关项目用JavaScript在浏览器环境中实现MXNet,有兴趣的朋友可以通过 该链接 对一个图形分类模型进行测试。

6. Qix

这是一个各种计算和编程主题有关资源(包括Node.Js, GoLang和深度学习)的Github版本库。之所以说「似乎(appears)」,是因为Github版本库都是用中文写的,谷歌提供的翻译甚至会带来更多不解。不过,有许多链接,所以如果你能说中文或看得懂中文,或许这里有些有价值的东西。

7. Deeplearning4j

看看数据科学家们都在用什么:Github上的十大深度学习项目

Deeplearning4j是为Java 和Scala打造的一款具有工业强度的深度学习框架。作为唯一值得研究的JVM深度学习解决方案之一,它在这个领域有着明显的优势。不仅可以很好地与Hadoop 以及Spark的结合,它还可以使用GPU。他的文档和指南也非常可靠。

8. Machine Learning Tutorials

这是一张机器学习和深度学习教程,文章和资源的名单。这张列表根据通过主题进行组织,包括了许多与深度学习有关的类别,包括计算机视觉,加强学习以及各种架构。由于内容广泛,几个月来,已经在社交媒体上小有名气,你也可以 点击此处 做些贡献。

9. DeepLearnToolbox

看看数据科学家们都在用什么:Github上的十大深度学习项目

DeepLeanToolBox是一个供MATLAB和Octave使用的深度学习工具箱。很遗憾,这个项目现在已被废弃并停止维护。其Github版本库也指向了在修习深度学习方面颇具价值的其他选择:Theano和TensorFlow。

如果说这个已经废弃的云端版本库还有点什么价值,那就是 这个链接 了, 这本由Yoshua Bengio撰写的教程被包含在了这个版本库中以作为学习人工智能所使用的深度学习架构的学习资源。

10. LISA Lab Deep Learning Tutorials

这个Github版本库汇总了加拿大蒙特利尔大学的LISA实验室深度学习课程的练习材料。其介绍文档摘取如下:

这套练习材料将介绍你们了解一些最重要的深度学习算法,以及展示如何使用Theano运行这些算法。

Theano是一个使撰写深度学习模型变得简单,并允许用户选择GPU对他们进行训练的python库。

点击 这里 在线查看课程材料原文链接

本文选自 kdnuggets ,作者: Matthew Mayo ,机器之心编译出品,编译:柒柒、微胖、之乎。

</div>

来自: http://www.almosthuman.cn/2016/01/19/zvpjt/