Java 机器学习 工具 & 库

jopen 9年前

下面是25个Java机器学习的工具&&库列表:

1. Weka 是一个数据挖掘任务机器学习算法的集合。这些算法可以直接应用于数据集或者在你自己的Java代码中调用。Weka 包含 数据预处理、分类、回归、聚类、关联规则、可视化 等工具。

2. Massive Online Analysis (MOA) 是一个非常流行的数据挖掘方面的开源框架,它有一个非常活跃的社区。它包括一组机器学习算法(分类、回归、聚类、异常检测、概念漂移检测和推荐系统)和评估工具。同 WEKA 项目一样,MOA 也是用Java编写的,但却扩展的更高。

3. MEKA 项目提供了多标记学习和评价方法的一个开源实现。在多标记分类中,我们要为每个输入实例预测多个输出变量。这不同于仅涉及单个目标变量的“标准”的情况。 MEKA是基于WEKA机器学习工具包。

4. Advanced Data mining And Machine learning System (ADAMS) 是一种新型的,灵活的工作引擎,旨在快速构建和维护现实世界,复杂的知识流程,基于GPLv3发布。

5. Environment for Developing KDD-Applications Supported by Index-Structure (ELKI) 是用Java编写的开源的(AGPLv3) 数据挖掘软件。ELKI 的重点是研究unsupervised methods in cluster analysis and outlier detection算法。

6. Mallet 是一个Java文本文档的机器学习工具包。Mallet 支持最大熵、naive bayes以及决策树分类算法。

7. Encog 是一种先进的机器学习框架,支持 Support Vector Machines,人工神经网络,遗传编程,贝叶斯网络,Hidden Markov Models,遗传编程和遗传算法。

8. Datumbox 是一个用Java编写的开源机器学习框架,允许快速开发机器学习和统计应用。该框架的主要重点是,包括大量的机器学习算法和统计测试,并能够处理中等规模的数据集。

9. Deeplearning4j 是第一个使用Java和Scala编写的商业级的、开源的、分布式深度学习库。它的目的是在商业环境中使用,而不是作为一种研究工具。

10. Mahout 是一个带有内置算法的机器学习框架,Mahout-Samsara 帮助人们创建自己的数学,同时提供一些现成的算法实现。

11. Rapid Miner 是由德国的多特蒙德大学开发的。它为用户创建自己的应用提供了图形用户界面和Java API。它提供了数据处理,可视化和机器学习算法建模。

12. Apache SAMOA 是一个机器学习框架。包含了一个分布式流媒体编程抽象ML算法,使开发新的ML算法不用直接处理复杂的底层分布式流处理引擎(DSPEe, 如 Apache Storm, Apache S4, 和 Apache Samza)。它的用户可以一次开发分布式流媒体ML算法,并执行多个DSPEs。

13. Neuroph 通过提供支持创建、培训并保存神经网络的Java神经网络简化了神经网络的发展。

14. Oryx 2 是一个建立在Apache Spark 和 Apache Kafka之上,但专业化的实时大规模机器学习的 lambda 架构。它是一个创建应用的框架,但同时提供了包,以及协同过滤、分类、回归和聚类的终端到终端的应用程序。

15. Stanford Classifier 是一个机器学习工具,得到数据并把它们分成 K 类。这个软件是一个Java实现的最大熵分类器。

16. Cortical.io 是一个快速、精确、像大脑一样的Retina API 。

17. JSAT 是一个机器学习快速入门的库。它是我业余时间开发的,可以在GPL 3下使用。库的一部分是自我教育,因此,所有的代码是自包含的。JSAT是纯Java的,没有外部的依赖。

18. N-Dimensional Arrays for Java (ND4J) 是一个 JVM 的科学计算库。它们是用来在生产环境中使用的,这意味着程序的设计是以最小的内存需求来运行的。

19. Java Machine Learning Library 是一组机器学习算法的参考实现。这些算法都是有记录的,包括源代码,都记录在文档网站。它主要是用Java编写的。

20. Java-ML 是一个Java API,是一个Java实现的机器学习算法的集合。它只提供了一个标准的算法接口。

21. MLlib (Spark) 是一个 Apache Spark 扩展的机器学习库。虽然是Java,但该库提供Java, Scala 以及 Python 绑定。库是新的,并且算法的列表很长。

22. H2O 是一个智能应用的机器学习 API。它扩展了统计、机器学习以及大数据的运算。H2O 是可扩展的。

23. WalnutiQ 是一个理论上与部分人脑有共同学习算法的面向对象的模型(工作目标是一个简单的带有情感的人工智能模型)。

24. RankLib 是一个排序学习算法库。目前已经实现了八种流行的算法。

25. htm.java (Hierarchical Temporal Memory implementation in Java) 是智能学习平台 Numenta 的一个Java端口。

via: demnag ,本文由Specs 翻译整理,发布在Coder资源网,转载请注明来源。

</div>