Scala 机器学习库

jopen 10年前

自然语言处理

ScalaNLP—机器学习和数值计算库的套装


Breeze —Scala用的数值处理库


Chalk—自然语言处理库。


FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断。


数据分析/数据可视化

MLlib in Apache Spark—Spark下的分布式机器学习库


Scalding —CAscading的Scala接口


Summing Bird—用Scalding 和 Storm进行Streaming MapReduce


Algebird —Scala的抽象代数工具


xerial —Scala的数据管理工具


simmer —化简你的数据,进行代数聚合的unix过滤器


PredictionIO —供软件开发者和数据工程师用的机器学习服务器。


BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库。


通用机器学习

Conjecture—Scalding下可扩展的机器学习框架


brushfire—scalding下的决策树工具。


ganitha —基于scalding的机器学习程序库


adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可。


bioscala —Scala语言可用的生物信息学程序库


BIDMach—机器学习CPU和GPU加速库。


Figaro - 一个构造概率性模型的Scala库


       英文原文链接:Scala机器学习