Scala 机器学习库 经验

创建关系因素图,评估参数并进行推断。 数据分析/数据可视化 MLlib in Apache SparkSpark下的分布式机器学习库 Scalding —CAscading的Scala接口

jopen 2014-08-29   50641   0

Dpark源码剖析 经验

Spark是一个当下很火的集群计算平台,来自于加州大学伯克利分校的AMPLab,目前从Apache孵化器毕业,成为了Apache基金会下的顶级项目。现在的spark类似于hadoop,逐渐成长为一种生

P58

  大数据的十个技术前沿 文档

软件与硬件架构协同优化32针对硬件特点对软件栈优化 把硬件暴露给软件栈:NativeTask,Spark,线性代数库 重新设计软件栈:全闪存存储,NVRAM 一体机 云化:虚拟化和资源管理,HVE,YARN,Docker

cpp45 2015-01-18   4260   0

TalkingData大规模机器学习的应用 资讯

提高集群计算效率和程序开发效率,我们选择了Spark。我们认为Spark最大的两个优点。一是数据处理效率高(相对于Hadoop MapReduce而言)。二是开发效率高,Scala语言的特性和Spark的DAG机制使得复杂

jopen 2015-06-19   39103   1
P24

  大数据分析系统架构之探讨 文档

9 Cloudera Hue: 9 二、Spark生态圈: 10 Spark: 10 Spark SQL: 11 Spark Streaming: 12 MLLib: 13 GraphX : 14 SparkR

guet_lee 2017-01-12   2237   0
P24

  大数据分析系统架构 文档

9 Cloudera Hue: 9 二、Spark生态圈: 10 Spark: 10 Spark SQL: 11 Spark Streaming: 12 MLLib: 13 GraphX : 14 SparkR

wzf1118 2016-11-04   2940   0

FiloDB:用于大数据分析的分布式数据库 资讯

iloDB-API-NoSQL 近期,TupleJump杰出工程师、Spark和Cassandra的用户和贡献者、Spark Job Server的联合创建人和维护者Evan Chan 详细介绍

jopen 2015-11-05   24157   0
FiloDB  

机器学习的11个开源项目 经验

务的接口。 MLlib MLlib是Apache自己的Spark和Hadoop机器学习库,它被设计用于大规模高速度地执行MLlib所包含的大部分常见机器学习算法。 MLlib是基于Java开发

jopen 2016-01-05   30614   0

12个最好的机器学习工具 资讯

visualization. 12. MLlib MLlib is a tool that is usable in Java, Scala and Python. It fits into Spark’s APIs and

jopen 2015-09-08   20028   0

Hadoop和Hadoop的生态系统资源列表:Awesome Hadoop 经验

Samza Distributed Computing and Programming Apache Spark Apache Crunch Cascading - Cascading is the proven

jopen 2014-10-15   40861   0

助你玩转机器学习技术的十三套框架 资讯

致力于通过简单而新颖的方式应对与机器学习相关的种种挑战。 Apache Spark MLlib Apache Spark可能算得上当前Hadoop家族当中最为耀眼的成员,但这套内存内数据处理框

jopen 2016-02-15   26442   0

360 开源 XDML,超大规模数据与超高维特征机器学习计算平台 资讯

级数据 10min 级分析,并且遵循 spark 标准接口。在包含数千个特征的稠密 benchmark 上进行特征分析与变换测试,性能较 Spark MLlib 提升 1000 多倍;XDML 也能很好地适应稀疏数据特征分析。

jopen 2018-12-29   9716   0

腾讯正式开源高性能分布式计算平台Angel1.0,追赶同行脚步 资讯

和 Scala 开发,能在社区的 Yarn 上直接调度运行,并基于 PS Service,支持 Spark on Angel,未来将会支持图计算和深度学习框架集成。 根据腾讯大数据部的说法,Angel

jopen 2017-06-19   19782   0
腾讯  

机器学习开源项目、类库、软件集合 经验

and clustering. MLlib in Apache Spark - Distributed machine learning library in Spark Mahout - Distributed

jopen 2014-10-10   102246   0

机器学习框架、库和软件集合:awesome-machine-learning 经验

and clustering. MLlib in Apache Spark - Distributed machine learning library in Spark Mahout - Distributed

jopen 2014-10-16   134300   0

盘点大数据生态圈,那些繁花似锦的开源项目 资讯

融、游戏等行 业的大数据应用,并覆盖了当下热门的大数据开源技术实践与技术细节,如Hadoop、Spark、Docker等,详情参阅《程序员》电子刊9月B。而在 本文中,笔者将带大家一览这些精彩实践赖以成型的根本——繁华的开源大数据生态圈。

jopen 2015-09-11   33463   0

Meson:支持Netflix的机器学习工作流 经验

术。 机器学习管道的强大面孔 Netflix当前几种生成机器学习管道的关键角色是Spark, MLlib, Python, R和Docker。 下面来了解下一个典型的视频推荐的机器学习管道

机器学习资源大全 经验

LingPipe —使用计算机语言学处理文本的工具包。 通用机器学习 MLlib in Apache SparkSpark中的分布式机器学习程序库 Mahout —分布式的机器学习库 Stanford

jopen 2015-03-05   76027   0

推荐!国外程序员整理的机器学习资源大全 资讯

LingPipe —使用计算机语言学处理文本的工具包。 通用机器学习 MLlib in Apache SparkSpark 中的分布式机器学习程序库 Mahout —分布式的机器学习库 Stanford

jopen 2014-07-22   78240   4

基于大数据的机器学习:Apache SystemML 在 IBM BigInsights 的实践 经验

Apache 顶级项目。目前 SystemML 作为 Apache 顶级项目的最新版本是 0.14,支持 Spark 2.x。Apache SystemML 在 2016 年被 datamation.com 列为

dlb124 2017-06-14   46102   0
1 2 3 4 5 6 7 8 9 10