为豆瓣电影实现Item-based协同过滤的推荐系统 经验

前面的两篇文章分别使用Spark mllib ALS实现了Model-based协同过滤推荐系统和使用Mahout实现了User-based的协同过滤推荐系统。 我们再来回顾一下item-base

jopen 2015-12-04   47033   0

推荐系统基础知识储备 经验

《Databricks孟祥瑞:ALS 在 Spark MLlib 中的实现》http://www.csdn.net/article/2015-05-07/2824641 《基于Spark MLlib平台的协同过滤算法-

jopen 2015-11-19   23102   0

CoCoA:大规模机器学习的分布式优化通用框架 经验

ache Spark MLlib v1.5.0 中进行了实现和优化。 GD:完全梯度下降。对于 lasso,我们使用了近似版本 PROX-GD。我们在 Apache Spark MLlib v1.5.0 中进行了实现和优化。

cn710467 2017-08-27   34945   0

每天近百亿条用户数据,携程大数据高并发应用架构涅槃 经验

Mahout, SparkQL/MLLib。Hive 上面已经介绍过,Mahout 简单理解提供基于Hadoop平台进行数据挖掘的一些机器学习的算法包。Spark类似hadoop也是提供大数据并行批

每天TB级数据处理,携程大数据高并发应用架构涅槃 经验

Mahout, SparkQL/MLLib。Hive 上面已经介绍过,Mahout 简单理解提供基于Hadoop平台进行数据挖掘的一些机器学习的算法包。Spark类似hadoop也是提供大数据并行批

R、Python、Scala 和 Java,到底该使用哪一种大数据编程语言? 经验

lot2。而如果你想利用比你机器提供的功能还强大的功能,那可以使用SparkR绑定,在R上运行Spark。 然而,如果你不是数据科学家,之前也没有用过Matlab、SAS或OCTAVE,可能需要一

bencker 2016-04-24   43890   0
P30

  程浩-SparkSQL漫谈 文档

1. Spark SQL 漫谈Cheng Hao Dec 13, 2014Copyright © 2014 Intel Corporation. 2. AgendaSpark SQL Overview

cdop 2014-12-29   2924   0

机器学习与深度学习资料 经验

介绍:LinkedIn 开源的机器学习工具包,支持单机, Hadoop cluster,和 Spark cluster 重点是 logistic regression 算法 《机器学习周刊》 介

jopen 2015-04-23   325900   0

Java 机器学习 工具 & 库 经验

通过提供支持创建、培训并保存神经网络的Java神经网络简化了神经网络的发展。 14. Oryx 2 是一个建立在Apache Spark 和 Apache Kafka之上,但专业化的实时大规模机器学习的 lambda 架构。它是一个

jopen 2015-09-11   47685   0

25个Java机器学习工具&库 经验

网络库和GUI工具,简化了神经网络开发。 14. Oryx 2 是一个建立在Apache Spark和Apache Kafka的Lambda架构实现,但随着实时大规模机器学习而逐渐开始专业化。这是

jopen 2016-01-12   35773   0

25 个 Java 机器学习工具和库 资讯

网络库和GUI工具,简化了神经网络开发。 14. Oryx 2 是一个建立在Apache Spark和Apache Kafka的Lambda架构实现,但随着实时大规模机器学习而逐渐开始专业化。这是

jopen 2015-12-27   31826   0

25个Java机器学习工具&库 资讯

网络库和GUI工具,简化了神经网络开发。 14. Oryx 2 是一个建立在Apache Spark和Apache Kafka的Lambda架构实现,但随着实时大规模机器学习而逐渐开始专业化。这是

jopen 2015-12-25   38680   0

[译] 如何选择合适的分布式机器学习平台 经验

基本数据流 参数服务器模型 高级数据流 我们简单介绍每种方法,使用 Apache Spark 作为基本数据流方法的示例,PMLS(Petrar)作为参数服务器模型的示例,TensorFlow

MarWingfiel 2017-08-02   43924   0

机器学习框架,类库和软件汇总 经验

engine that supports distributed learning on Hadoop, Spark or your laptop via APIs in R, Python, Scala, REST/JSON

jopen 2015-11-23   70827   0

分布式机器学习平台比较 经验

基本数据流 参数服务器模型 高级数据流 我们将对每一种方法进行简单的介绍,我们使用Apache Spark作为基本数据流方法的示例,使用PMLS(Petuum)作为参数服务器模型的示例,使用Tensor

zhongkouwei 2017-08-28   40348   0

机器学习平台、框架、库和软件集合 经验

(extension to Weka). MLlib in Apache Spark 1 - Distributed machine learning library in Spark Neuroph - Neuroph

jopen 2015-01-08   127601   0

实时股票分析系统的架构与算法 资讯

Apache Geode (一个针对高可扩展应用程序的开源分布式内存数据库,目前正在孵化中)、 Spark MLlib 、 Apache HAWQ (一个Hadoop原生的大规模并行SQL分析引擎)以及 Apache

jopen 2015-12-09   20197   0
算法  

听 StitchFix 数据科学家和 Google 工程师聊聊机器学习的机会 资讯

machine learning infrastructure 可供开发者或小公司使用? 主要有 Spark & Scala & Java;Python 有比较好的 ML 的 module;R 的 package

jopen 2015-09-27   32649   0

梁堰波:主流SQL on Hadoop框架选择 资讯

在昨日(7月23日)的CSDN Spark微信群中,明略数据梁堰波就主流的SQL on Hadoop框架进行了深入分析,在给出了选择建议后并与用户进行了40分钟的互动与交流。 在 “YARN还是Mesos讨论之后(圆桌讨论:

mf7x 2015-07-24   26619   0
Hadoop  

0x0F 大数据职位,数据场技能(下) 经验

数据分析到机器学习和深度学习的几乎所有任务。 2.4 Hadoop与Spark生态 大数据平台,无疑是以Hadoop和Spark为代表,无论在线处理还是离线分析。Hadoop比较适合离线处理。而在

ersm3365 2016-01-29   41293   0
1 2 3 4 5 6 7 8 9 10