P14

  Graphx在淘宝的实践 by 吴炜_数据挖掘机器学习 文档

部——数据挖掘与计算 吴炜(梧苇) 2. 目录Graphx简介和特性 图计算场景 整体模型,流程和算法 调优与改进 性能和技巧 总结 3. Graphx的发展0.62013-08-23Bagel0.8

w7d33 2014-10-06   5534   0

机器学习的平台化发展趋势 经验

背景 机器学习在经过近些年的野蛮生长之后,其有效性已经被无数成功应用所验证,在这一点上已经不需要更多证明。在使用方法和常用模型方面也已经没有什么太新奇的东西了。例如在模型方面,经过实践检验过的模型

LouieFord 2016-12-22   9999   0

用Spark进行大数据处理之机器学习 经验

在本篇文章,作者将讨论机器学习概念以及如何使用Spark MLlib来进行预测分析。后面将会使用一个例子展示Spark MLlib在机器学习领域的强悍。 1.引言 Spark机器学习API包含两个package:spark

co880591 2016-06-01   148422   0

机器学习工具包 Apache OpenNLP 1.5.1 发布 资讯

and the chunker was refactored。 OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。

fmms 2011-08-23   10185   0
Java  

Andrew Ng:人工智能和机器学习驱动的“先进教育学” 资讯

Ng(吴恩达)则宣布加入百度的深度学习研究院。最近几天,他正在密集地为百度面试人才,奔走于 Coursera 的新办公楼和百度的新办公楼之间。他说,能和他多年的好朋友、著名机器学习专家余凯一起工作,他感到相当兴奋。

jopen 2014-05-22   17866   0

DMLC:最大开源分布式机器学习项目 资讯

com/cn/news/2015/06/DMLC-github 为了实现分布式机器学习领域中代码的共享与共同开发, 分布式机器学习社区(DMLC)近日正式发布 。作为一个开源项目,DMLC的相关代码直接托管在

rbyt 2015-06-04   17825   0
DMLC  

百度组建深度机器学习开源平台 研发“虫洞”项目 资讯

5月21日消息,由百度牵头的分布式深度机器学习开源平台日前正式面向公众开放,该平台隶属于名为“深盟”的开源组织,该组织核心开发者来自百度深度学习研究院(IDL),微软亚洲研究院、华盛顿大学、纽约大学、

jopen 2015-05-21   24736   0
百度  

为什么说普通工程师也要懂得机器学习 资讯

的,与这次旅行相关的微博才算。 到现在为止,似乎只有旅行推做到了这一点。 我设计了一套核心算法,过滤掉脏数据,仅保留有效数据,后来又加入了另外9道过滤规则,以及不断调试关键字库,最后达到了惊人的……97%有效率。

jopen 2015-10-12   10984   0

谷歌第二代机器学习系统,TensorfFlow 0.6.0 发布 资讯

TensorFlow 是谷歌的第二代机器学习系统,按照谷歌所说,在某些基准测试中,TensorFlow的表现比第一代的DistBelief快了2倍。 TensorFlow 内建深度学习的扩展支持,任何能够用计

jopen 2015-12-09   8658   0

互联网金融时代下机器学习与大数据风控系统 资讯

Ebay 和携程从事数据分析与机器学习方面的工作,关注统计与机器学习方面的研究、大数据风控系统的建设。本文探讨的是:互联网金融时代,如何借助互联网思维利用 机器学习方法建立高效安全的大数据风控系统?

jopen 2015-10-04   41736   0

8个最好的机器学习速查表(Cheat Sheets) 资讯

8个最好的机器学习速查表(Cheat Sheets)

jopen 2015-06-30   46111   0

Apache SystemM v0.10.0-incubating 发布,一个机器学习语言 资讯

SystemML是灵活的,可伸缩机器学习 (ML) 语言,使用Java编写。可实现三大功能:(1) 可定制算法;(2) 多个执行模式,包括单个,Hadoop 批量和 Spark 批量;(3) 自动优化。

jopen 2016-06-18   9116   0

谷歌AutoML人工智能系统已可创建优于人类的机器学习代码 资讯

谷歌 AutoML 系统最近出产了一系列机器学习代码,其效率甚至比研究人员自身还要高。显然,这是对“人类优越论”的又一次打击,因为机器人“学生”们已经成为了“自我复制”的大师。AutoML 是在人工智

jopen 2017-10-17   8454   0

简单的实时大规模机器学习基础架构:Oryx 经验

Oryx的目标是帮助Hadoop用户搭建并部署能够实时查询的机器学习模型,例如垃圾邮件过滤和推荐引擎。随着数据的不断流入,Oryx还将支持自我更新。 无论从建模还是部署,Oryx都可以随需扩展

jopen 2014-03-01   24541   0

十张图解释机器学习的基本概念 经验

在解释 机器学习 的基本概念的时候,我发现自己总是回到有限的几幅图中。以下是我认为最有启发性的条目列表。 1. Test and training error: 为什么低训练误差并不总是一件好的事情呢:

jopen 2014-03-24   22201   0

【基础】常用的机器学习&数据挖掘知识点 经验

Sampling(重要性采样),MCMC(MarkovChain Monte Carlo 马尔科夫蒙特卡罗采样算法:Metropolis-Hasting& Gibbs)。 Clustering(聚类):

jopen 2015-01-08   29762   0

机器学习中距离和相似性度量方法 经验

机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚 类算法,如 K 最近邻(KNN)和 K 均值(K-Means

jopen 2015-01-08   32966   0

Kaggle 机器学习竞赛冠军及优胜者的源代码汇总 经验

Kaggle比赛源代码和讨论的收集整理。

jopen 2015-01-09   228161   0

机器学习中的逻辑回归模型简介 经验

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。本文作为美团机器学习InAction系列中的一篇,主要关注逻辑回归算法的数学模型和参数求解方法,最后

pm45e 2015-08-03   31680   0

机器学习各类工具weka、scikit-learn等各项指标的对比 经验

以下表格摘自:http://www.shogun-toolbox.org/ 另推荐机器学习软件汇总网站 http://mloss.org/software/ feature shogun weka

jopen 2015-11-21   42015   0
1 2 3 4 5 6 7 8 9 10