0推荐
55K 浏览

利用 Python、SciKit 和文本分类来实现行为分析

了解如何根据已购买产品中描述的文本属性来构建客户行为描述模型。SciKit 是一个强大的基于 Python 的机器学习包,可用于模型构造和评估,您可以利用它学习如何构建一个模型,并将它应用于模拟...
jopen 10年前   
0推荐
372K 浏览

[干货]神经网络语言模型详解

语言模型是自然语言处理领域的基础问题,其在词性标注、句法分析、机器翻译、信息检索等任务中起到了重要作用。简而言之,统计语言模型表示为:在词序列中,给定一个词和上下文中所有词,这个序列出现的概率,...
cg2y 10年前   
0推荐
37K 浏览

采用深度学习算法为Spotify做基于内容的音乐推荐

本文概述了作者在Spotify的机器学习实践经验,解释了使用卷积神经网络(CNN)做基于音频的音乐推荐的方法,并提出了有关该卷积网络的实际学习效果的心得。采用了GTX 780Ti GPU,The...
wgd7 10年前   
0推荐
68K 浏览

卷积神经网络

自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convne...
wgd7 10年前   
0推荐
34K 浏览

大规模机器学习流程的构建与部署

现在有许多的机器学习算法实现是可以扩展到大数据集上的(其中包括矩阵分解、SVM、逻辑回归、LASSO 等等)。实际上,机器学习专家们很乐于指出的一点是:如果你能把机器学习问题转化为一个简单的数值...
jopen 10年前   
0推荐
13K 浏览

Julia下的混合集成学习包:Orchestra

Orchestra是Julia编程语言的一个异构集成学习包。它由一个统一的机器学习API驱动,是Julia下对Scikit-Learn和Carret的统一。
jopen 10年前   
0推荐
19K 浏览

Python下的结构化预测支持库:PyStruct

PyStruct旨在作为一个容易使用的结构化学习和预测库。
jopen 10年前   
0推荐
22K 浏览

如何在Hadoop 2.0上实现深度学习?

位于波士顿的数据科学团队正在利用前沿的工具和算法,通过对用户数据的分析来优化业务行为。 数据科学很大程度上依赖机器算法,它能帮助我们发现数据的特征。要想洞察互联网般规模的数据还是很有挑战的,因此...
jopen 10年前   
0推荐
103K 浏览

深度学习框架:Caffe

Caffe 是一个深度学习框架,由表达式,速度和模块化组成。Caffe 是 Berkeley Vision and Learning Center (BVLC) 社区贡献者开发的。
jopen 10年前   
0推荐
40K 浏览

Caffe 的 GUI 工具:Huabot Brain

Huabot Brain 可以说是 Caffe 的 GUI 工具。 Huabot Brain 提供 RESTful api 和一个基于 React 的 web 页面,使得开发者或者研究人员可以方...
jopen 10年前   
0推荐
12K 浏览

机器学习实践中应避免的7种常见错误

在工程开发中,人们有多种方法搭建一套键-值存储系统,每种设计针对使用模式有一套不同的假设。在统计建模中,也有很多算法来构造一个分类器,每种算法对数据也有各自的假设集合。
jopen 10年前   
0推荐
50K 浏览

机器学习中导数最优化方法(基础篇)

熟悉机器学习的童鞋都知道,优化方法是其中一个非常重要的话题,最常见的情形就是利用目标函数的导数通过多次迭代来求解无约束最优化问题。实现简 单,coding 方便,是训练模型的必备利器之一。这篇博...
jopen 10年前   
0推荐
31K 浏览

什么是机器学习?

大家好!我是John Platt,我在微软创建和使用机器学习(简称ML)算法已经17年了。最近这几年机器学习开始受到广泛关注,所以人们经常问我:“什么是机器学习?你们用机器学习来做什么?”
jopen 10年前   
0推荐
19K 浏览

漫谈:机器学习中距离和相似性度量方法

在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和 聚类算法,如 K 最近邻(KNN)和 K 均值(K-Me...
jopen 10年前   
0推荐
353K 浏览

一文读懂卷积神经网络

自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convne...
jopen 10年前   
0推荐
130K 浏览

速度快效果好的boosting模型:xgboost

本文作者:何通,加拿大Simon Fraser University计算机学院研究生,研究兴趣为数据挖掘和生物信息学。
jopen 10年前   
0推荐
76K 浏览

机器学习资源大全

本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。
jopen 10年前   
0推荐
14K 浏览

【机器学习基础】验证

我们在之前得知,通过最小化Ein来选择最好的模型不是一个正确的办法,因为这样可能会付出模型复杂度的代价、造成泛化效果差、造成过拟合的发生。
jopen 10年前   
0推荐
77K 浏览

Peacock:大规模主题模型及其在腾讯业务中的应用

让机器能自动学习和理解人类语言中近百万种语义,以及从海量用户行为数据中归纳用户兴趣,是一个已经持续了20年的研究方向,称为主题建模 (Latent Topic Modeling)。目前业界的各种...
jopen 10年前   
0推荐
15K 浏览

机器学习刀光剑影 之 屠龙刀

机器学习是一个大武林,这里面江湖人士颇多,“发明”出来的算法兵器也是五花八门,浩瀚如海,足够你数上三天两夜了。然而,这些兵器行走江湖能用的不多,真正无敌的更是屈指可数,或许只有屠龙刀倚天剑了...
jopen 10年前   
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档