0推荐
45K 浏览

流行的机器学习算法概述

机器学习算法很多,并且它们自身又有很多延伸。因此,如何确定解决一个问题的最好算法是很困难的。 下面我们先说基于学习方式对算法的分类和算法之间的相似性,让大家有个整体意识;接着再陈述各类算法。
maysut 8年前   
0推荐
40K 浏览

创业公司使用R语言搭建简单的数据分析系统

整个系统分为三个服务 一、数据源。这个可以是各种形式的数据库。当然,你如果有高大上的Hadoop也是可以的。 二、分析引擎。就是R了,这里我们使用Rserve搭建一个服务。 三、分析...
ihkm4462 8年前   
0推荐
47K 浏览

机器学习实战:模型评估和优化

监督学习的主要任务就是用模型实现精准的预测。我们希望自己的机器学习模型在新数据(未被标注过的)上取得尽可能高的准确率。换句话说,也就是我们希望用训练数据训练得到的模型能适用于待测试的新数据。正是...
0推荐
26K 浏览

浅谈大数据应用研究的3个V

To knowledge 是目标,手段还是 mining ,俗称数据民工。每当大家讲到大数据,都会不约而同的提到大数据几个 V 的定义: Volume , Variety , Velocity ...
0推荐
20K 浏览

史上最大机器学习数据集,雅虎对外开放了

【导读】:数据是机器学习研究的命门。访问真正的大规模数据集,是一项传统上由机器学习研究者和大公司的数据科学家所保有的特权,然而大多数学术研究人员缺无法触及。2016年1月14日,雅虎实验室对外发...
0推荐
29K 浏览

机器学习之总结

出于文本归类和数据处理之需求,这段时间研究了下文本处理类的机器学习方面的东西。也快过年放假了,在此做一个总结和感受吧。
0推荐
15K 浏览

美团是如何通过搜索排序优化提升转化效果的

美团的愿景是连接消费者和商家,而搜索在其中起着非常重要的作用。随着业务的发展,美团的商家和团购数正在飞速增长。这一背景下,搜索排序的重要性显得更加突出:排序的优化能帮助用户更便捷地找到满足其需求...
TreBernardi 8年前   
0推荐
26K 浏览

数据挖掘领域十大经典算法

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法:C4.5, k-Mean...
weixinde 8年前   
0推荐
22K 浏览

Gradient Boosting算法简介

最近项目中涉及基于Gradient Boosting Regression 算法拟合时间序列曲线的内容,利用python机器学习包 scikit-learn 中的GradientBoosting...
luofan 8年前   
0推荐
16K 浏览

已经证实提高机器学习模型准确率的八大方法

提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改善。你会觉得无助和困顿,这是 90% 的数据...
0推荐
45K 浏览

文本数据的机器学习自动分类方法(上)

【编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学...
0推荐
42K 浏览

基于深度机器学习算法DBNs的风险识别模型

前言:最初关注深度机器学习是听了NUS的汪晟博士关于深度机器学习平台SIGNA的介绍,当时就发现深度机器学习是人工智能的一个革新的进步。但是由于从事的云计算和大数据方向的工作,所以平时只是作为自...
jopen 8年前   
0推荐
46K 浏览

基于深度机器学习算法DBNs的风险识别模型

前言:最初关注深度机器学习是听了NUS的汪晟博士关于深度机器学习平台SIGNA的介绍,当时就发现深度机器学习是人工智能的一个革新的进步。但是由于从事的云计算和大数据方向的工作,所以平时只是作为自...
jopen 8年前   
0推荐
44K 浏览

数据挖掘学习笔记一:引论

例1.1 数据挖掘把大型数据集转换成知识。Google的Flu Trends(流感趋势)使用特殊的搜索项作为流感活动的指示器。它发现了搜索流感相关信息的人数与实际具有流感症状的人数之间的紧密联系...
jopen 8年前   
0推荐
53K 浏览

机器学习算法一览

提起笔来写这篇博客,突然有点愧疚和尴尬。愧疚的是,工作杂事多,加之懒癌严重,导致这个系列一直没有更新,向关注该系列的同学们道个歉。尴尬的是,按理说,机器学习介绍与算法一览应该放在最前面写,详细的...
jopen 8年前   
0推荐
18K 浏览

8个经过证实的方法:提高机器学习模型的准确率

提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改善。你会觉得无助和困顿,这是90%的数据科学...
jopen 8年前   
0推荐
60K 浏览

Orange-数据挖掘和机器学习软件

Orange(http://orange.biolab.si/)是一个基于组件的数据挖掘和机器学习软件套装,支持Python进行脚本开发。Orange由斯洛文尼亚大学计算与信息学系的生物信息实验...
jopen 8年前   
0推荐
12K 浏览

统计机器学习——让计算机学会吟诗作赋

新年到,作为格律诗研究的第一步探索,微软亚洲研究院推出了全新的绝句生成系统,为热爱诗词的人们带来了乐趣。自然语言计算组的研究员们基于统计机器翻译的方法,利用计算机对格律诗进行辅助创作。首先,创作...
0推荐
23K 浏览

浅谈机器学习中的规则化范数

监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们...
jopen 8年前   
0推荐
24K 浏览

构建机器学习系统的20个经验教训

数据科学家对优化算法和模型以进一步发掘数据价值的追求永无止境。在这个过程中他们不仅需要总结前人的经验教训,还需要有自己的理解与见地,虽然后者取决于人的灵动性,但是前者却是可以用语言来传授的。最近...
jopen 8年前   
1 2 3 4 5 6 7 8 9

经验分享,提升职场影响力

投稿

热门问答

    热门文档