数据挖掘领域十大经典算法 经验

们在数据挖掘领域都产生了极为深远的影响。 1.C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:

weixinde 2016-01-29   26117   0

2016 年十大 Python 机器学习开源项目 经验

统计学习。 它利用scikit-learn Python工具箱来处理多变量统计信息,包括预测建模,分类,解码或连接分析。 Commits: 5254, Contributors: 46, Github

opsd7938 2016-11-25   26331   0

jASEN 开源项目

jASEN是一个用纯java实现的反垃圾(Anti Spam)引擎,它把类似(bayesian)算法的扫描规则与智能邮件检查和分类相结合。jASEN最适合于那些希望把反垃圾服务集成到现有email应用程序中的开发者。

码头工人 2019-01-17   7489   0

各种编程语言的深度学习库整理 经验

习框架,使用Python开发。 Matlab 1. ConvNet 卷积神经网络是一类深度学习分类算法,它可以从原始数据中自主学习有用的特征,通过调节权重值来实现。 2. DeepLearnToolBox

jopen 2015-09-16   60292   0

K-means聚类算法 资讯

Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素、SVM等都是有类别标签y的,也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y, 只有特征 x,比如假

jopen 2015-07-04   11856   0
算法  
P22

  Tom机器学习 第12章-归纳和分析学习的结合 文档

示这个问题。回忆第5章中errorD(h)定义为D中被h误分类的样例所占比例。可定义h关于领域理论B的错误率errorB(h)为,h与B在分类一个随机抽取实例时不一致的概率。接下来就可尝试用这些错误率

jiavaz 2012-06-26   4004   0
P33

  MLlib 在淘宝的使用和改进 文档

MLlib在淘宝的应用和改进淘宝技术部 数据挖掘与计算——高性能计算 洪奇 明风 2. MLlib在淘宝分类&回归朴素决策树线性模型协同过滤ALS聚类KMeans关联规则FPGrowth降维优化特征提取L-B

pd3n 2014-12-02   2613   0
P252

  数据挖掘:概念与技术 文档

19 1.4.3 分类和预测 19 1.4.4 聚类分析 20 1.4.5 局外者分析 20 1.4.6 演变分析 21 1.5 所有模式都是有趣的吗? 21 1.6 数据挖掘系统的分类 22 1.7 数据挖掘的主要问题

bluesky8318 2011-09-24   4695   0

Objective-C词法分析工具:Parsekit 经验

JSTalk : Spike : Rails Log工具 BayesianKit : Cocoa实现的分类器 Objective-J Port ParseKit的Objective-J的移植 HTTP Client

jopen 2013-09-17   46732   0

推荐算法综述(一) 资讯

,本文作为第一篇,将会简要介绍推荐系统算法的主要种类。其中包括算法的简要描述、典型的输入、不同的细分类型以及其优点和缺点。在第二和第三篇中,我们将会详细介绍这些算法的区别,让你能够深入理解他们的工作原理。

jopen 2015-12-22   24395   0

机器学习 scikit-learn 图谱 经验

论与相关算法。 我们可以看到,机器学习分为四大块,分别是 classification (分类), clustering (聚类), regression (回归), dimensionality

jopen 2016-01-19   23290   0

剖析DeepMind神经网络记忆研究:模拟动物大脑实现连续学习 经验

道《 为机器赋予记忆:DeepMind 重磅研究提出弹性权重巩固算法 》。近日,加利福尼亚大学戴维分校计算机科学工程和统计学的毕业生 Rylan Schaeffer 在其博客上发表了一篇对该研究的深

lll_sss 2017-03-20   25194   0

如何利用深度学习诊断心脏病 经验

)仅包含了来自于16例患者的243张医师分割的MRI图像。 另外还有3697张未标记的图像,这对于无监督监督技术可能会有用,但是我将这些放在了一边,因为这是一个监督学习问题。 图像尺寸为216×256像素。 由于数据集过小,人

RVGMar 2017-09-19   29943   0
P88

  深度学习word2vec笔记之应用篇 文档

想向他们投广告的那帮人。就像互联网广告的一个大牛的一句名言——我知道互联网广告有一是浪费的,问题是我不知道是哪一。 这个困惑就给媒体带来一个义务——要帮助广告主定向他们的目标人群。 对于普通的广告

safemens 2018-05-04   1565   0

Mahout算法集 经验

在Mahout实现的机器学习算法见下表 算法类 算法名 中文名 分类算法 Logistic Regression 逻辑回归 Bayesian SVM 支持向量机 Perceptron

jopen 2013-11-04   99916   0
Mahout   算法  

借助亚马逊S3和RapidMiner将机器学习应用到文本挖掘 资讯

本挖掘典型地运用了机器学习技术,例如聚类,分类,关联规则,和预测建模。这些技术揭示潜在内容中的意义和关系。文本发掘应用于诸如竞争情报,生命科学,客户呼声,媒体和出版,法律和税收,法律实施,情感分析和趋势识别。

w8y5 2015-07-09   21544   0

人工智能的学习能力将更加接近人类,只是还有一些不确定性 资讯

美国《连线》杂志网络版对此问题进行了探讨,为了解决神经网络存在的各种缺陷,相关企业正在利用高斯过程和优化等数学知识改进人工智能技术,利用更少的数据实现与人类更加接近的学习能力。 神经网络在硅谷红

jopen 2017-02-15   14256   0

数据挖掘入门算法整理 经验

蛮适合入门的,因此就读了两章,作此笔记。本文只是介绍了数据挖掘入门的一些算法分类,不涉及具体算法实现。一 下是整理的算法分类图: 1、关联 关联是指一个事件与另一个事件之间的依赖关系。如经典的

jopen 2015-09-13   20672   0

机器学习 实用技巧 经验

pdf (5)网络 英文版:http://as.wiley.com/WileyCDA/WileyTitle/productCd-0470060301.html (6)朴素 英文版:http://paulgraham

jopen 2015-09-13   9166   0

推荐系统入门实践:世纪佳缘会员推荐(完整版) 经验

0.6373419863408559 0.26356889450029836 基于 平均 的排序 0.6359828316337668 0.25369412463315366

openkk 2012-09-01   76398   0
1 2 3 4 5 6 7 8 9 10