Mahout环境安装说明 经验

 列举出mahout支持的所有算法 4.其它 4.1 Mahout算法 (0.7) 算法分类 算法名 中文名 简要描述 用例 分类算法 Logistic Regression ( SGD ) 逻辑回归

jopen 2015-11-05   16169   0

机器学习经典书籍 经验

PDF 5 项亮,不错的入门读物 深入 《Pattern Classification》(《模式分类》第二版) PDF 4 作者Richard O. Duda[5]、Peter E. Hart、

jopen 2015-01-08   73644   0
P37

  数据挖掘常见算法 文档

生物信息和基因的数据挖掘。 Web数据挖掘的各个方面。 14. 数据挖掘十大经典算法C4.5 一种分类决策树算法 The K-means algorithm即k-means算法 SVM(Support

maoying 2017-04-26   3027   0

Java 机器学习 工具 & 库 经验

是一个数据挖掘任务机器学习算法的集合。这些算法可以直接应用于数据集或者在你自己的Java代码中调用。Weka 包含 数据预处理、分类、回归、聚类、关联规则、可视化 等工具。 2. Massive Online Analysis

jopen 2015-09-11   47685   0

【机器学习快讯】20150124第一篇机器学习快讯 资讯

章整理罗列出来,等有时间或者遇到类似的问题的时候再看也是有益处的。 机器学习技术 12个用好朴素算法的小提示 使用随机森林:Use Random Forest: Testing 179 Classifiers

jopen 2015-01-24   26431   0
P28

  TalkingData 基于 Spark 的数据挖掘工作 文档

为什么没有广泛使用MLLib内存资源有限,很多情况下无法把数据放入内存处理,因此迭代算法效率还是很低 迭代依然是阿格硫之蹱 我们只能尽可能使用需要迭代次数少,甚至不迭代的算法和算法实现RDTOne Iteration LRSimHash

pd3n 2014-12-03   545   0

机器学习入门资源不完全汇总 经验

Tour of Machine Learning Algorithms (2013) 这篇关于机器学习算法分类的文章也非常好 Best Machine Learning Resources for Getting

jopen 2015-01-11   59922   0

揭开机器学习的面纱 经验

量是连续的,那这就属于回归问题。 而如果预测变量是独立类别(定性或是定类的离散值),那这就属于分类问题了。 举例来说,如下两图所示: 预测 S&P500 指数下周的回报率。由于回报率是连续变量,这就是回归问题。

uebpk8056 2016-12-01   18164   0

Python数据模块 经验

这些工具接受命令行或是其它工具输入的数据, 轻易的生成柱图以及直方图等等. 给黒客的概率编程和方法 (github.com) 这书是极好的, 介绍如何用方法和概率编程进行数据分析. 而且,每章都提供了用以 iPython

jopen 2014-03-14   22915   0

K-Means聚类的Python实践 经验

是失败的)。 什么是聚类 简单的说,就是对于一组不知道分类标签的数据,可以通过聚类算法自动的把相似的数据划分到同一个分类中。即聚类与分类的区别主要在于,聚类可以不必知道源数据的标签信息。 K-Means(K均值)

清风无岸 2017-02-12   13072   0

优秀大数据GitHub项目一览 资讯

amara对很多常见算法都进行了重写因此速度上有一定的提升。这里我们能列出的一些算法包括:朴素分类器、矩阵分解、协同过滤以及神经网络。新加入的相似性分析还可以通过分析用户的点击来实现共现推荐算法。

jopen 2016-01-18   31229   0

2016谷歌教授科研奖公布,机器学习成最大赢家 资讯

多伦多大学计算机科学助理教授,多伦多卡伯勒大学计算机与数学科学助理教授。研究课题有条件概率的可计算性、神经网络矩阵分解问题、产品形式可交换特征概率函数的表征、扩展可允许程序及其非标准风险问题等。共发布学术论文

jopen 2017-03-03   14925   0

部署大数据?请参考大数据分析平台架构(Big Data Analytics Platform) 经验

大数据分析处理架构图 数据源: 除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而特别要说的是流数据,它的核心就是数据的连续性和快速分析性; 计算层:

jopen 2015-04-03   72981   0

OpenBSD的spamd 经验

许久不碰反垃圾邮件的事情了,一来前段时间垃圾邮件确实也没有那么多,加上spamassassin确实相当有效,二来也是因为犯懒。 不过,最近几天垃圾邮件明显比平时多了许多,所以决定坐下来仔细处理一下。

jopen 2015-03-10   11597   0
OpenBSD  

当微软小冰成为毕加索 资讯

·吉尔平,画家、作家威廉·吉尔平的女儿;艾德玛·莫里索,与画家马奈兄弟纠缠不清的塔的姐姐;亨丽特·达丽卡贺,马蒂的模特;阿仓,伊藤博文的宠伎。 她们分别代表了不同时代的流派。从 1690 年

五嘎子 2019-07-17   1185   0

从内容/用户画像到如何做算法研发 经验

类别的问题上。是一个聚类的问题?一个分类的问题?还是一个回归类问题?定义了类别之后再去找对应的算法。比如聚类可以使用KMeans,LDA,K近邻等,分类可以,SVM等。然而你会发现,其实还是太简单了。

jopen 2016-01-07   12169   0
算法  

21行python代码实现拼写检查器 经验

big.txt 作为我们的样本数据。 背后原理 上面的代码是基于来实现的,事实上谷歌百度实现的拼写检查也是通过实现,不过肯定比这个复杂多了。 首先简单介绍一下背后的原理,如果读者之前了解过了,可以跳过这段。

wjkbl753 2016-01-24   14571   0

基于技能的改善数据科学实践的方法 资讯

结构化数据、NLP、机器学习、大数 据和分布式数据、云管理、前端编程、优化、概率图模型以及算法和统计。而且,针对以下9种技能,只有一种类型的专家能够达到熟练程度——产品设计、 商业开发、预算编制

jopen 2015-12-22   18625   0
方法  

全球首位程序员是位女性而且已经 200 岁 资讯

世界上首台计算机诞生前一个世纪,阿达洛夫莱研究了查尔斯·巴奇尚未建造的分析引擎的潜力,并且给出了分析报告。 巴奇的分析引擎被认为是世界上第一台计算机,而洛夫莱斯世界上第一个计算机程序员。她预见巴奇的设计如何能够成为

jopen 2015-10-14   3311   0

机器学习中的有监督学习,无监督学习,半监督学习 经验

数,将输入映射到合适的输出,例如分类。 非监督学习:直接对输入数据集进行建模,例如聚类。 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数。 一、 监督学习

jopen 2016-01-18   45703   0
1 2 3 4 5 6 7 8 9 10