开源项目,开源代码,开源文档,开源新闻,开源社区

列举出mahout支持的所有算法 4.其它 4.1 Mahout算法（0.7）算法分类算法名中文名简要描述用例分类算法 Logistic Regression ( SGD ) 逻辑回归

jopen 2015-11-05 16169 0

Mahout 机器学习

PDF 5 项亮，不错的入门读物深入《Pattern Classification》（《模式分类》第二版） PDF 4 作者Richard O. Duda[5]、Peter E. Hart、

jopen 2015-01-08 73644 0

机器学习

P37

生物信息和基因的数据挖掘。 Web数据挖掘的各个方面。 14. 数据挖掘十大经典算法C4.5 一种分类决策树算法 The K-means algorithm即k-means算法 SVM（Support

maoying 2017-04-26 3027 0

分布式/云计算/大数据 XML

是一个数据挖掘任务机器学习算法的集合。这些算法可以直接应用于数据集或者在你自己的Java代码中调用。Weka 包含数据预处理、分类、回归、聚类、关联规则、可视化等工具。 2. Massive Online Analysis

jopen 2015-09-11 47685 0

机器学习

章整理罗列出来，等有时间或者遇到类似的问题的时候再看也是有益处的。机器学习技术 12个用好朴素贝叶斯算法的小提示使用随机森林：Use Random Forest: Testing 179 Classifiers

jopen 2015-01-24 26431 0

机器学习

P28

为什么没有广泛使用MLLib内存资源有限，很多情况下无法把数据放入内存处理，因此迭代算法效率还是很低迭代依然是阿格硫斯之蹱我们只能尽可能使用需要迭代次数少，甚至不迭代的算法和算法实现RDTOne Iteration LRSimHash

pd3n 2014-12-03 545 0

数据挖掘

Tour of Machine Learning Algorithms （2013）这篇关于机器学习算法分类的文章也非常好 Best Machine Learning Resources for Getting

jopen 2015-01-11 59922 0

机器学习

量是连续的，那这就属于回归问题。而如果预测变量是独立类别（定性或是定类的离散值），那这就属于分类问题了。举例来说，如下两图所示：预测 S&P500 指数下周的回报率。由于回报率是连续变量，这就是回归问题。

uebpk8056 2016-12-01 18164 0

数据挖掘机器学习

这些工具接受命令行或是其它工具输入的数据, 轻易的生成柱图以及直方图等等. 给黒客的概率编程和贝叶斯方法 (github.com) 这书是极好的, 介绍如何用贝叶斯方法和概率编程进行数据分析. 而且,每章都提供了用以 iPython

jopen 2014-03-14 22915 0

Python Python开发

是失败的）。什么是聚类简单的说，就是对于一组不知道分类标签的数据，可以通过聚类算法自动的把相似的数据划分到同一个分类中。即聚类与分类的区别主要在于，聚类可以不必知道源数据的标签信息。 K-Means（K均值）

清风无岸 2017-02-12 13072 0

K-means Python Python开发

amara对很多常见算法都进行了重写因此速度上有一定的提升。这里我们能列出的一些算法包括：朴素贝叶斯分类器、矩阵分解、协同过滤以及神经网络。新加入的相似性分析还可以通过分析用户的点击来实现共现推荐算法。

jopen 2016-01-18 31229 0

数据挖掘大数据 Github

多伦多大学计算机科学助理教授，多伦多斯卡伯勒大学计算机与数学科学助理教授。研究课题有条件概率的可计算性、神经网络矩阵分解问题、产品形式可交换特征概率函数的表征、扩展可允许程序及其非标准贝叶斯风险问题等。共发布学术论文

jopen 2017-03-03 14925 0

机器学习 Google

大数据分析处理架构图数据源：除该种方法之外，还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构，而特别要说的是流数据，它的核心就是数据的连续性和快速分析性；计算层：

jopen 2015-04-03 72981 0

大数据分布式/云计算/大数据

许久不碰反垃圾邮件的事情了，一来前段时间垃圾邮件确实也没有那么多，加上spamassassin确实相当有效，二来也是因为犯懒。不过，最近几天垃圾邮件明显比平时多了许多，所以决定坐下来仔细处理一下。

jopen 2015-03-10 11597 0

OpenBSD

·吉尔平，画家、作家威廉·吉尔平的女儿；艾德玛·莫里索，与画家马奈兄弟纠缠不清的贝塔的姐姐；亨丽叶特·达丽卡贺，马蒂斯的模特；阿仓，伊藤博文的宠伎。她们分别代表了不同时代的流派。从 1690 年

五嘎子 2019-07-17 1185 0

类别的问题上。是一个聚类的问题？一个分类的问题？还是一个回归类问题？定义了类别之后再去找对应的算法。比如聚类可以使用KMeans,LDA,K近邻等，分类可以贝叶斯，SVM等。然而你会发现，其实还是太简单了。

jopen 2016-01-07 12169 0

算法

big.txt 作为我们的样本数据。背后原理上面的代码是基于贝叶斯来实现的，事实上谷歌百度实现的拼写检查也是通过贝叶斯实现，不过肯定比这个复杂多了。首先简单介绍一下背后的原理，如果读者之前了解过了，可以跳过这段。

wjkbl753 2016-01-24 14571 0

Python Python开发

结构化数据、NLP、机器学习、大数据和分布式数据、云管理、前端编程、优化、概率图模型以及算法和贝叶斯统计。而且，针对以下9种技能，只有一种类型的专家能够达到熟练程度——产品设计、商业开发、预算编制

jopen 2015-12-22 18625 0

方法

世界上首台计算机诞生前一个世纪，阿达洛夫莱斯研究了查尔斯·巴贝奇尚未建造的分析引擎的潜力，并且给出了分析报告。巴贝奇的分析引擎被认为是世界上第一台计算机，而洛夫莱斯世界上第一个计算机程序员。她预见巴贝奇的设计如何能够成为

jopen 2015-10-14 3311 0

程序员

数，将输入映射到合适的输出，例如分类。非监督学习：直接对输入数据集进行建模，例如聚类。半监督学习：综合利用有类标的数据和没有类标的数据，来生成合适的分类函数。一、监督学习

jopen 2016-01-18 45703 0

机器学习

Mahout环境安装说明经验

机器学习经典书籍经验

数据挖掘常见算法文档

Java 机器学习工具 & 库经验

【机器学习快讯】20150124第一篇机器学习快讯资讯

TalkingData 基于 Spark 的数据挖掘工作文档

机器学习入门资源不完全汇总经验

揭开机器学习的面纱经验

Python数据模块经验

K-Means聚类的Python实践经验

优秀大数据GitHub项目一览资讯

2016谷歌教授科研奖公布，机器学习成最大赢家资讯

部署大数据？请参考大数据分析平台架构(Big Data Analytics Platform) 经验

OpenBSD的spamd 经验

当微软小冰成为毕加索资讯

从内容/用户画像到如何做算法研发经验

21行python代码实现拼写检查器经验

基于技能的改善数据科学实践的方法资讯

全球首位程序员是位女性而且已经 200 岁资讯

机器学习中的有监督学习，无监督学习，半监督学习经验

贝叶斯反垃圾邮件分类的相关搜索

关键词

Mahout环境安装说明 经验

机器学习经典书籍 经验

数据挖掘常见算法 文档

Java 机器学习 工具 & 库 经验

【机器学习快讯】20150124第一篇机器学习快讯 资讯

TalkingData 基于 Spark 的数据挖掘工作 文档

机器学习入门资源不完全汇总 经验

揭开机器学习的面纱 经验

Python数据模块 经验

K-Means聚类的Python实践 经验

优秀大数据GitHub项目一览 资讯

2016谷歌教授科研奖公布，机器学习成最大赢家 资讯

部署大数据？请参考大数据分析平台架构(Big Data Analytics Platform) 经验

OpenBSD的spamd 经验

当微软小冰成为毕加索 资讯

从内容/用户画像到如何做算法研发 经验

21行python代码实现拼写检查器 经验

基于技能的改善数据科学实践的方法 资讯

全球首位程序员是位女性而且已经 200 岁 资讯

机器学习中的有监督学习，无监督学习，半监督学习 经验

贝叶斯反垃圾邮件分类 的相关搜索

关键词

Mahout环境安装说明经验

机器学习经典书籍经验

数据挖掘常见算法文档

Java 机器学习工具 & 库经验

【机器学习快讯】20150124第一篇机器学习快讯资讯

TalkingData 基于 Spark 的数据挖掘工作文档

机器学习入门资源不完全汇总经验

揭开机器学习的面纱经验

Python数据模块经验

K-Means聚类的Python实践经验

优秀大数据GitHub项目一览资讯

2016谷歌教授科研奖公布，机器学习成最大赢家资讯

当微软小冰成为毕加索资讯

从内容/用户画像到如何做算法研发经验

21行python代码实现拼写检查器经验

基于技能的改善数据科学实践的方法资讯

全球首位程序员是位女性而且已经 200 岁资讯

机器学习中的有监督学习，无监督学习，半监督学习经验

贝叶斯反垃圾邮件分类的相关搜索