28款GitHub最流行的开源机器学习项目 资讯

现在机器学习逐渐成为行业热门,经过二十几年的发展,机器学习目前也有了十分广泛的应用,如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、DNA序列测序、语音和手写识别、战略游戏和机器人等方面。 云栖社区特意翻译整理了目前GitHub上最受欢迎的28款开源的机器学习项目,以供开发者参考使用。

jopen 2016-04-19   65752   0

未来的网络安全,离不开机器学习 资讯

信息安全一直就是猫与老鼠的游戏。好家伙新建一堵墙,坏家伙便想方设法通过或绕过它。但最近,坏家伙们似乎越来越轻易地就可以通过这堵墙。要想阻止他们,我们的能力需要有一个巨大的提升,这可能意味着我们需要更广泛地使用机器学习技术。

jopen 2015-12-15   21384   0

Quora机器学习Sessions:对话算法大师Pedro Domingos 资讯

Writing Sessions是知识共享网站Quora推出的一个与专家交流互动的新板块,在这里你可以看到各个行业领域的专家、学者、名人等对引人注目的问题的独特见解。最近推出的系列围绕如今最热门的技术之一——机器学习所展开,之前机器之心推出了Andrew Ng系列,而本次机器之心精选华盛顿大学教授、热门畅销书《主算法》(The Master Algorithm)作者Pedro Domingos在Quora上的回答,让我们一起听听这位算法大师对人工智能、机器学习等有何见解吧!机器之心后续还会陆续推出其他专家系列,敬请期待!

jopen 2016-02-11   42222   0

25 个 Java 机器学习工具和库 资讯

本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法。这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用。Weka包括一系列的工具,如数据预处理、分类、回归、聚类、关联规则以及可视化。

jopen 2015-12-27   31826   0

分布式机器学习的故事(转 ) 博客

从毕业加入Google开始做分布式机器学习,到后来转战腾讯广告业务,至今已经七年了。我想说说我见到的故事和我自己的实践经历。这段经历给我的感觉是:虽然在验证一个新的并行算法的正确性的时候,我们可以利用现有框架,尽量快速实现,但是 任何一个有价值的机器学习思路,都值得拥有自己独特的架构。所以重点在有一个分布式操作系统,方便大家开发自己需要的架构(框架),来支持相应的算法 。如果你关注大数据,听完我说

jopen 2014-02-12   38015   0

机器学习基础】过拟合 经验

以一维的回归分析为例,输出为目标函数加上一点噪声yn=fn(xn)+noise。如果用高阶多项式去拟合数据的话(比如有五个数据 点,用四次多项式去拟合的话,如果让该多项式曲线均通过这几个数据点的话,则只有唯一解),这种情况可能使得训练误差Ein很小,但是实际的真实误差就可 能很大,这说明我们求解的模型的泛化能力很差(bad generalization),这在训练误差很小的情况下推论到未知的数据的话预测结果就会很糟。

jopen 2015-02-10   51148   0

Java开源机器学习框架:Datumbox Machine Learning Framework 经验

Datumbox Machine Learning Framework是一个Java开发的开源机器学习框架。 用于快速开发机器学习和统计应用。

jopen 2014-10-19   28759   0

也谈 机器学习到底有没有用 ? 经验

作为一个机器学习爱好者,也想谈一下自己目前对机器学习的看法。但事先声明,本人对机器学习研究不多,知之甚少,实践也有限,文章观点难免有狭隘之处。

jopen 2014-11-16   24757   0

机器学习入门资源不完全汇总 经验

机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计 算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理 论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

jopen 2015-01-11   59922   0

机器学习方面源代码库整理 经验

经典的机器学习方面源代码库整理。全面收集,可用于数据挖掘,计算机视觉,模式识别,信息检索相关领域。

jopen 2015-01-08   29195   0

研究机器学习之MLlib实践经验 经验

本文主要讨论是用MLlib进行Classification工作。典型的应用场景就是AD CTR Prediction,也就是大部分互联网公司的利润来源。据业余了解,广告CTR预估使用最多的基础算法还是L1正则化的Logistic Regression。

jopen 2014-12-27   51748   0

机器学习--k-近邻(kNN)算法 经验

存在一个样本数据集合(也称训练样本集),并且样本集中每个数据都存在标签。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。 我们一般只选择样本集中前k(k通常是不大于20的整数)个最相似的数据,最后选择k个最相似数据中出现次数最多的分类,作为新数据的分类。

jopen 2015-04-19   15687   0
算法  

机器学习实战ByMatlab(3):K-means算法 经验

K-means算法属于无监督学习聚类算法,其计算步骤还是挺简单的,思想也挺容易理解,而且还可以在思想中体会到EM算法的思想。

fff8 2015-05-26   50946   0

大数据机器学习工具:Apache MADlib 经验

Apache MADlib 是为数据科学提供的 SQL 大数据机器学习工具。Apache MADlib 拥有强大的大数据分析能力。Apache MADlib 支持 Postgres, Pivotal Greenplum 数据库和 Apache HAWQ (incubating)。

jopen 2015-11-03   26628   0

构建机器学习系统的20个经验教训 经验

数据科学家对优化算法和模型以进一步发掘数据价值的追求永无止境。在这个过程中他们不仅需要总结前人的经验教训,还需要有自己的理解与见地,虽然后者取决于人的灵动性,但是前者却是可以用语言来传授的。最近Devendra Desale就在KDnuggets上发表了一篇文章,总结了Quora的 工程副总裁Xavier Amatriain 在Netflix和Quora从事推荐系统和机器学习工作时所 总结的20条经验教训 。

jopen 2015-12-21   23717   0

机器学习框架,Fuzzy 1.2 发布 资讯

Fuzzy 机器学习框架是一个程序库和一个使用直觉模糊数据的机器学习的GUI前端。该方法是基于直觉模糊集和可能性理论。进一步的特点是模糊的功能和类;基于语言 变量的数值,枚举的功能和特点;用户自定义特征;衍生和评估功能;

jopen 2012-05-28   8794   0

Google推出机器学习图表搜索功能 资讯

Google今天发布了一个全新的搜索功能——结构化片段(Sturctured Snippets),能够在搜索结果列表中展示从web网页图表中抓取的数据信息。

jopen 2014-09-23   7356   0
Google  

微软开始提供Azure机器学习服务 资讯

 微软于近期发布了 Azure ML。这是一个基于云的机器学习平台,旨在帮助基于过去的行为对未来事件进行预测。微软已经将机器学习应用于 Bing、Xbox 和其他产品多年。但是,这是微软首次将内部技术以云服务的方式提供给外界使用。

jopen 2014-09-24   5837   0
微软  

七种基于云计算的机器学习服务 资讯

开发机器学习解决方案提升现有的预测算法并不是一件容易的事情。这需要大量的工作来保证其正确性,包括清除数据、建立基础结构、测试和再测试模型以及最终部署算法。 这里有六种机器学习服务,它们可以帮助你减少部署机器学习解决方案的痛苦。

xg48 2015-04-10   13812   0

机器学习库,Mahout 0.10.0 发布 资讯

Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

xg48 2015-04-10   7214   0
Mahout  
1 2 3 4 5 6 7 8 9 10