机器学习框架,类库和软件汇总 经验

ML engine that supports distributed learning on Hadoop, Spark or your laptop via APIs in R, Python, Scala

jopen 2015-11-23   70827   0

分布式计算系统,Spark 发布1.0.0 版本 资讯

目的core部分的代码只有63个Scala文件,非常短小精悍。 Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在

jopen 2014-05-30   29373   0
Spark  

机器学习开源项目、类库、软件集合 经验

library. Data Analysis / Data Visualization Hadoop - Hadoop/HDFS Spark - Spark is a fast and general engine

jopen 2014-10-10   102246   0

机器学习框架、库和软件集合:awesome-machine-learning 经验

library. Data Analysis / Data Visualization Hadoop - Hadoop/HDFS Spark - Spark is a fast and general engine

jopen 2014-10-16   134300   0

机器学习之开源库大总结 经验

http://nltk.org/ 10 lucene(基于java的包括nutch,solr,hadoop,mahout等全套,是做信息检索和搜索引擎的同志们必学的开源软件了,学JAVA的必学) http://lucene

jopen 2013-03-28   192899   0

基于MapReduce开发的数据挖掘/机器学习库 - Mahout 经验

良好的扩展性和容错性 充分利用了MapReduce和HDFS的扩展性和容错性 属于Hadoop生态系统重要组成部分 Apache Software License 2 实现了大部分常用的数据挖掘算法

jopen 2016-01-20   17099   0

大数据(十一) - Mahout 经验

基于MapReduce开发的数据挖掘/机器学习库 良好的扩展性和容错性 充分利用了MapReduce和HDFS的扩展性和容错性 属于Hadoop生态系统重要组成部分 Apache Software License 2 实现了大部分常用的数据挖掘算法

jopen 2016-01-20   7588   0

MapReduce的组合式,迭代式,链式 经验

一些复杂的任务难以用一次MapReduce处理完成,需要多次 MapReduce 才能完成任务,例如Pagrank,K-means算法都需要多次的迭代,关于 MapReduce 迭代在Mahout中运用较多。有兴趣的可以参考一下Mahout的源码。

jopen 2014-11-12   16014   0
P34

  从“被虐”到“落地” - 明略大数据产品演进实践 文档

期望到达大数据的核心价值在于:挖掘隐藏在大数据背后的知识 7. 目录WHY大数据落地被虐实例如何应对案例分享 8. 信心爆棚的进击Hadoop HBase Spark Storm Impala ML 9. 很快感受到森森的恶意 10. 丰富的数据源

w327 2015-05-25   473   0
P35

  The Spark Project Today 文档

(18), Tez (1Past 14 months: more active devs than Hadoop MapReduce! 6. Development CommunityHealthy across

aacall 2014-06-25   2747   0

【基础】常用的机器学习&数据挖掘知识点 经验

asting& Gibbs)。 Clustering(聚类): K-Means,K-Mediods,二分K-Means,FK-Means,Canopy,Spectral-KMeans(谱聚类),GMM-

jopen 2015-01-08   29762   0

awesome-machine-learning - 非常棒的机器学习框架,库和软件集合 经验

ML engine that supports distributed learning on Hadoop, Spark or your laptop via APIs in R, Python, Scala

jopen 2016-02-05   169699   0

应用Spark解决Kaggle数据科学问题 资讯

——每个节点包含 一个八核的i7处理器和16GB的内存。集群运行了携带Spark库的MapR Hadoop,可以有效存储运算的中间结果。接下来,本文就从数据分析、机器学习和结果等三个方面介绍comSysto团队解决以上问题的过程。

jopen 2015-11-19   17064   0
Spark  
P10

  Apache Mahout:适合所有人的可扩展机器学习框架 文档

部分,特别是《Mahout 实战》 一书。此外,我假设读者具备 Apache Hadoop 和 Map-Reduce 范式方面的基本知识。(有关 Hadoop 的更多信息,请参阅 参考资料 部分。) Mahout 现状

beiwei1121 2014-09-23   492   0

机器学习平台、框架、库和软件集合 经验

library. Data Analysis / Data Visualization Hadoop - Hadoop/HDFS Spark - Spark is a fast and general engine

jopen 2015-01-08   127601   0

谷歌发布TensorFlow 1.0,推出新的机器学习工具 资讯

的工程总监Rajat Monga在会议上说,它增添了一些新的工具,比如更加传统的机器学习工具K-means和支持向量机(SVM)等。 该框架还集成了基于Python的Keras库。这个库的初衷是简

jopen 2017-02-16   31635   0

【机器学习快讯】20150124第一篇机器学习快讯 资讯

Regression、Logistic Regression、Random Forests、K-Means Clustering等,简单清楚 scrapyrt——Scrapy realtime pyt

jopen 2015-01-24   26431   0

机器学习资源大全 经验

—提供一个简单的大规模实时机器学习/预测分析基础架构。 数据分析/数据可视化 Hadoop —大数据分析平台 Spark —快速通用的大规模数据处理引擎。 Impala —为Hadoop实现实时查询 Javascript 自然语言处理

jopen 2015-03-05   76027   0

推荐!国外程序员整理的机器学习资源大全 资讯

—提供一个简单的大规模实时机器学习/预测分析基础架构。 数据分析/数据可视化 Hadoop —大数据分析平台 Spark —快速通用的大规模数据处理引擎。 Impala —为 Hadoop 实现实时查询 Javascript 自然语言处理

jopen 2014-07-22   78240   4

优秀大数据GitHub项目一览 资讯

Mahout来快速创建高效扩展性又好的机器学习应用。Mahout结合了诸如H2O算法、Scala、Spark和Hadoop MapReduce等模块,为开发人员提供了一个构建可扩展算法的环境。现在最新的版本是去年11月6日发布的0

jopen 2016-01-18   31229   0
1 2 3 4 5 6 7 8 9 10