开源项目,开源代码,开源文档,开源新闻,开源社区

ML engine that supports distributed learning on Hadoop, Spark or your laptop via APIs in R, Python, Scala

jopen 2015-11-23 70827 0

机器学习 Awesome Machine Learning

目的core部分的代码只有63个Scala文件，非常短小精悍。 Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在

jopen 2014-05-30 29373 0

Spark

library. Data Analysis / Data Visualization Hadoop - Hadoop/HDFS Spark - Spark is a fast and general engine

jopen 2014-10-10 102246 0

机器学习 awesome-machine-learning

library. Data Analysis / Data Visualization Hadoop - Hadoop/HDFS Spark - Spark is a fast and general engine

jopen 2014-10-16 134300 0

机器学习 awesome-machine-learning

http://nltk.org/ 10 lucene(基于java的包括nutch,solr,hadoop,mahout等全套，是做信息检索和搜索引擎的同志们必学的开源软件了，学JAVA的必学） http://lucene

jopen 2013-03-28 192899 0

机器学习

良好的扩展性和容错性充分利用了MapReduce和HDFS的扩展性和容错性属于Hadoop生态系统重要组成部分 Apache Software License 2 实现了大部分常用的数据挖掘算法

jopen 2016-01-20 17099 0

推荐系统大数据机器学习 Mahout

基于MapReduce开发的数据挖掘/机器学习库良好的扩展性和容错性充分利用了MapReduce和HDFS的扩展性和容错性属于Hadoop生态系统重要组成部分 Apache Software License 2 实现了大部分常用的数据挖掘算法

jopen 2016-01-20 7588 0

分布式/云计算/大数据

一些复杂的任务难以用一次MapReduce处理完成，需要多次 MapReduce 才能完成任务，例如Pagrank，K-means算法都需要多次的迭代，关于 MapReduce 迭代在Mahout中运用较多。有兴趣的可以参考一下Mahout的源码。

jopen 2014-11-12 16014 0

MapReduce 分布式/云计算/大数据

P34

期望到达大数据的核心价值在于：挖掘隐藏在大数据背后的知识 7. 目录WHY大数据落地被虐实例如何应对案例分享 8. 信心爆棚的进击Hadoop HBase Spark Storm Impala ML 9. 很快感受到森森的恶意 10. 丰富的数据源

w327 2015-05-25 473 0

分布式/云计算/大数据方案 SQL

P35

(18), Tez (1Past 14 months: more active devs than Hadoop MapReduce! 6. Development CommunityHealthy across

aacall 2014-06-25 2747 0

分布式/云计算/大数据 Apache Intel Java Go

asting& Gibbs)。 Clustering(聚类)： K-Means，K-Mediods，二分K-Means，FK-Means，Canopy，Spectral-KMeans(谱聚类)，GMM-

jopen 2015-01-08 29762 0

机器学习

ML engine that supports distributed learning on Hadoop, Spark or your laptop via APIs in R, Python, Scala

jopen 2016-02-05 169699 0

机器学习 libraries and software.

——每个节点包含一个八核的i7处理器和16GB的内存。集群运行了携带Spark库的MapR Hadoop，可以有效存储运算的中间结果。接下来，本文就从数据分析、机器学习和结果等三个方面介绍comSysto团队解决以上问题的过程。

jopen 2015-11-19 17064 0

Spark

P10

部分，特别是《Mahout 实战》一书。此外，我假设读者具备 Apache Hadoop 和 Map-Reduce 范式方面的基本知识。（有关 Hadoop 的更多信息，请参阅参考资料部分。） Mahout 现状

beiwei1121 2014-09-23 492 0

机器学习 Apache

library. Data Analysis / Data Visualization Hadoop - Hadoop/HDFS Spark - Spark is a fast and general engine

jopen 2015-01-08 127601 0

机器学习

的工程总监Rajat Monga在会议上说，它增添了一些新的工具，比如更加传统的机器学习工具K-means和支持向量机（SVM）等。该框架还集成了基于Python的Keras库。这个库的初衷是简

jopen 2017-02-16 31635 0

谷歌 TensorFlow

Regression、Logistic Regression、Random Forests、K-Means Clustering等，简单清楚 scrapyrt——Scrapy realtime pyt

jopen 2015-01-24 26431 0

机器学习

—提供一个简单的大规模实时机器学习/预测分析基础架构。数据分析/数据可视化 Hadoop —大数据分析平台 Spark —快速通用的大规模数据处理引擎。 Impala —为Hadoop实现实时查询 Javascript 自然语言处理

jopen 2015-03-05 76027 0

机器学习

—提供一个简单的大规模实时机器学习/预测分析基础架构。数据分析/数据可视化 Hadoop —大数据分析平台 Spark —快速通用的大规模数据处理引擎。 Impala —为 Hadoop 实现实时查询 Javascript 自然语言处理

jopen 2014-07-22 78240 4

机器学习

Mahout来快速创建高效扩展性又好的机器学习应用。Mahout结合了诸如H2O算法、Scala、Spark和Hadoop MapReduce等模块，为开发人员提供了一个构建可扩展算法的环境。现在最新的版本是去年11月6日发布的0

jopen 2016-01-18 31229 0

数据挖掘大数据 Github

机器学习框架，类库和软件汇总经验

分布式计算系统，Spark 发布1.0.0 版本资讯

机器学习开源项目、类库、软件集合经验

机器学习框架、库和软件集合：awesome-machine-learning 经验

机器学习之开源库大总结经验

基于MapReduce开发的数据挖掘/机器学习库 - Mahout 经验

大数据(十一) - Mahout 经验

MapReduce的组合式，迭代式，链式经验

从“被虐”到“落地” - 明略大数据产品演进实践文档

The Spark Project Today 文档

【基础】常用的机器学习&数据挖掘知识点经验

awesome-machine-learning - 非常棒的机器学习框架，库和软件集合经验

应用Spark解决Kaggle数据科学问题资讯

Apache Mahout：适合所有人的可扩展机器学习框架文档

机器学习平台、框架、库和软件集合经验

谷歌发布TensorFlow 1.0，推出新的机器学习工具资讯

【机器学习快讯】20150124第一篇机器学习快讯资讯

机器学习资源大全经验

推荐！国外程序员整理的机器学习资源大全资讯

优秀大数据GitHub项目一览资讯

K-means Hadoop 的相关搜索

关键词

机器学习框架，类库和软件汇总 经验

分布式计算系统，Spark 发布1.0.0 版本 资讯

机器学习开源项目、类库、软件集合 经验

机器学习框架、库和软件集合：awesome-machine-learning 经验

机器学习之开源库大总结 经验

基于MapReduce开发的数据挖掘/机器学习库 - Mahout 经验

大数据(十一) - Mahout 经验

MapReduce的组合式，迭代式，链式 经验

从“被虐”到“落地” - 明略大数据产品演进实践 文档

The Spark Project Today 文档

【基础】常用的机器学习&数据挖掘知识点 经验

awesome-machine-learning - 非常棒的机器学习框架，库和软件集合 经验

应用Spark解决Kaggle数据科学问题 资讯

Apache Mahout：适合所有人的可扩展机器学习框架 文档

机器学习平台、框架、库和软件集合 经验

谷歌发布TensorFlow 1.0，推出新的机器学习工具 资讯

【机器学习快讯】20150124第一篇机器学习快讯 资讯

机器学习资源大全 经验

推荐！国外程序员整理的机器学习资源大全 资讯

优秀大数据GitHub项目一览 资讯

K-means Hadoop 的相关搜索

关键词

机器学习框架，类库和软件汇总经验

分布式计算系统，Spark 发布1.0.0 版本资讯

机器学习开源项目、类库、软件集合经验

机器学习之开源库大总结经验

MapReduce的组合式，迭代式，链式经验

从“被虐”到“落地” - 明略大数据产品演进实践文档

【基础】常用的机器学习&数据挖掘知识点经验

awesome-machine-learning - 非常棒的机器学习框架，库和软件集合经验

应用Spark解决Kaggle数据科学问题资讯

Apache Mahout：适合所有人的可扩展机器学习框架文档

机器学习平台、框架、库和软件集合经验

谷歌发布TensorFlow 1.0，推出新的机器学习工具资讯

【机器学习快讯】20150124第一篇机器学习快讯资讯

机器学习资源大全经验

推荐！国外程序员整理的机器学习资源大全资讯

优秀大数据GitHub项目一览资讯