开源项目,开源代码,开源文档,开源新闻,开源社区

P96

ce可解决哪些算法问题？ 9. 中科院计算所智能信息重点实验室进行了基于MapReduce的K-Means聚类、分类、和关联规则挖掘等海量数据挖掘基础并行算法、以及常用的数据统计分析算法的研究；并基于

bxunzhao 2013-05-18 999 0

分布式/云计算/大数据方案报告 Intel Go

n公司，用于管理他们的Hadoop批处理工作流。Azkaban根据工作的依赖性进行排序，提供友好的Web用户界面来维护和跟踪用户的工作流程。 YARN 是一种新的Hadoop资源管理器，它是一个通

jopen 2017-04-06 46308 0

分布式系统 Hadoop 开源

SDK（软件开发工具包）。其开发语言是Scala语言，数据库方面使用的是MongoDB数据库，计算系统采用Hadoop系统架构。开发语言：Scala 许可协议： Apache License 2.0

jopen 2016-04-19 65752 0

SDK(软件开发工具包)。其开发语言是Scala语言，数据库方面使用的是MongoDB数据库，计算系统采用Hadoop系统架构。开发语言：Scala 许可协议： Apache License 2.0 GitHub项目地址:

gdweijin 2017-04-19 45209 0

深度学习开源 Github

降法更新：迭代，直到收敛。与K-Means的比较同样是无监督的聚类方法，SOM与K-Means有什么不同呢？（1）K-Means需要事先定下类的个数，也就是K的值。 SOM

jopen 2016-01-10 16291 0

神经网络 K-means 机器学习

运行环境支持单机和分布式部署。单机部署显然有利于本地开发的工作，而分布式部署则可以真正发挥机器学习的威力，支持的框架包括 Hadoop 和 Spark。 Apache SystemML 目前支持的机器学习算法有：描述性统计

dlb124 2017-06-14 46102 0

SystemML 大数据机器学习

，我们来看看数据科学家们需要掌握的5种常见聚类算法以及它们的优缺点！ ▌ K-均值聚类 K-Means可能是最知名的聚类算法，没有之一。在很多介绍性的数据科学和机器学习课程中，都有讲授该算法。并且

yylovelp 2018-02-18 30237 0

聚类分析数据科学分布式/云计算/大数据

王小宁编辑：王小宁算法 K-means是最常用的聚类算法之一：容易理解，实现不难，虽然会有local optimum，但通常结果也不差。但k-means也不是万金油，比如在一些比较复杂的问

jopen 2015-01-18 15132 0

算法

域，相应的算法也非常的多。本文仅介绍一种最简单的聚类算法——k均值（k-means）算法。 1、算法简介 k-means算法，也被称为k-平均或k-均值，是一种得到最广泛使用的聚类算法。

jopen 2016-01-18 24871 0

机器学习

points. (This is in contrast to the more well-known k-means algorithm, which clusters numerical data based

n6bg 2015-05-01 49662 0

kmodes Python开发

class参数选择不同的output committer类，默认是org.apache.parquet.hadoop.ParquetOutputCommitter，用户可以继承这个类实现自己的output c

jopen 2015-09-10 23843 0

Apache Spark

分析，对模型进行更新，但是定期对模型进行更新，无法保证推荐的实时性，一段时间后，由于模型训练也要相当时间，可能传统的批处理的Hadoop的方法，无法再缩短更新频率，最终推荐效果会因为实时性问题达到一个瓶颈。推荐算法主要有基

jopen 2015-06-18 132273 0

推荐系统推荐引擎

P24

前言: 3 一、Hadoop生态圈： 3 Hadoop 4 HBase 5 Hive 6 Apache Pig: 6 Impala： 7 Flume： 7 Sqoop: 8 Chukwa： 8 Mahout:

guet_lee 2017-01-12 2237 0

分布式/云计算/大数据

P24

前言: 3 一、Hadoop生态圈： 3 Hadoop 4 HBase 5 Hive 6 Apache Pig: 6 Impala： 7 Flume： 7 Sqoop: 8 Chukwa： 8 Mahout:

wzf1118 2016-11-04 2940 0

分布式/云计算/大数据

来理解的——将相同、相似、相近、相关的对象实例聚成一类的过程。机器学习中常见的聚类算法包括 k-Means算法、期望最大化算法（Expectation Maximization，EM，参考“ EM算法原理

jopen 2015-01-14 123723 0

机器学习算法

tering Adds arbitrary distance functions to K-Means 21. spark-ml-streaming Visualize the Streaming

jopen 2015-09-30 60167 0

机器学习

一个开源的计算机视觉库，实现了 SIFT,MSER, k-means, hierarchical k-means, agglomerative information bottleneck, quick

jopen 2012-09-09 53319 0

计算机视觉计算机视觉库/人脸识别

一个开源的计算机视觉库，实现了 SIFT,MSER, k-means, hierarchical k-means, agglomerative information bottleneck, quick

jopen 2012-12-20 67822 0

计算机视觉计算机视觉库/人脸识别

后，scribe会将转存的日志重新传输给中央存储系统。其通常与Hadoop结合使用，scribe用于向HDFS中push日志，而Hadoop通过 MapReduce作业进行定期处理。 Scribe的系统架构

jopen 2016-01-05 77527 0

分布式/云计算/大数据

Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法：C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive

jopen 2014-09-04 36897 0

算法

K-means Hadoop 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Hadoop Github Intel 大数据机器学习推荐引擎计算机视觉神经网络深度学习 Apache Spark 推荐系统 SystemML 分布式系统数据科学聚类分析 Python开发分布式/云计算/大数据计算机视觉库/人脸识别 K-means kmodes

MapReduce 算法设计文档

盘点大数据开源软件Google Trends指数资讯

28款GitHub最流行的开源机器学习项目资讯

28款GitHub最流行的开源机器学习项目：TensorFlow排榜首经验

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法经验

基于大数据的机器学习：Apache SystemML 在 IBM BigInsights 的实践经验

数据科学家必须要掌握的5种聚类算法经验

COS每周精选：算法学习知哪些？资讯

数据挖掘十大算法--K-均值聚类算法经验

k-modes/k-prototypes聚类算法Python实现：kmodes 经验

Apache Spark 1.5新特性介绍资讯

实时推荐系统的3种方式经验

大数据分析系统架构之探讨文档

大数据分析系统架构文档

机器学习经典算法详解及Python实现--聚类及K均值、二分K-均值聚类算法经验

Spark的39个机器学习库经验

计算机视觉库 VLFeat 经验

计算机视觉库：BazAR 经验

开源大数据处理工具汇总（下）经验

十大数据挖掘算法及各自优势经验

K-means Hadoop 的相关搜索

关键词

MapReduce 算法设计 文档

盘点大数据开源软件Google Trends指数 资讯

28款GitHub最流行的开源机器学习项目 资讯

28款GitHub最流行的开源机器学习项目：TensorFlow排榜首 经验

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法 经验

基于大数据的机器学习：Apache SystemML 在 IBM BigInsights 的实践 经验

数据科学家必须要掌握的5种聚类算法 经验

COS每周精选：算法学习知哪些？ 资讯

数据挖掘十大算法--K-均值聚类算法 经验

k-modes/k-prototypes聚类算法Python实现：kmodes 经验

Apache Spark 1.5新特性介绍 资讯

实时推荐系统的3种方式 经验

大数据分析系统架构之探讨 文档

大数据分析系统架构 文档

机器学习经典算法详解及Python实现--聚类及K均值、二分K-均值聚类算法 经验

Spark的39个机器学习库 经验

计算机视觉库 VLFeat 经验

计算机视觉库：BazAR 经验

开源大数据处理工具汇总（下） 经验

十大数据挖掘算法及各自优势 经验

K-means Hadoop 的相关搜索

关键词

MapReduce 算法设计文档

盘点大数据开源软件Google Trends指数资讯

28款GitHub最流行的开源机器学习项目资讯

28款GitHub最流行的开源机器学习项目：TensorFlow排榜首经验

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法经验

基于大数据的机器学习：Apache SystemML 在 IBM BigInsights 的实践经验

数据科学家必须要掌握的5种聚类算法经验

COS每周精选：算法学习知哪些？资讯

数据挖掘十大算法--K-均值聚类算法经验

Apache Spark 1.5新特性介绍资讯

实时推荐系统的3种方式经验

大数据分析系统架构之探讨文档

大数据分析系统架构文档

机器学习经典算法详解及Python实现--聚类及K均值、二分K-均值聚类算法经验

Spark的39个机器学习库经验

开源大数据处理工具汇总（下）经验

十大数据挖掘算法及各自优势经验