P96

  MapReduce 算法设计 文档

ce可解决哪些算法问题? 9. 中科院计算所智能信息重点实验室进行了基于MapReduce的K-Means聚类、分类、和关联规则挖掘等海量数据挖掘基础并行算法、以及常用的数据统计分析算法的研究;并基于

bxunzhao 2013-05-18   999   0

盘点大数据开源软件Google Trends指数 资讯

n公司,用于管理他们的Hadoop批处理工作流。Azkaban根据工作的依赖性进行排序,提供友好的Web用户界面来维护和跟踪用户的工作流程。 YARN 是一种新的Hadoop资源管理器,它是一个通

jopen 2017-04-06   46308   0

28款GitHub最流行的开源机器学习项目 资讯

SDK(软件开发工具包)。其开发语言是Scala语言,数据库方面使用的是MongoDB数据库,计算系统采用Hadoop系统架构。 开发语言:Scala 许可协议: Apache License 2.0

jopen 2016-04-19   65752   0

28款GitHub最流行的开源机器学习项目:TensorFlow排榜首 经验

SDK(软件开发工具包)。其开发语言是Scala语言,数据库方面使用的是MongoDB数据库,计算系统采用Hadoop系统架构。 开发语言:Scala 许可协议: Apache License 2.0 GitHub项目地址:

gdweijin 2017-04-19   45209   0

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法 经验

降法更新: 迭代,直到收敛。 与K-Means的比较 同样是无监督的聚类方法,SOM与K-Means有什么不同呢? (1)K-Means需要事先定下类的个数,也就是K的值。 SOM

jopen 2016-01-10   16291   0

基于大数据的机器学习:Apache SystemML 在 IBM BigInsights 的实践 经验

运行环境支持单机和分布式部署。单机部署显然有利于本地开发的工作,而分布式部署则可以真正发挥机器学习的威力,支持的框架包括 Hadoop 和 Spark。 Apache SystemML 目前支持的机器学习算法有: 描述性统计

dlb124 2017-06-14   46102   0

数据科学家必须要掌握的5种聚类算法 经验

,我们来看看数据科学家们需要掌握的5种常见聚类算法以及它们的优缺点! ▌ K-均值聚类 K-Means可能是最知名的聚类算法,没有之一。在很多介绍性的数据科学和机器学习课程中,都有讲授该算法。并且

COS每周精选:算法学习知哪些? 资讯

王小宁 编辑: 王小宁 算法 K-means是最常用的聚类算法之一:容易理解,实现不难,虽然会有local optimum,但通常结果也不差。但k-means也不是万金油,比如在一些比较复杂的问

jopen 2015-01-18   15132   0
算法  

数据挖掘十大算法--K-均值聚类算法 经验

域,相应的算法也非常的多。本文仅介绍一种最简单的聚类算法——k均值(k-means)算法。 1、算法简介 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。

jopen 2016-01-18   24871   0

k-modes/k-prototypes聚类算法Python实现:kmodes 经验

points. (This is in contrast to the more well-known k-means algorithm, which clusters numerical data based

n6bg 2015-05-01   49662   0

Apache Spark 1.5新特性介绍 资讯

class参数选择不同的output committer类,默认是org.apache.parquet.hadoop.ParquetOutputCommitter,用户可以继承这个类 实现自己的output c

jopen 2015-09-10   23843   0

实时推荐系统的3种方式 经验

分析,对模型进行更新,但是定期对模型进行更新,无法保证推荐的实时性,一段时间后,由于模型训练也要相当时间,可能传统的批处理的Hadoop的方法, 无法再缩短更新频率,最终推荐效果会因为实时性问题达到一个瓶颈。 推荐算法主要有基

jopen 2015-06-18   132273   0
P24

  大数据分析系统架构之探讨 文档

前言: 3 一、Hadoop生态圈: 3 Hadoop 4 HBase 5 Hive 6 Apache Pig: 6 Impala: 7 Flume: 7 Sqoop: 8 Chukwa: 8 Mahout:

guet_lee 2017-01-12   2237   0
P24

  大数据分析系统架构 文档

前言: 3 一、Hadoop生态圈: 3 Hadoop 4 HBase 5 Hive 6 Apache Pig: 6 Impala: 7 Flume: 7 Sqoop: 8 Chukwa: 8 Mahout:

wzf1118 2016-11-04   2940   0

机器学习经典算法详解及Python实现--聚类及K均值、二分K-均值聚类算法 经验

来理解的——将相同、相似、相近、相关的对象实例聚成一类的过程。机器学习中常见的聚类算法包括 k-Means算法、期望最大化算法(Expectation Maximization,EM,参考“ EM算法原理

jopen 2015-01-14   123723   0

Spark的39个机器学习库 经验

tering Adds arbitrary distance functions to K-Means 21. spark-ml-streaming Visualize the Streaming

jopen 2015-09-30   60167   0

计算机视觉库 VLFeat 经验

一个开源的计算机视觉库,实现了 SIFT,MSER, k-means, hierarchical k-means, agglomerative information bottleneck, quick

计算机视觉库:BazAR 经验

一个开源的计算机视觉库,实现了 SIFT,MSER, k-means, hierarchical k-means, agglomerative information bottleneck, quick

开源大数据处理工具汇总(下) 经验

后,scribe会将转存的日志重新传输给中央存储系统。其通常与Hadoop结合使用,scribe用于向HDFS中push日志,而Hadoop通过 MapReduce作业进行定期处理。 Scribe的系统架构

jopen 2016-01-05   77527   0

十大数据挖掘算法及各自优势 经验

Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive

jopen 2014-09-04   36897   0
算法  
1 2 3 4 5 6 7 8 9 10