开源项目,开源代码,开源文档,开源新闻,开源社区

随着 Hadoop 和大数据应用的爆发式增长，很多人正在寻找将他们已有的实现转为 MapReduce 方式的方法。不幸的是，除了《应用 MapReduce 进行数据密集的文本处理》和《Mahout in Action》几本有名书籍之外，很少有关设计 MapReduce 实现的出版物。

openkk 2012-02-15 17978 0

MapReduce

在hadoop中，reduce支持多个输出,输出的文件名也是可控的，就是继承MultipleTextOutputFormat类，重写generateFileNameForKey方法

openkk 2012-02-25 53272 0

MapReduce 分布式/云计算/大数据

MapReduce是google提出的一个软件架构，是一种处理海量数据的并行编程模式，用于大规模数据集（通常大于1TB）的并行运算。

jopen 2014-03-15 24199 0

MapReduce 分布式/云计算/大数据

随着互联网的发展，数据量的增大，很多对于数据的处理工作（例如一些推荐系统、广告推送等）都迁移到了云端，也就是分布式计算系统上。衍生了很多牛逼的分布式计算的计算模型，比较著名的就是MapReduce、MPI、BSP等。后来也产生了一些分布式计算系统，大家耳熟能详的Hadoop就是基于 MapReduce实现的。

jopen 2015-07-13 24082 0

MapReduce 分布式/云计算/大数据

Hadoop使用了MapReduce编程范式，目前已经被公认为是分布式环境中分析大数据的标准框架。然而，它并不能很好的应用于大规模的计算几何处理。本文介绍的CG_Hadoop是一套可伸缩的和高效的 MapReduce算法，用于处理各种基本计算几何问题，例如多边形合并、skyline（轮廓线）、convex hull(凸包)、farthest pair(最远相对)以及最近相对等，这些都是其它几何算法的基础。对于每一个计算几何操作，CG_Hadoop有两个版本，一个基于Apache Hadoop系统，一个基于SpatialHadoop系统。

jopen 2016-01-05 23913 0

分布式/云计算/大数据

(名词约束: 顶点Vertex-图中顶点;节点Process-计算单元节点),目录说明:

Hop36R 2016-02-01 18910 0

MapReduce 图计算 Git 分布式/云计算/大数据

Apache 基金会下的 Spak 再次引爆了大数据的话题。带着比 Hadoop MapReduce 速度要快 100 倍的承诺以及更加灵活方便的 API，一些人认为这或许预示着 Hadoop MapReduce 的终结。

jopen 2016-02-19 29104 0

MapReduce Spark

通过spring data 操作mongodb,利用map reduce 来统计用户访问的Pv Uv。详细代码见 https://github.com/WangErXiao/spring-data 具体的spring-data 操作mongodb这里不做介绍。这里只介绍mongo map reduce。 @Component public class UserDaoImpl extends Mo

jopen 2015-06-17 5692 0

MongoDB

这里主要使用Java自带邮件类实现Mapreduce任务的监控，如果 Mapreduce任务报错则发送报错邮件。Mapreduce的报错信息通过hdfs中的日志获取，里面的报错日志是json格式，这里先将json转换成xml格式然后再发送到邮件。具体代码如下 import java.io.BufferedReader; import java.io.ByteArrayOutputStream;

jopen 2015-08-18 2257 0

MapReduce

HBase常用功能和HBase+MapReduce使用总结

jopen 2013-12-05 55572 0

HBase MapReduce NoSQL数据库

应用程序通常会通过提供map和reduce来实现 Mapper和Reducer接口，它们组成作业的核心。

openkk 2012-05-18 36030 0

Hadoop 分布式/云计算/大数据

1.比如我们输出的mapreduce结果，需要进入下一个mapreduce，该怎么解决？可以使用迭代式 2.那么什么是迭代式? 3.什么是依赖式？ 4.什么是链式？ 5.三种模式各自的应用场景是什么？

jopen 2014-11-12 16014 0

MapReduce 分布式/云计算/大数据

Mapreduce在hadoop中是一个比较难以的概念。下面需要用心看，然后自己就能总结出来了。

jopen 2016-01-18 18332 0

分布式/云计算/大数据

P16

摘要MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个reduce函数合并所有的具有相同中间key的中间value.下面将列举许多可以用这个模型来表示的现实世界的工作.以这种方式写的程序能自动的在大规模的普通机器上实现并行化.

ljp123456 2014-03-22 304 0

分布式/云计算/大数据

MapReduce近几年比较热的分布式计算编程模型，以C#为例简单介绍下MapReduce分布式计算。

fff8 2015-05-26 15964 0

MapReduce .NET开发

这篇文章讨论了 MapReduce design patterns的四种基本设计模式。

langbo213 2016-10-12 10142 0

设计模式 MapReduce

Disco是一个基于MapReduce的分布式计算框架。Disco是一个开源项目，由诺基亚研究中心开发用来解决处理大数据时碰到的实际问题。

openkk 2012-06-08 32597 0

MapReduce 存储系统分布式/云计算/大数据

分析在MongoDB中正成为越来越重要的话题，因为它在越来越多的大型项目中使用。人们厌倦了使用不同的软件来做分析（包括Hadoop），它们显然需要传输大量开销的数据。

jopen 2013-11-01 33424 0

MongoDB NoSQL数据库

P19

MapReduce是一个编程模式，它是与处理/产生海量数据集的实现相关。用户指定一个map函数，通过这个map函数处理key/value（键/值）对，并且产生一系列的中间key/value对，并且使用reduce函数来合并所有的具有相同key值的中间键值对中的值部分。现实生活中的很多任务的实现都是基于这个模式的，正如本文稍后会讲述的那样。

f0xf0x 2013-11-21 2001 0

分布式/云计算/大数据

本文将介绍基于物品的协同过滤推荐算法案例在TDW Spark与MapReudce上的实现对比，相比于MapReduce，TDW Spark执行时间减少了66%，计算成本降低了40%。本文将介绍基于物品的协同过滤推荐算法案例在TDW Spark与MapReudce上的实现对比，相比于MapReduce，TDW Spark执行时间减少了66%，计算成本降低了40%。

jopen 2014-11-05 17978 0

Spark

MapReduce模式、算法和用例资讯

MapReduce程序reduce输出控制经验

分布式数据处理MapReduce 经验

MapReduce的替代者-Parameter Server 经验

CG_Hadoop：基于MapReduce的计算几何经验

基于MapReduce编程模型的图计算框架经验

Spark 是否真的比 MapReduce 技高一筹资讯

mongodb 通过MapReduce统计用户Pv Uv 代码段

Mapreduce任务实现邮件监控代码段

HBase常用功能和HBase+MapReduce使用总结经验

hadoop mapreduce核心功能描述经验

MapReduce的组合式，迭代式，链式经验

MapReduce中combine、partition、shuffle的作用是什么经验

MapReduce 超大机群上的简单数据处理文档

探索C#之微型MapReduce 经验

MapReduce 四种基本设计模式经验

Disco - 基于MapReduce的分布式计算框架经验

如何将 MongoDB MapReduce 速度提升 20 倍经验

MapReduce超大集群的简单数据处理文档

Spark vs. MapReduce 时间节约66%，计算节约40% 资讯

Google MapReduce原文的相关搜索

关键词

MapReduce模式、算法和用例 资讯

MapReduce程序reduce输出控制 经验

分布式数据处理MapReduce 经验

MapReduce的替代者-Parameter Server 经验

CG_Hadoop：基于MapReduce的计算几何 经验

基于MapReduce编程模型的图计算框架 经验

Spark 是否真的比 MapReduce 技高一筹 资讯

mongodb 通过MapReduce统计用户Pv Uv 代码段

Mapreduce任务实现邮件监控 代码段

HBase常用功能和HBase+MapReduce使用总结 经验

hadoop mapreduce核心功能描述 经验

MapReduce的组合式，迭代式，链式 经验

MapReduce中combine、partition、shuffle的作用是什么 经验

MapReduce 超大机群上的简单数据处理 文档

探索C#之微型MapReduce 经验

MapReduce 四种基本设计模式 经验

Disco - 基于MapReduce的分布式计算框架 经验

如何将 MongoDB MapReduce 速度提升 20 倍 经验

MapReduce超大集群的简单数据处理 文档

Spark vs. MapReduce 时间节约66%，计算节约40% 资讯

Google MapReduce原文 的相关搜索

关键词

MapReduce模式、算法和用例资讯

MapReduce程序reduce输出控制经验

CG_Hadoop：基于MapReduce的计算几何经验

基于MapReduce编程模型的图计算框架经验

Spark 是否真的比 MapReduce 技高一筹资讯

Mapreduce任务实现邮件监控代码段

HBase常用功能和HBase+MapReduce使用总结经验

hadoop mapreduce核心功能描述经验

MapReduce的组合式，迭代式，链式经验

MapReduce中combine、partition、shuffle的作用是什么经验

MapReduce 超大机群上的简单数据处理文档

MapReduce 四种基本设计模式经验

Disco - 基于MapReduce的分布式计算框架经验

如何将 MongoDB MapReduce 速度提升 20 倍经验

MapReduce超大集群的简单数据处理文档

Google MapReduce原文的相关搜索