Python版的一个计算好友相似度的MapReduce实现 经验

这种实现的算法复杂度是O(N^2*M*2),其中N表示用户规模,M表示计算共同好友的两名用户添加的最小好友数。经测算,大概每名用户需要5s的计算时间。 而MapReduce就是把原来一步能完成的工作切成了三步,mapper

jopen 2013-05-09   21292   0

MapReduce编程模型的一个轻量级实现:Mrs 经验

Mrs是MapReduce编程模型的一个轻量级实现,但同样拥有高性能,可用于并行计算。它专门为计算密集型程序优化,特别是那些拥有迭代的程序。它的目标是可以简单的安装和使用。Mrs采用 Python 开发,支持Python

jopen 2012-09-21   18312   0
P31

  第三章:MapReduce 分布式计算系统 文档

第3章:MapReduce—分布式计算系统 3.1. MapReduce是什么? Python中的map和reduce 如果我们把MapReduce拆开看,就是两个单词map和reduce。在本书中

beat_it 2013-11-16   1837   0
P8

  HDFS+MapReduce+Hive十分钟快速入门 文档

HDFS+MapReduce+Hive十分钟快速入门 HDFS+MapReduce+Hive十分钟快速入门 一见 2009-8-19 1. 前言 本文的目的是让一个从未接触Hadoop的人,在很短的

xnbw 2016-01-12   418   0

Spark 数据挖掘 - 利用决策树预测森林覆盖面积 资讯

Spark 数据挖掘—利用决策树预测森林覆盖面积 1 前言 预测问题记住一点:最垃圾的预测就是使用平均值,如果你的预测连比直接给出平均值效果都要差,那就省省吧! 统计学诞生一个多世纪之后,随着

jopen 2015-11-03   32268   0
Spark  
P53

  《深度挖掘:oracle rac数据库架构分析与实战攻略》第3章 存储和网络传输 文档

RAID(独立冗余磁盘阵列是)指由多个独立硬盘结合形成的一个较大的逻辑阵列。数据存储在磁盘的此阵列并带有附加的冗余信息。冗余信息可以是数据本身(镜像),也可以是从多个数据块(RAID4或RAID5)计算出的奇偶校验信息。使用

lc_lichm 2014-04-09   1560   0
P80

  《深度挖掘:Oracle RAC数据库架构分析与实战攻略》第8章 RAC性能优化设计 文档

Oracle的数据分区是一种处理超大型表、索引等的技术。分区是一种“分而治之”的策略,通过将大表和索引分成可以管理的小块,从而避免了对每个表作为一个大的、单独的对象进行管理,为大量数据提供了可伸缩的性

疯中静思 2012-06-04   3211   0
P56

  《深度挖掘:Oracle RAC数据库架构分析与实战攻略》第9章 Oracle最高可用架 文档

Oracle高可用相关功能的产品概述 因为高可用的范围定义太广泛,本书只讨论与Oracle数据库有关系的高可用设计,如数据库主机的错误、数据所在的存储错误、介质损坏以及主机与数据的冗余保护等,并不讨论应用层的设计,Oracle 提供支持高可用相关产品主要有下面几种。

疯中静思 2012-06-04   3421   0

只靠大数据挖掘还不够,Facebook 雇佣了600人的团队帮你人工筛选信息流 资讯

目目前还在扩大的范围,未来会有更多的人加入,最终希望在自动化技术飞快发展的当 下,能够真正地通过数据挖掘来完成最终的智能化推荐。 [本文参考以下来源: thenextweb.com , wired

jopen 2015-02-01   10968   0
P34

  数据挖掘技术在婴幼儿营养状况评估中的应用研究 文档

 数据挖掘技术在婴幼儿营养状况评估中的应用研究 声 明 创新性声明 我们所呈交的论文是我们小组所有成员在代课老师指导下进行的研究成果。除了文中特别加以标注的内容以外,论文中不包含其他人已经发表或撰写过的研究成果。

fujita731 2012-12-13   2021   0

让文献上的算法走进真实世界,打造算法的“App Store” 资讯

算法正在改变世界。 每天打开的网页和应用,无一不是强大的算法在背后运转,决定你看到什么、喜欢什么、看什么样的书、交什么样的朋友,甚至过怎样的生活…… 但是,对于开发者们来说,这还不够。日益膨胀

jopen 2014-08-21   8089   0
算法  

最小生成树(普利姆算法、克鲁斯卡尔算法 经验

求最小生成树的算法 (1) 克鲁斯卡尔算法 图的存贮结构采用边集数组,且权值相等的边在数组中排列次序可以是任意的.该方法对于边相对比较多的不是很实用,浪费时间. (2) 普里姆算法 图的存贮结构采用邻接矩阵

xb3b 2015-05-31   50127   0
算法  

【人人都要学算法】网络流算法远比你想的要好玩 经验

队不论多么努力,他们都将会与冠军无缘~。 来自:http:/www. nhang.com/2015/11/17/【人人都要学算法】网络流算法远比你想的要好玩/

jopen 2015-11-17   14758   0
算法  

你应该知道的算法1-敏感词过滤算法 经验

有很多算法来处理这个问题,个人看了些资料后觉得“字符串多模式精确匹配”(脏字/敏感词汇搜索算法)——TTMP算法是一种比较实用的方法,每个做web的人都应该有所了解 在这片文章中对这个算法有较详尽的解释了,推荐大家去看原文:

selience 2016-01-22   15343   0
算法  

C++算法之克鲁斯卡尔算法 代码段

克鲁斯卡尔算法是计算最小生成树的一种算法。和prim算法(上,中,下)按照节点进行查找的方法不一样,克鲁斯卡尔算法是按照具体的线段进行的。现在我 们假设一个图有m个节点,n条边。首先,我们需要把m个节

jopen 2015-06-24   4439   0
算法  
P13

  从零开始学算法:十种排序算法介绍 文档

从零开始学算法:十种排序算法介绍(上) Program Impossible | 2007-03-31 23:23| 17 Comments | 本文内容遵从CC版权协议 转载请注明出自matrix67

LuckyLiu 2011-08-24   515   0
P9

  java加密算法(六)——数字签名算法DSA 文档

DSA-Digital Signature Algorithm 是Schnorr和ElGamal签名算法的变种,被美国NIST作为DSS(DigitalSignature Standard)。简单的说,

wubin 2013-07-16   461   0
P8

  java加密算法(二)——对称加密算法DES&AES 文档

接下来我们介绍对称加密算法,最常用的莫过于DES数据加密算法。 DES DES-Data Encryption Standard,即数据加密算法。是IBM公司于1975年研究成功并公开发表的。DES算法的入口参数

wubin 2013-07-16   665   0

五大常用算法之二:动态规划算法 经验

决策中可能被多次使用到。(该性质并不是动态规划适用的必要条件,但是如果没有这条性质,动态规划算法同其他算法相比就不具备优势) 四、求解的基本步骤 动态规划所处理的问题是一个多阶段决策问题,一般由初

jopen 2015-02-02   19853   0
算法  

关于寻路算法的一些思考(1):A*算法介绍 资讯

英文原文: Amit’s Thoughts on Pathfinding 物体的移动算法似乎显得很简单,然而寻路规划问题却十分复杂。考虑下面这个例子: 这个单位的初始位置在地图的下方,想要

jopen 2014-06-26   10644   0
算法  
1 2 3 4 5 6 7 8 9 10