MapReduce 四种基本设计模式 经验

这篇文章讨论了 MapReduce design patterns的四种基本设计模式: 1. Input-Map-Reduce-Output 2. Input-Map-Output 3. Input-Multiple

langbo213 2016-10-12   10142   0

Disco - 基于MapReduce的分布式计算框架 经验

Disco是一个基于MapReduce的分布式计算框架。Disco是一个开源项目,由诺基亚研究中心开发用来解决处理大数据时碰到的实际问题。 Disco采用Python开发,具有易于使用,强大的特点

openkk 2012-06-08   32597   0

如何将 MongoDB MapReduce 速度提升 20 倍 经验

厌倦了使用不同的软件来做分析(包括Hadoop),它们显然需要传输大量开销的数据。 MongoDB提供了两种内置分析数据的方法:Map Reduce和Aggregation框架。MR非常灵活,很容

jopen 2013-11-01   33424   0

Spark vs. MapReduce 时间节约66%,计算节约40% 资讯

本文将介绍基于物品的协同过滤推荐算法案例在TDW Spark与MapReudce上的实现对比,相比于MapReduce,TDW Spark执行时间减少了66%,计算成本降低了40%。 本文将介绍基于物品的协同过滤推荐算法案例在TDW

jopen 2014-11-05   17978   0
Spark  

Google开源C/C++版MapReduce框架 资讯

html 据GigaOM 消息 ,Google上周 宣布 ,将自己用C++开发的MapReduce框架 MapReduce for C(MR4C) 开源,此举可给Hadoop社区带来福音,因为这样用户就

jopen 2015-02-24   25467   0

几个可用于数据挖掘和统计分析的java库 经验

WEKA :WEKA是一个可用于数据挖掘任务的机器学习算法集合。该算法可以直接应用到数据集或从自己的Java代码调用。 WEKA包含数据预处理,分类,回归,聚类,关联规则,和可视化工具。它也非常适用于开发新的机器学习方案。

cwf8 2015-01-09   140171   0
P25

  建设银行广东省分行数据挖掘系统建设方案 文档

建设银行广东省分行数据挖掘系统建设方案 一、目标与需求 2003年总行信息工作会议提出将信息中心建设成为数据集散中心、报表处理中心和决策辅助支持中心,成为全行信息资源管理体系的中心和枢纽。信息中心在

tianwenbo 2012-06-20   527   0

百度导航宣布永久免费 方向将是大数据挖掘 资讯

在此前的百度世界大会 LBS 分论坛中,百度方面表示百度导航即将进行全新升级,未来的发展方向将是云技术和大数据挖掘数据显示,百度导航目前拥有 3500 万地标信息,344 个城市卫星图,500 万商户,及 420

jopen 2013-08-28   8366   0
百度  

[机器学习&数据挖掘]机器学习实战决策树plotTree函数完全解析 经验

matplotlib.pyplot as plt #这里是对绘制是图形属性的一些定义,可以不用管,主要是后面的算法 decisionNode = dict(boxstyle="sawtooth", fc="0.8")

jopen 2015-06-24   65773   0

京东发布JDPhone计划 通过数据挖掘定制手机 资讯

日消息,在今日中兴努比亚新品发布会上,京东首次对外公布了“JDPhone 计划”,将通过对消费者的数据挖掘定制手机。 京东副总裁王笑松今日透露了上述计划。王笑松表示,京东已经有一亿以上的注册用户,已经销售

jopen 2013-11-19   10645   0
京东  

Python的网页爬虫&文本处理&科学计&机器学习&数据挖掘工具集 经验

的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品 课程图谱 也是选择了Python系的Fl

jopen 2014-07-29   192610   0
P9

  Java算法 文档

Java算法 Java部分 1.求两个数的最大公约数 解答: 欧几理德原理:辗转相除法 public static int zdgys(int a,int b){ int x = a%b; if(x==0)

binglang 2012-10-26   457   0

Dijkstra算法 代码段

#include <iostream> #include <vector> using namespace std; struct Line { int Vs; int Vt; }; void main() { int i,j,sourse,temp,min,min_node; int node = 8; int inf = 100; int Graph[8][8] = {0, 2, 1, 8,

wcwx 2015-01-03   1106   0
算法  
P6

  算法复习 文档

expression evaluation that computes the value for an expression ((3*5)+6)

gyc 2014-03-11   1650   0

Raft算法 经验

文章中没有多少详细的图片,但是大家可以边看文章边看 Raft演示动画 之前介绍的Paxos算法一直都是分布式一致性协议的标准,但是Paxos难以理解,更难以理解。于是Stanford的教授提出

uh7074 2017-07-26   53576   0
Raft   算法   分布式  
P4

  SVM算法 文档

 SVM算法 SVM 假设空间中有两类点,x1,...xn, 为他们的坐标。y1,...,yn为他们的类别, yi=1 or -1 。如图所示。 SVM试图找到一个超平面w'x+b=0将空间中的两类点分开,且所有点到该平面的最小距离

这个小伙子 2010-10-26   3881   0
P40

  ACBM算法 文档

1. ACBM算法摘要 在有限自动机的多模式匹配算法(DFSA算法)的基础上, 在算法中以连续跳跃的思想,给出了另一个更加有效的改进.在一般情况下,这算法不需要匹配目标文本串中的每个字符,并充分利用了匹配过程中本次匹配不成功的信息

ketlysun 2012-01-06   10543   0
报告   Go  

曲线算法 博客

屏幕画点有几种方法?-- 算法实现

seawater 2010-12-16   2272   0
算法  
P46

  算法与编程 文档

4. 算法与编程 1.判断身份证:要么是15位,要么是18位,最后一位可以为字母,并写程序提出其中的年月日。 答:我们可以用正则表达式来定义复杂的字符串格式,(\d{17}[0-9a-zA-Z]|\

钱太陈 2016-12-10   810   0

EM算法 经验

大多数时候,只要给定数据可以直接用极大似然估计法估计模型参数。但是当模型里含有隐变量的时候,直接求解参数的极大似然估计就会失效。这时就需要用到EM算法来对参数进行迭代求解。EM算法说白了也是求参数的极

jopen 2016-01-18   17229   0
1 2 3 4 5 6 7 8 9 10