Apache Spark 1.3发布,新增Data Frames API,改进Spark SQL和MLlib 资讯

aFrame还提供与SQL中的查询类似的过滤、分组或计算聚合等操作。 DataFrames与分布式SQL查询引擎Spark SQL结合紧密。可以通过SQL查询结果集或RDD构建DataFrames,也可以从

jopen 2015-03-24   23841   0
P12

  用Linux和Apache Hadoop进行云计算 文档

集群,以及如何创建在 Hadoop 上运行的示例 MapReduce 应用程序。还将讨论如何在云上设置耗费时间/磁盘的任务。 云计算简介 近来云计算越来越热门了,云计算已经被看作 IT 业的新趋势。云计算可以粗略地定义为

caoyu152152 2011-07-11   583   0
P12

  用 Linux 和Apache Hadoop 进行云计算 文档

集群,以及如何创建在 Hadoop 上运行的示例 MapReduce 应用程序。还将讨论如何在云上设置耗费时间/磁盘的任务。 云计算简介 近来云计算越来越热门了,云计算已经被看作 IT 业的新趋势。云计算可以粗略地定义为

wwqu1020 2012-09-13   3133   0
P65

  Springside3.3.2技术参考手册 文档

Hibernate笔记。      这里使用了ehcache cache方案, 支持基于JGroups分布式二级缓存,在sessionFactory处配置了ehcache_hibernate.xml的配置文件。关于

openkk 2010-09-25   875   0

Hadoop 之 MapReduce 框架演变详解 经验

台的瘫 痪,当然,在实际中大部分通过一个JobTracker slaver来解决。但是,在一个以分布式运算为特性的框架中,将这种核心的计算集中与一台机器不是一个最优的方案。 2、 可扩展性 ,同样,在上面的架构图中可以看到,Job

jopen 2015-12-16   14385   0
P13

  Android 项目开发实训大纲 文档

这样才能真正做到理论指导实践,实践反过来促进理论的发展,使理论得以升华。 通过实训教学,使学生学会应用所学知识对实践任务进行充分分析、抽象,建立与之相适应的模式,使问题最终在计算机上得以实现。在这个过程中,学生不仅对所学知识加深了理解

wj20080808 2014-12-17   622   0
P49

  JBPM4工作流介绍 文档

什么是工作流?12工作流: 在一个工作群组中,为了达成某一个共同目的而需要多人协力以串行或平行工作的形式来共同完成的任务。要点: 任务。 多人。 共同的。 13. 出差费用申请流程13 14. 什么是工作流引擎?14工作流引擎:

zxcvbnm647 2011-08-12   512   0

Apache Mesos和数据中心操作系统的崛起 资讯

署在集群上的应用程序和计划任务。最后,我将讨论 Mesosphere 是如何结合所有这些来创建数据中心范围内的操作系统,并以Mesos为核心。 MESOS - 分布式内核 无论你正在你的笔记本

jopen 2015-12-19   21663   0
P43

  企业大数据解决方案v1.3 文档

Corporation第 14 页泽佳大数据解决方案体系数据 多样性 模式动态模式HDFS分布式文件系统Hbase分布式列存储系统Sybase ESP事件流处理器Hdoop MapReduceBig Data

guet_lee 2017-01-12   711   0

hadoop框架详细分析 经验

mapreduce是一种模式,一种什么模式呢?一种云计算的核心计算模式,一种分布式运算技术,也是简化的分布式编程模式,它主要用于解决问题的程序开发模型,也是开发人员拆解问题的方法。 如下图所示

jopen 2013-11-28   306378   0

linux crontab 命令详细用法及示例 经验

前 一天学习了 at 命令是针对仅运行一次的任务,循环运行的例行性计划任务,linux系统则是由 cron (crond) 这个系统服务来控制的。Linux 系统上面原本就有非常多的计划性工作,因此这个系统服务是默认启动的。另外

jopen 2013-09-14   15648   0
Linux  

nginx+iis实现负载均衡 经验

com/yanweidie/p/4658136.html 最近在研究分布式系统架构方面的知识,包括负载均衡,数据库读写分离,分布式缓存redis等。本篇先从负载均衡服务架构入手,关于负载均衡百度 百科

ydx3 2015-07-19   27016   0
P20

  Google MapReduce中文版 文档

集群中计算机之间必要的通信。采用MapReduce架构可以使那些没有并行计算和分布式处理系统开发经验的程序员有效利用分布式系统的丰富资源。   我们的MapReduce实现运行在规模可以灵活调整的由普

wujianhai 2011-11-26   5219   0
Go  
P20

  Google MapReduce中文版 文档

集群中计算机之间必要的通信。采用MapReduce架构可以使那些没有并行计算和分布式处理系统开发经验的程序员有效利用分布式系统的丰富资源。   我们的MapReduce实现运行在规模可以灵活调整的由普

suncf1985 2014-05-08   305   0
P65

  Cassandra 概要指南 文档

面向未来 3. NoSql背景 随着互联网大规模的Web2.0应用的兴起,随着云计算需要的大规模分布式服务和分布式存储的发展,传统的关系数据库面临着诸多全新的挑战,特别是在那些超大规模和高并发的SNS类型的

wei5445 2012-03-21   2411   0
P60

  基于Socket的网络数据多机协作采集研究 文档

Java语言简介及其优势 16 3.1.1 面向对象 16 3.1.2 平台无关性 17 3.1.3 分布式 18 3.1.4 可靠性和安全性 18 3.1.5 多线程 19 3.1.6 关于JDK的阐述 19

javapractiseqin 2010-11-25   889   0

谷歌三大核心技术(二)Google MapReduce中文版 经验

群中计算机之间必要的通信。采用MapReduce架构可以使那些没有并行计算和分布式处理系统开发经验的 程序员有效利用分布式系统的丰富资源。 我们的MapReduce实现运行在规模可以灵活调整的由普通机

fmms 2012-02-08   280103   0
P4

  性能测试监控软件需求说明书 文档

1引言 2 1.1编写目的 2 1.2背景 2 1.3定义 2 1.4参考资料 3 2任务概述 3 2.1目标 3 2.2用户的特点 3 2.3假定和约束 3 3需求规定 3 3.1对功能的规定 3

weilong 2012-07-02   3029   0
P16

  亿赞普 Hadoop 应用浅析 文档

从NameNode页面抽取死掉的datanode 分别对上述的死节点执行重启操作 将上述程序放入定时器让其每隔一定时间执行一次 密级:三:Hadoop维护与出现的问题 12. 我的地盘听我的 1) Hadoop权限管理

liushijie 2013-06-25   296   0
P16

  亿赞普Hadoop应用浅析 文档

从NameNode页面抽取死掉的datanode 分别对上述的死节点执行重启操作 将上述程序放入定时器让其每隔一定时间执行一次 密级:三:Hadoop维护与出现的问题 12. 我的地盘听我的 1) Hadoop权限管理

lxz 2014-01-03   625   0
1 2 3 4 5 6 7 8 9 10