使用 Azure、Hadoop 和 Mahout 构建一个推荐系统 经验

,在我介绍HDInsight和Map Reduce模式时以便知道更详细的情况。 幕后 让我们开始吧,先做一些分布式机器学习应用的“数据实验”,酷! 建议 - 记得亚马逊的建议吧?基于历史来预测偏好。 聚类  -

jopen 2013-07-17   33383   0
Hadoop   Mahout  

高性能服务端漫谈 经验

须正视. 处理大数据,基本都离不开分布式计算和分布式存储,这其中以hadoop最为使用广泛和经典。 分布式系统,就离不开计算系统、网络系统、文件系统和数据库系统。 这么多系统,之间又是如何协作的呢?

gww3 2015-05-14   13045   0

基于用户行为动态变化的内部威胁检测方法 资讯

分别针对非序列数据和序列数据进行分析,最后将分析任务部署在基于Hadoop/Mapreduce的分布式处理框架中。 二、动态分类器 引言中我们已经提到,将用户的数据看作随时间变化的数据流时,就会发

jopen 2016-03-04   23280   0

超神们:15 位健在的世界级程序员! 资讯

Lucene 生平: 开发了 Lucene 搜索引擎以及 Web 爬虫 Nutch 和用于大型数据集的分布式处理套件 Hadoop 。一位强有力的开源支持者(Lucene、Nutch 以及Hadoop 都是开源的)。前

jopen 2017-02-14   15094   0
P51

  第1章 java概述 文档

Java成为了世界上最流行的开发语言。Java支持的计算模式,已经成为了互联网的标准编程模式以及分布式企业级应用的事实标准。 詹姆斯·戈士林现任Sun公司副总裁及Sun研究院院士。 4 5. 一. Java的诞生和发展2

梦幻知涯 2013-12-08   2308   0
Java开发   HTTP   HTML   C/C++   Go  

超神们:15 位健在的世界级程序员! 资讯

Lucene 生平: 开发了 Lucene 搜索引擎以及 Web 爬虫 Nutch 和用于大型数据集的分布式处理套件 Hadoop 。一位强有力的开源支持者(Lucene、Nutch 以及 Hadoop 都是开源的)。前

jopen 2015-11-25   19277   0

C++开源库,欢迎补充。 问答

可移植元件),非常方便好用。 特性: * 线程,程序同步及多线程编程高级抽象 * 流及文件系统访问 * 共享库将类加载 * 功能强大的日志和错误报告 * 安全及加密 * 网络编程

openkk 2011-11-11   49289   0
开源协议   ico   C/C++   Perl   Go  

从Hadoop到Spark的架构实践 经验

。 YARN只提供了资源的调度能力,在一个大数据平台,分布式的任务调度系统同样不可或缺。在新的架构中,我们自行开发了一个支持DAG的分布式任务调度系统,结合YARN提供的资源调度能力,从而实现定时

jopen 2015-06-08   49372   0
P6

  大数据下的数据分析平台架构 文档

秀企业级产品也有很多,但基于软硬件的成本原因,目前大多数互联网企业采用Hadoop的HDFS分布式文件系统来存储数据,并使用MapReduce进行分析。本文稍后将主要介绍Hadoop上基于MapReduce的一个多维数据分析平台。

shuixian0626 2012-07-06   4913   0

在Google使用Borg进行大规模集群的管理 1-2 资讯

的大部分都是有一个控制器,可以提交job。前2个框架类似于YARN的应用管理器[76]。我 们的分布式存储系统,例如GFS[34]和他的后继者CFS、Bigtable[19]、Megastore[8]都是跑在Borg上的。

jopen 2015-10-12   11897   0
Google  
P11

  大型网站系统架构分析 文档

有个问题就是各地的访问问题,也许我们的服务器在北京,可能在云南或者海南的访问速度如何解决?如果做分布式,那么我们的文件索引以及架构该如何规划。 接下来讨论大型网站的底层系统架构,来有效的解决上述问题。

简单的海 2012-04-19   5238   0
P209

  AIX 系统管理 文档

显示逻辑卷信息 103 12.6 文件系统 104 12.6.1 文件系统概念 104 12.6.2 文件系统优点 104 12.6.3 AIX 4.3的标准文件系统 105 12.6.4 /etc/filesystems文件

sadade123 2013-04-11   2505   0
IBM AIX  
P31

  Web的安全 文档

识别和管理网络用户的机制是不可靠的,存在着严重的安全漏洞,容易被欺骗。 (4)Internet是分布式的网络,不存在中央监控管理机制,也没有完善的法律和法规,因此无法对Internet犯罪进行有效地处理。

linye1779 2011-10-25   4991   0
方案   Apache   CSS   SQL  
P65

  《Java网络编程入门》教学用ppt 文档

具备面向对象的四大特点:抽象、封装、继承和 多态。 Distributed ( 丰富的网络编程功能-分布式轻松处理TCP/IP,通过URL访问远地资源;字节码可来自网络) 8. Java语言的特点Interpreted

836525600 2014-01-11   2376   0
Java开发   教学   HTML   C/C++   Go  

构建需求响应式亿级商品详情页 经验

1、之前架构的问题存在容量问题,很快就会出现无法全量静态化,还是需要动态渲染;不过对于全量静态化可以通过分布式文件系统解决该问题,这种方案没有尝试; 2、最主要的问题是随着业务的发展,无法满足迅速变化、还有一些变态的需求。

ArlV57 2015-08-14   17951   0

如何打造百亿级数据处理量的弹性调度容器平台 经验

牛的业务发展。 第三是因为 Mesos 的简单性,开放性及可扩展性,Mesos 是一个开源的分布式弹性资源管理系统,整个 Mesos 系统采用了双层调度框架:第一层由 Mesos 收集整个数据中心

l631440866 2016-11-08   8698   0
P33

  分布计算中的hadoop编程技术 文档

Google的研究人员受到函数式编程语言(functional language)的启发,在总结大量的大规模分布式处理程序共同特征的基础上,提出了MapReduce并行程序框架。 MapReduce是一大类大规模

sts2008 2010-12-02   4916   0
P150

  linux基础教程 文档

第1章 操作系统概述 第2章 处理机管理 第3章 存储管理 第4章 调度 第5章 设备 第6章 文件系统 3. 第2部分 操作系统命令及shell编程 第7章 Linux基本命令 第8章 使用vi编辑文件

言己寂静 2017-03-27   2746   0
Linux   方案   报告   手册   Apache  
P150

  Linux 基础教程(清华课件) 文档

第1章 操作系统概述 第2章 处理机管理 第3章 存储管理 第4章 调度 第5章 设备 第6章 文件系统 4. 第2部分 操作系统命令及shell编程 第7章 Linux基本命令 第8章 使用vi编辑文件

king2015 2015-11-15   3838   0
Linux   方案   报告   手册   Apache  
P54

  NoSql 数据库详细介绍入门经典 文档

分区容忍性(分布式) 10年前,Eric Brewer教授指出了著名的CAP理论,后来Seth Gilbert 和 Nancy lynch两人证明了CAP理论的正确性。CAP理论告诉我们,一个分布式系统不可

freesian 2013-01-16   596   0
1 2 3 4 5 6 7 8 9 10