P5
P16

  cpu并行计算集群设计方案 文档

Hadoop是一个开发和运行处理大规模数据的软件平台,是Apache的一个用java语言实现开源软件框架,Hadoop集群是一种专门为存储和分析海量非结构化数据而设计的特定类型的集群。本质上,它是一种计算集群,即将数据分析的工作分配到多个集群节点上,从而并行处理数据。Hadoop框架中最核心设计就是:HDFS和MapReduce.

勇敢勒小虎 2017-01-10   2568   0
P10

  hadoop&&spark安装教程 文档

本教程使用Ubuntu12.0464位作为系统环境(Ubuntu14.04也行,32位、64位均可),请自行安装系统装好了Ubuntu系统之后,在安装Hadoop前还需要做一些必备工作。

P51
P20

  hadoop个人理解 文档

ymkyve 2016-12-26   2233   0
P2

  big资料 文档

架构师和开发人员通常会使用一种软件工具,用于其特定的用途软件开发。例如,他们可能会说,Tomcat是Apache Web服务器,MySQL是一个数据库工具。

fangunun 2016-12-22   643   0
P14

  zookeeper 初体验 文档

Apache Zookeeper 是由 Apache Hadoop 的 Zookeeper 子项目发展而来,现在已经成为了 Apache 的顶级项目。Zookeeper 为分布式系统提供了高效可靠且易于使用的协同服务,它可以为分布式应用提供相当多的服务,诸如统一命名服务,配置管理,状态同步和组服务等。 Zookeeper 接口简单,开发人员不必过多地纠结在分布式系统编程难于处理的同步和一致性问题上,你可以使用 Zookeeper 提供的现成(off-the-shelf)服务来实现分布式系统的配置管理,组管理,Leader 选举等功能。

beelue 2016-11-14   576   0
P36

  移动大数据技术在互联网金融获客及经营中的应用 文档

移动大数据技术在互联网金融获客及经营中的应用互联网金融面对的?什么是互联网金融互联网金融需要解决的问题案例分析诸多的功能,在客户的喜好和公司利润方面如何平衡?诸多的投放渠道,如何选择,大咖一定高效吗?诸多的页面,页面顺序与客户习惯的关系?诸多的用户,在异常出现时如何在漫天吐槽前发现?诸多的用户,如何精准找到金融产品的目标客户群?解决方案大数据技术以及架构大数据处理技术大数据处理技术传统技术体系和缺陷大集群构建成本高昂多维交叉计算能力低效架构不灵活无法自定义指标数据二义性标实时指标和批指标不一致第一代大数据处理架构:大数据处理技术查询和多维交叉高效率(性能)

neo_yao 2016-11-13   338   0
P24

  大数据分析系统架构 文档

Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。采用Java语言开发,可以部署在多种普通的廉价机器上,以集群处理数量积达到大型主机处理性能。HDFS采用master/slave架构。一个HDFS集群包含一个单独的NameNode和多个DataNode。NameNode作为master服务,它负责管理文件系统的命名空间和客户端对文件的访问。NameNode会保存文件系统的具体信息,包括文件信息、 文件被分割成具体block块的信息、以及每一个block块归属的DataNode的信息。对于整个集群来说,HDFS通过NameNode对用户提供 了一个单一的命名空间。DataNode作为slave服务,在集群中可以存在多个。通常每一个DataNode都对应于一个物理节点。DataNode负责管理节点上它们拥有 的存储,它将存储划分为多个block块,管理block块信息,同时周期性的将其所有的block块信息发送给NameNode。

wzf1118 2016-11-04   2940   0
P11

  hadoop入门教程 文档

第一次搞hadoop,折腾我2天,功夫不负有心人,终于搞好了,现在来分享下,我的环境操作系统:wmv虚拟机中的ubuntu12.04hadoop版本:hadoop-1.0.4(听说是稳定版就下了)eclipse版本:eclipse-jee-indigo-SR2-win321.先安装好jdk,然后配置好jdk的环境变量,在这里我就不累赘了!网上多的是2.安装ssh这个也不用说了

peixy 2016-11-03   551   0
P6

  hbase获取不同版本 文档

在HBase中一个row对应的相同的列只会有一行。使用scan或get得到都是最新的数据,如果我们对这某一row所对应的列进行了更改操作后,并不会多生成一条数据,不会像数据库一样,插入时多生成一条记录,在HBase中对同一条数据的修改或插入都只是put操作,最终看到的都是最新的数据,其它的数据在不同的version中保存,默认是隐藏的,通过时间戳区分,Hbase默认保存最近的三个版本,如何才能看到这些旧版本的数据了?

acmers2008 2016-10-20   4550   0
P18

  zookeeper知识分享 文档

Apache Zookeeper 是由 Apache Hadoop 的 Zookeeper 子项目发展而来,现在已经成为了 Apache 的顶级项目。Zookeeper 为分布式系统提供了高效可靠且易于使用的协同服务,它可以为分布式应用提供相当多的服务,诸如统一命名服务,配置管理,状态同步和组服务等。 Zookeeper 接口简单,开发人员不必过多地纠结在分布式系统编程难于处理的同步和一致性问题上,你可以使用 Zookeeper 提供的现成(off-the-shelf)服务来实现分布式系统的配置管理,组管理,Leader 选举等功能。

sister 2016-10-18   583   0
P2

  spark高手 文档

Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询等方面的所有核心问题,具有完善的生态系统,这直接奠定了其一统云计算大数据领域的霸主地位;

chen_xyun 2016-10-13   2098   0
P39

  最大流算法 文档

这是一个典型的网络流模型。

1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档