P214

hadoop2.8_v2.5.1 文档

本书是关于目前最新Hadoop快速上手的教程。Hadoop自出现以来,就被广泛关注。特别是近几年数据增长量急剧膨胀,加上历史数据。如何处理这些海量数据成为炙手可热的问题。Hadoop的出现,无疑是良药奇方。Hadoop最早从0.x版本到1.x版本,再到2.x版本,发生了很大的变化。伴随hadoop的成长,hadoop已经不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的hadoop生态圈。相信读者会在后面不断的学习过程中,体会到这一点。

wangjianme 2017-12-19   493   1
P0

git小书 文档

ivws 2017-12-11   413   0
P128

  git笔记v1.0 文档

同生活中的许多伟大事件一样,Git 诞生于一个极富纷争大举创新的年代。Linux 内核开源项目有着为数众广的参与者。绝大多数的 Linux 内核维护工作都花在了提交补丁和保存归档的繁琐事务上(1991-2002年间)。到 2002 年,整个项目组开始启用分布式版本控制系统 BitKeeper 来管理和维护代码。

1313108756 2017-12-04   631   0
P65

大数据白皮书(2016年)-中国信息通信研究院 文档

大数据是国家基础性战略资源,是21世纪的‚钻石矿‛。党中央、国务院高度重视大数据在经济社会发展中的作用,提出‚实施国家大数据战略‛,出台《促进大数据发展行动纲要》,全面推进大数据发展,加快建设‚数据强国‛。‚十三五‛时期是我国全面建成小康社会的决胜阶段,是新旧产业和发展动能转换接续的关键时期,全球新一代信息技术产业正处于加速变革期,国内市场应用需求处于爆发期,我国大数据产业发展面临重要的发展机遇。本白皮书是继《大数据白皮书(2014)》之后我院第二次发布大数据白皮书。本白皮书首先回顾和阐述了大数据的内涵及产业界定,并以大数据产业几个关键要素为核心,重点从大数据技术发展、数据资源开放共享、大数据在重点行业的应用、大数据相关政策法规等四个方面分析了最新进展,力求反映我国大数据产业发展状况的概貌。最后结合我国大数据发展最新状况及问题,提出了进一步促进大数据发展的相关策略建议。

wuaini234 2017-10-16   665   0
P9

  减少esxi中虚拟机磁盘占用空间 文档

减少ESXi中虚拟机磁盘占用空间(磁盘ThicktoThin转换)在创建虚拟机时,会有下面三种选项后置备延迟置零:以默认的厚格式创建虚拟磁盘。创建过程中为虚拟磁盘分配所需空间。创建时不会擦除物理设备上保留的任何数据,但是以后从虚拟机首次执行写操作时会按需要将其置零。厚置备置零:创建支持群集功能的厚磁盘。在创建时为虚拟磁盘分配所需的空间。与平面格式相反,在创建过程中会将物理设备上保留的数据置零。创建这种格式的磁盘所需的时间可能会比创建其他类型的磁盘长。精简置备:使用精简置备格式。最初,精简置备的磁盘只使用该磁盘最初所需要的数据存储空间。如果以后精简磁盘需要更多空间,则它可以增长到为其分配的最大容量。如果一开始选择后置备延迟置零或者后置备置零,那么ESXi将完全在硬盘上划分出所需要的空间,这样可能会造成硬盘空间的浪费(比方说CUC安装需要80G的空间。

874075912 2017-10-16   812   0
P64

Apache Storm Tutorial 文档

Storm was originally created by Nathan Marz and team at BackType. BackType is a social analytics company. Later, Storm was acquired and open-sourced by Twitter. In a short time,Apache Storm became a standard for distributed real-time processing system that allows you to process large amount of data, similar to Hadoop. Apache Storm is written in Java and Clojure. It is continuing to be a leader in real-time analytics.

stupid_zww 2017-09-11   476   0
P42

  Rabbitmq 技术培训 文档

我们需要消息中间件吗? · 一切的变化都可以看做是一系列独立事件的变化的组合 · 将峰值熨平,减少对系统的冲击同步转异步,提高吞吐量,量,平换系统的压力 · 解决事件的重发(回放)实现现实中消息的传播方式 · 充当简单的ETL功能,数据流的分发和汇总,通过pipeline的方法处理数据

liuhui_sun 2017-09-05   713   0
P43

零基础学大数据算法-简版电子书 文档

这是一个互联网的时代,也是一个大数据的时代。经常有朋友问起 :什么是大数据?大数据是做什么用的?我们为什么要研究大数据?应该怎么研究大数据?在寻找这些问题的答案时,许多朋友找到的内容常常是专业的概念、复杂的公式和难懂的“算法”,这让他们望而却步。很多计算机专业的新生或低年级学生在听到大数据的概念后对其非常好奇,却因没有足够扎实的专业基础知识而无法认识和理解大数据问题,更无法对大数据问题给出很好的解决办法。于是,笔者决定编写一本新生乃至非专业人士也能读懂的大数据算法教程。

樂鲁伊 2017-08-28   708   0
P23

韩涵-政务大数据-技术发展与标准化 文档

以推行电子政务、建设新型智慧城市等为抓手,以数据集中和共享为 途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、 数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管 理和服务。

georgeyzhg 2017-08-27   375   0
P16

  流媒体服务器说明及开发环境搭建 文档

流媒体指以流方式在网络中传送音频、视频和多媒体文件的媒体形式。相对于下载后观看的网络播放形式而言,流媒体的典型特征是把连续的音频和视频信息压缩后放到网络服务器上,用户边下载边观看,而不必等待整个文件下载完毕。由于流媒体技术的优越性,该技术广泛应用于视频点播、视频会议、远程教育、远程医疗和在线直播系统中.

zhgl 2017-08-20   289   0
P10

  ZooKeeper简介 文档

ZooKeeper 是一个为分布式应用所设计的分布的、开源的协调服务。分布式的应用可以建立在同步、配置管理、选举、分布式锁、分组和命名等服务的更高级别的实现的基础之上。 ZooKeeper 意欲设计一个易于编程的环境,它的文件系统使用我们所熟悉的目录树结构。 ZooKeeper 使用 Java 所编写,但是支持 Java 和 C 两种编程语言。

公子小帆 2017-08-16   901   0
P24

再谈容器应用基石——docker化 文档

Agenda•企业级应用现状•应用Docker化•Docker化实践–日志管理–配置管理–监控

shuibingfy 2017-07-28   396   0
P48

  大数据(离线/实时)计算架构 文档

Flume是Cloudera提供的一个分布式、可靠、和高可用的海量日志采集、聚合和传输的日志收集系统,支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

sum154346 2017-07-25   727   0
P3

  openstack与cloudstack比较 文档

OpenStack是一个美国国家航空航天局和Rackspace合作研发的,以Apache许可证授权,并且是一个自由软件和开放源代码项目。CloudStack是新加入到Apache基金会中的开源云计算平台。CloudStack开发语言为Java,此前为Cloud.com研发应用的商业软件,此后被Citrix思杰收购,2012年4月5日思杰宣布将CloudStack项目提交至Apache基金会,CloudStack成为Apache许可下的完全开源软件。

cmss201706 2017-06-30   459   0
P158

  apache-spark源码走读 文档

在对Spark的源码进行具体的走读之前,如果想要快速对Spark的有一个整体性的认识,阅读Matei Zaharia做的Spark论文是一个非常不错的选择。

bxingqing 2017-06-12   475   0
P8

  kubernetes应用部署模型原理解析 文档

Kubernetes可用来管理Linux容器集群,加速开发和简化运维(即DevOps)。但目前网络上关于Kubernetes的文章介绍性远多于实际使用。本系列文章着眼于实际部署,带您快速掌握Kubernetes。本文为上篇,主要介绍部署之前需要了解的原理和概念,包括Kubernetes的组件结构,以及各个组件角色的功能。

hdu119 2017-06-12   430   0
P16

  基于kubernetes构建docker集群管理详解 文档

Kubernetes 是Google开源的容器集群管理系统,基于Docker构建一个容器的调度服务,提供资源调度、均衡容灾、服务注册、动态扩缩容等功能套件,目前最新版本为0.6.2。本文介绍如何基于Centos7.0构建Kubernetes平台,在正式介绍之前,大家有必要先理解Kubernetes几个核心概念及其承担的功能。

hdu119 2017-06-12   446   0
P57

hbase架构原理 文档

HBase是一个高可靠性、高性能、面向列、可伸缩的分布式数据库,设计目标是用来解决关系型数据库在处理海量数据时的局限性。

rocflysi 2017-06-07   190   0
1 2 3 4 5 6 7 8 9 10