P34

  快照技术综述 文档

快照可迅速生成,并可用作传统备份和归档的数据源,缩小甚至消除了数据备份窗口; 快照存储在磁盘上,可以快速直接存取,大大提高数据恢复的速度。

xpddk123 2016-08-31   1710   0
P7

  hdfs命令 文档

1、列出所有Hadoop Shell支持的命令 $ bin/hadoop fs -help 2、显示关于某个命令的详细信息 $ bin/hadoop fs -help command-name 3、用户可使用以下命令在指定路径下查看历史日志汇总 $ bin/hadoop job -history output-dir 这条命令会显示作业的细节信息,失败和终止的任务细节。

开开123 2016-08-08   524   0
P4

  2016年大数据和分析市场的21个趋势预测 文档

随着社交媒体、移动化和云计算的发展,数据分析及相关的技术已经作为一款具有颠覆性的技术在这个数字时代占有了一席之地了。在过去的2015年中,我们已经看到对大数据的分析利用正被一股强大的利用新的数据技术以加强商务智能的推动力推动着由测试步入到了生产阶段。2016年新春伊始,五名业内人士将与您分享他们对于2016年大数据和分析市场趋势的预测。

P4

  大数据集群环境搭建-03 文档

MySQL安装配置 5.1卸载通过yum安装的MySQL yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf rpm -qa|grep mysql ----查看是否还有mysql软件,有的话继续删除 5.2卸载通过rpm安装的MySQL rpm -qa | grep mysql ------ 查找以安装的MySQL

Stone1985 2016-07-28   2429   0
P6

  大数据集群环境搭建-02 文档

Apache Hive 优缺点 优点: (1)Hive 使用类SQL 查询语法, 最大限度的实现了和SQL标准的兼容,大大降低了传统数据分析人员学习的曲线; (2)使用JDBC 接口/ODBC接口,开发人员更易开发应用; (3)以MR 作为计算引擎、HDFS 作为存储系统,为超大数据集设计的计算/ 扩展能力; (4)统一的元数据管理(Derby、MySql等),并可与Pig 、Presto 等共享; 缺点: (1)Hive 的HQL 表达的能力有限,有些复杂运算用HQL 不易表达; (2)由于Hive自动生成MapReduce 作业, HQL 调优困难; (3)粒度较粗,可控性差; (4)hive不支持对某个具体行的操作,hive对数据的操作只支持覆盖原数据和追加数据,也不支持事务。

Stone1985 2016-07-28   566   0
P17

  大数据集群环境搭建-01 文档

本手册包括大数据集群环境搭建的全部环境步骤说明,例如环境准备(操作系统、JAVA环境等)、Hadoop、Spark、NoSQL数据库等。

Stone1985 2016-07-28   3529   0
P31
P61

  Hadoop分享 文档

Hadoop分享: 1、云计算概念 2、Google的云计算 3、Hadoop 4、HDFS 5、Map/Reduce 6、日志框架的Hadoop尝试 7、路在何方

jphnny 2016-06-28   640   0
P36

  Hadoop / MapReduce 讨论与学习 文档

Hadoop 源起: Apache Lucene 开源的高性能全文检索工具包 Apache Nutch 开源的 Web 搜索引擎 Google 三大论文 MapReduce / GFS / BigTable Apache Hadoop 大规模数据处理 Hadoop 核心: Hadoop Common 分布式文件系统HDFS MapReduce框架

jphnny 2016-06-28   3381   0
P57

  企业网云数据中心解决方案ppt 文档

1. 云数据发展趋势 2. 华为云数据解决方案 3. 华为云数据实践

cpuspike 2016-06-10   2270   0
P41

  云计算基础知识 文档

2005年,美国新建立的数据中心需要消耗的能量=加利福尼亚州所消耗能量的10%(大约5GW),约40亿美金。 英国的1500个数据中心每年消耗的能量和英国第十大城市莱卡斯特所需要的能量相当。 2010年,英国单个数据中心每年在能量上的花费达到大约740万英镑。 计算机集群系统由于采用商用化部件,其能耗问题更为突出。 比利时的圣吉兰(Saint Ghislain)数据中心完全依靠数据中心外面的空气来冷却系统。 Dalles数据中心位于俄勒冈州的哥伦比亚河旁,河上的Dalles大坝为数据中心提供电力。数据中心有2座4层楼高的冷却塔。 Google数据中心以集装箱为单位,每个集装箱有1160台服务器,每个数据 中心有众多集装箱。 Google一次搜索查询的能耗能点亮100瓦的灯泡11秒钟。

gosaim 2016-05-20   576   0
P72

  hadoop原理与实践01_v1.0 文档

Hadoop原理与实践Hadoop起源与体系介绍为什么是Hadoop?Hadoop的起源和架构Hadoop能解决什么?Hadoop的体系和版本学习Hadoop的准备Hadoop产生的背景大数据想驾驭这庞大的数据,我们必须了解大数据的特征。

小辉x 2016-05-16   660   0
P7

  hadoop安装指南及基本命令 文档

关闭防火墙: (1) 重启后永久性生效: 开启:chkconfig iptables on 关闭:chkconfig iptables off (2) 即时生效,重启后失效: 开启:service iptables start 关闭:service iptables stop

beauty2003 2016-05-10   416   0
P28

  关于利用大数据促进社会经济发展的研究v14 文档

大数据是互联网发展到现今阶段的一种表象或特征,在以云计算为代表的技术创新大幕的衬托下,原本很难收集和使用的数据开始容易被利用起来,通过不断创新逐步为人类创造更多的价值。

ztx_shane 2016-05-05   2210   0
P4

  告诉你hadoop是什么 文档

Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。

wyc08st 2016-04-30   602   0
P16

  zookeeper 理论及使用 文档

Zookeeper是一个高性能、分布式的开源的分布式应用程序的协作服务。提供一系列简单的功能,分布式应用可以在此基础上实现例如同步、配置管理、集群管理、leaderelection和统一命名服务等等。

dy3168729 2016-04-25   4414   0
P21

  分布式数据同步 文档

南、北数据同步存在延时 南、北专线可能会意外中断 南、北业务都不能中断 本地读取数据一致性不能得到保证 灾备需要

dy3168729 2016-04-24   1637   0
P44

  全面理解阿里云 - 阿里云关系型数据库服务rds产品介绍 文档

关系型数据库服务(Relational Database Service,简称RDS)是阿里云提供的一种稳定可靠、可弹性伸缩的在线数据库服务。RDS采用即开即用方式,兼容MySQL、SQL Server两种关系型数据库,并提供数据库在线扩容、备份回滚、性能监控及分析等功能。 简要介绍: ★ RDS的目标是将耗时费力的数据库管理任务承担下来,使用户能够专心于应用开发和业务发展。用户可根据业务需求对RDS进行弹性伸缩,RDS承诺99.95%的服务可用性和99.9999%的数据可靠性。 ★  RDS目前提供MySQL和SQL Server两种关系型数据库,访问协议完全兼容。用户现有的数据库代码、应用等可直接应用在RDS上,减小重新开发成本。 基础架构: ★RDS采用主从备份架构,拥有3份以上数据存储,具备高可用性和数据可靠性。

lyglyg1394 2016-04-23   773   0
P13

  03实验三搭建openstack云计算环境-vmware 文档

完成本次实验之后,你将能够: • 安装Ubuntu • 在Ubuntu上部署kvm虚拟化平台 • 利用virt-manager安装部署虚拟机 • 创建openstack所需的虚拟环境

gengpei 2016-04-14   580   0
P63

  亚信私有云建设方案v1.0 文档

传统模式: 管理员分散、独立的维护每个应用系统,包括底层硬件、系统软件、操作系统 自动化、智能化程度低,对维护能力要求高、维护强度大 没有统一的管理工具和视图,管理被动 私有云模式: 管理员通过云平台统一管理资源池,资源在各应用系统间动态共享 实现资源的自动化部署、智能化调度,减少管理员手工操作和重复工作 提供统一的管理工具和视图,了解资源实时状态和历史情况,实现主动管理与维护

lyglyg1394 2016-04-12   2078   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档