P8

  HDFS+MapReduce+Hive十分钟快速入门 文档

本文的目的是让一个从未接触Hadoop的人,在很短的时间内快速上手,掌握编译、安装和简单的使用。

xnbw 2016-01-12   418   0
P6

  HBase实例 文档

HBase的一个典型例子. // You need a configuration object to tell the client where to connect. // But don't worry, the defaults are pulled from the local config file. HBaseConfiguration config = new HBaseConfiguration(); // This instantiates an HTable object that connects you to the "myTable" // table. HTable table = new HTable(config, "myTable");

xnbw 2016-01-12   1920   0
P2

  hive安装与加载数据 文档

确定版本,hive的安装版本必须与本机hadoop的安装版本相同,要知道hive的安装版本可以登录

xnbw 2016-01-12   304   0
P102

  数据结构C语言版题集答案打印版 文档

数据结构(c语言版)习题集答案第1章绪论1.1简述下列术语:数据,数据元素、数据对象、数据结构、存储结构、数据类型和抽象数据类型。解:数据是对客观事物的符号表示。在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。数据元素是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。数据对象是性质相同的数据元素的集合,是数据的一个子集。数据结构是相互之间存在一种或多种特定关系的数据元素的集合。存储结构是数据结构在计算机中的表示。数据类型是一个值的集合和定义在这个值集上的一组操作的总称。抽象数据类型是指一个数学模型以及定义在该模型上的一组操作。

梦亦霏雨 2016-01-11   3857   0
P40

  数据结构试题集(包含答案_完整版) 文档

第一章概论一、选择题1、研究数据结构就是研究(D)。A.数据的逻辑结构B.数据的存储结构C.数据的逻辑结构和存储结构D.数据的逻辑结构、存储结构及其基本操作2、算法分析的两个主要方面是(A)。A.空间复杂度和时间复杂度B.正确性和简单性C.可读性和文档性D.数据复杂性和程序复杂性3、具有线性结构的数据结构是(D)。A.图B.树C.广义表D.栈4、计算机中的算法指的是解决某一个问题的有限运算序列,它必须具备输入、输出、(B)等5个特性。

梦亦霏雨 2016-01-11   4353   0
P13

  数据结构C语言版期末考试复习试题 文档

《数据结构与算法》复习题一、选择题。1.在数据结构中,从逻辑上可以把数据结构分为C。A.动态结构和静态结构B.紧凑结构和非紧凑结构C.线性结构和非线性结构D.内部结构和外部结构2.数据结构在计算机内存中的表示是指A。A.数据的存储结构B.数据结构C.数据的逻辑结构D.数据元素之间的关系3.在数据结构中,与所使用的计算机无关的是数据的A结构。A.逻辑B.存储C.逻辑和存储D.物理4.在存储数据时,通常不仅要存储各数据元素的值,而且还要存储C。A.数据的处理方法B.数据元素的类型C.数据元素之间的关系D.数据的存储方法5.在决定选取何种存储结构时,一般不考虑A。A.各结点的值如何B.结点个数的多少C.对数据有哪些运算D.所用的编程语言实现这种结构是否方便。

梦亦霏雨 2016-01-11   7017   0
P59

  数据结构C语言版部分习题及答案 文档

第二章习题与解答一判断题1.线性表的逻辑顺序与存储顺序总是一致的。2.顺序存储的线性表可以按序号随机存取。3.顺序表的插入和删除操作不需要付出很大的时间代价,因为每次操作平均只有近一半的元素需要移动。4.线性表中的元素可以是各种各样的,但同一线性表中的数据元素具有相同的特性,因此是属于同一数据对象。5.在线性表的顺序存储结构中,逻辑上相邻的两个元素在物理位置上并不一定紧邻。6.在线性表的链式存储结构中,逻辑上相邻的元素在物理位置上不一定相邻。7.线性表的链式存储结构优于顺序存储结构。8.在线性表的顺序存储结构中,插入和删除时,移动元素的个数与该元素的位置有关。

梦亦霏雨 2016-01-11   3195   0
P26

  数据结构C语言版_总复习习题与指导 文档

数据结构总复习一、基本要求掌握的知识点如下:⑴ 线性表、顺序表和链表。要求掌握线性表的概念,两种存储结构的实现、优缺点及两种存储结构上的基本操作。⑵ 栈与队列。要求掌握栈和队列的概念,顺序栈、链栈的操作,栈的应用,循环队列、循环链队列的操作。⑶ 串的基本运算和模式匹配。掌握串的基本运算的含义,了解模式匹配算法和时间复杂度。⑷ 多维数组和广义表。掌握多维数组及特殊矩阵的地址公式,广义表的运算和存储。⑸ 树和二叉树。树、二叉树的定义、术语,二叉树的性质、存储、遍历、应用,线索二叉树的概念,树与二叉树的关系。⑹ 图的存储及其操作。

梦亦霏雨 2016-01-11   2602   0
P67

  云计算pig的使用 文档

云计算pig使用Hadoop的普及和其生态系统的不断壮大并不令人感到意外。Hadoop不断进步的一个特殊领域是Hadoop应用程序的编写。虽然编写Map和Reduce应用程序并不十分复杂,但这些编程确实需要一些软件开发经验。ApachePig改变了这种状况,它在MapReduce的基础上创建了更简单的过程语言抽象,为Hadoop应用程序提供了一种更加接近结构化查询语言(SQL)的接口。因此,您不需要编写一个单独的MapReduce应用程序,您可以用PigLatin语言写一个脚本,在集群中自动并行处理与分发该脚本。PigLatin示例让我们从一个简单的Pig示例开始介绍,并剖析该示例。

xnbw 2016-01-11   2358   0
P6

  通讯录管理系统C++源代码详解 文档

实现通讯录管理系统任务:自学C语言中有关链表及外部文件的内容,设计出通讯录管理系统。要求如下所述:  建立通讯录信息,信息至少包含编号、姓名、年龄、电话、通讯地址、电子邮箱等; 能够提供添加、删除和修改通讯录信息的功能; 能够提供按不同方式查询的功能;如按姓名或年龄、电话等查询; 将通讯录保存在文件中;   能够按表格方式输出通讯录信息。 要求:②  根据以上功能需求,自己定义单链表结点的存储结构;③  为了保证所有的数据可以长期被使用,要求程序能将相关数据存储在外部数据文件中,具体数据格式和文件名、路径等自定;④  提供友好的用户界面,方便用户操作。

张睿 2016-01-11   3453   0
P113

  云计算apache HIVE的使用 文档

Hive概述Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据。同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作。Hive没有专门的数据格式。Hive可以很好的工作在Thrift之上,控制分隔符,也允许用户指定数据格式。由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库

xnbw 2016-01-11   2024   0
P3

  在eclipse中开发hbase程序的方法 文档

将hbase目录中的lib中的jar包导入,然后将src目录中的java下的包导入。

xnbw 2016-01-11   589   0
P19

  zookeeper使用简介 文档

zoomkeeper分布式协作场景一有这样一个场景:系统中有大约100w的用户,每个用户平均有3个邮箱账号,每隔5分钟,每个邮箱账需要收取100封邮件,最多3亿份邮件需要下载到服务器中(不含附件和正文)。用20台机器划分计算的压力,从多个不同的网路出口进行访问外网,计算的压力得到缓解,那么每台机器的计算压力也不会很大了。通过我们的讨论和以往的经验判断在这场景中可以实现并行计算,但我们还期望能对并行计算的节点进行动态的添加/删除,做到在线更新并行计算的数目并且不会影响计算单元中的其他计算节点,但是有4个问题需要解决,否则会出现一些严重的问题:20台机器同时工作时,有一台机器down掉了,其他机器怎么进行接管计算任务,否则有些用户的业务不会被处理,造成用户服务终断。随着用户数量增加,添加机器是可以解决计算的瓶颈,但需要重启所有计算节点,如果需要,那么将会造成整个系统的不可用。

xnbw 2016-01-11   611   0
P4

  一个hive hbase hdoop+eclipse的实例 文档

hbase,hive,hadoop一个演示的例子。

xnbw 2016-01-11   472   0
P2

  Zookeeper注意几点 文档

Zookeeper作为一个分布式的服务框架,主要用来解决分布式集群中应用系统的一致性问题,它能提供基于类似于文件系统的目录节点树方式的数据存储,但是Zookeeper并不是用来专门存储数据的,它的作用主要是用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理ZooKeeper是否对ZNode有大小限制如果你仔细看过ZooKeeper的文档,会发现文档中对ZNode的大小做了限制,最大不能超过1M。

xnbw 2016-01-11   2364   0
P11

  zookeeper分布式安装手册 文档

一、安装准备1、下载zookeeper-3.3.1,地址:http://www.apache.org/dist/hadoop/zookeeper/zookeeper-3.3.1/2、JDK版本:jdk-6u20-linux-i586.bin3、操作系统:Linux 4、默认前提是安装完hadoop0.20.2版本:192.168.3.131 namenode   192.168.3.132 datanode   192.168.3.133datanode二、操作步骤(默认在namenode上进行)1、拷贝以上文件到Linux的“/usr/”目录下。同时新建目录“/zookeeper-3.3.1”。

xnbw 2016-01-11   2568   0
P62

  HIVE学习笔记 文档

HIVE结构Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言,称为QL,它允许熟悉SQL的用户查询数据。同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作。HIVE架构Hive的结构可以分为以下几部分:用户接口:包括CLI,Client,WUI元数据存储。通常是存储在关系数据库如mysql,derby中解释器、编译器、优化器、执行器Hadoop:用HDFS进行存储,利用MapReduce进行计算用户接口主要有三个:CLI,Client和WUI。其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端,用户连接至HiveServer。

xnbw 2016-01-11   2576   0
P23

  Hbase 分析报告白皮书 文档

Hbase分析报告本文基于环境 hadoop-0.16.4和hbase-0.1.3编写Hbase是一个分散式开源数据库,基于Hadoop分散式文件系统,模仿并提供了基于Google文件系统的Bigtable数据库的所有功能。Hbaes的目标是处理非常庞大的表,可以用普通的计算机处理超过10亿行资料,并且有数百万列元素组成的资料表。Hbase可以直接使用本地文件系统或者Hadoop作爲资料存储方式,不过爲了提高资料可靠性和系统的健壮性,发挥Hbase处理大资料量等功能,需要使用Hadoop作爲文件系统,那麽我们就先要了解Hadoop文件系统的基本特性和原理,才能更好地理解Hbase的工作方式。Hadoop文件系统Hadoop文件系统是一个能够兼容普通硬件环境的分散式文件系统,和现有的分散式文件系统不同的地方是Hadoop更注重容错性和兼容廉价的硬设备,这样做是爲了用很小的预算甚至直接利用现有机器就实现大流量和大资料量的读取。

xnbw 2016-01-11   338   0
P14

  Hbase shell操作命令 文档

Hbase shell下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBaseShell命令,如下: 一、一般操作1.查询服务器状态hbase(main):024:0>status3servers,0dead,1.0000averageload 2.查询hive版

xnbw 2016-01-11   2075   0
P18

  hbase 简介 文档

Hbase是bigtable的开源山寨版本。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(rowkey)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。HBase中的表一般有这样的特点:1大:一个表可以有上亿行,上百万列2面向列:面向列(族)的存储和权限控制,列(族)独立检索。

xnbw 2016-01-11   1539   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档