P37

  淘宝Hive分享 文档

其实HIVE就是一个SQL解析引擎,它将SQL语句转译成M/R JOB然后在Hadoop执行,来达到快速开发的目的。拨开HIVE的神秘面纱之后来看它的表其实就是一个Hadoop的目录/文件(HIVE默认表存放路径一般都是在你工

copen 2011-08-09   519   0
P12

  HBase Architecture(译):上 文档

方法 Put.setWriteToWAL(boolean) 所设置的flag。WAL是一个标准的Hadoop SequenceFile,里面存储了HLogKey实例。这些keys包含一个序列号和实际的数

lanbocui 2012-08-21   604   0
P29

  海量数据处理的大杀器 - 腾讯分布式数据仓库(TDW) 文档

distributed Data Warehouse 腾讯海量数据处理平台的核心部件 基于开源软件hadoop和hive,大量的优化和改造 7. TDW特性列表(部分)特性说明存储和计算天然容灾集群中个别

andyxiemu 2012-08-13   1111   0
P14

  HDFS小文件处理解决方案总结+facebook(HayStack)+淘宝(TFS) 文档

对于小文件问题,hadoop自身提供了三种解决方案:Hadoop Archive、 Sequence File 和 CombineFileInputFormat (1)      Hadoop Archive

平江夜弹 2012-08-23   5511   0
P5

  Hive性能调校 文档

reducer是1GB,也可以改变这个值。 如何自己评估输入数据的大小? [edward@etl02 ~]$ hadoop dfs -count /user/media6/fracture/ins/* | tail -4

xnbw 2016-01-12   1164   0
P34

  Apache Cassandra 的初步使用及一些简单的操作 文档

配置集群 1 配置集群节点信息 hadoop2 hadoop3 hadoop4 hadoop5 hadoop6 hadoop7 hadoop8 hadoop9 hadoop10 2 配置集群节点之间交互的监听地址

akingde 2012-07-07   878   0
P51

  7种分布式文件系统介绍 文档

些限制,比如一个目录中的最大文件数。你可以放心的使用。 HDFS HDFS简介 HDFS全称是Hadoop Distributed FileSystem。目前HDFS支持的使用接口除了Java的还有,

cellcomcn 2012-09-18   6062   0
P18

  100+经典java面试题及答案解析 文档

北京尚学堂-cctv央视网广告合作伙伴,专业IT培训机构,口碑最好的java培训、iOS培训、android培训、hadoop大数据培训、web前端培训机构,0元入学,先就业后付款,平均就业薪水9500以上 多态是编程语

chi 2017-04-01   667   0
P119

  Hive Data Definition Language 文档

OutputFormat class as a string literal, e.g. 'org.apache.hadoop.hive.contrib.fileformat.base64.Base64TextInputFormat'

xnbw 2016-01-12   1589   0
P57

  大数据中心建设方案 文档

云计算数据中心通过运行在单独的服务器上的云操作系统对服务器、存储、网络等资源进行虚拟化管理,提供可以自定义的虚拟机,在虚拟机上安装Hadoop、hbase等Nosql分布式数据库集群,对现有的数据ETL采集、清洗、转换、汇总进来,使用海

guet_lee 2017-01-12   1207   0
P16

  深度学习及TensorFlow简介 文档

orFlow与HDFS集成示例如下: #配置JAVA和HADOOP环境变量 source $HADOOP_HOME/libexec/hadoop-config.sh export LD_LIBRARY

huafenged 2017-03-09   668   0
P18

  hbase 简介 文档

HBase prototype created as Hadoop contrib 2007.10 First useable Hbase 2008.1 Hadoop become Apache top-level

xnbw 2016-01-11   1539   0
P4

  gartner 2016年数据仓库和数据管理解决方案魔力象限-publicpptx 文档

退出者:惠普 还有几家公司则从挑战者象限进入到了远见者象限,包括Cloudera和MapR,这两家Hadoop发行版公司列入了去年的数据仓库魔力象限数据报告。这意味着“执行力”分数下降,不过“前瞻性”排名上升。

zhonghua98 2016-09-28   2411   0
方案   报告   SQL  
P2

  热点关注:解析云计算的核心技术 文档

,用冗余存储的方式保证数据的可靠性。云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。GFS即Google文件系统(Google File Sy

jq_one 2011-12-06   499   0
P3

  Hive 小结 文档

format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;  #执行Map前进行小文件合并 在开启了org.apache.hadoop.hive.ql.io

cczzhh 2013-12-30   450   0
P5

  Linux中使用eclipse编译nutch-0.9 文档

Linux中使用eclipse编译nutch-0.9 (4)至此,nutch-0.9工程没有错误。 (5)修改配置文件 hadoop-site.xml,单机编译测试不做任何配置。 nutch-default.xml,修改配置参数。

ggyi2003 2011-07-31   475   0
搜索引擎   HTTP   Java   nutch  
P26

  如何让Docker容器在企业中投产 文档

场景2:企业应用商店和一键部署应用12应用上架一键部署 14. BMC Remedy,安装包有十几GB 15. 14Hadoop 集群一键部署Hadoop 集群和一键部署 16. 场景3: 多环境,多资源池的DevOps流水线15Dev

zhu1531 2016-08-02   5529   0
容器  
P31

  HBase - 介绍 文档

Put使用客户端Cache Scan使用Cache/Batch 24. 运维技巧 25. HBASE 部署Hadoop版本 Hadoop 0.20.x Append补丁 ZooKeeper Metric 内存 RegionServer

liu2511981 2012-05-17   4773   0
P31

  HBase 介绍 文档

Put使用客户端Cache Scan使用Cache/Batch 24. 运维技巧 25. HBASE 部署Hadoop版本 Hadoop 0.20.x Append补丁 ZooKeeper Metric 内存 RegionServer

dfzha 2013-09-27   371   0
P5

  淘宝实时数据传输平台-TimeTunnel介绍 文档

galaxy是一套支持SQL定义业务逻辑的流计算服务化平台 galaxy之于storm,就类似hive之于hadoop的关系 下图为Galaxy的一个架构图: 组件 Time Tunnel大概有几部分组成,TTm

daliao8888 2014-11-26   6634   0
1 2 3 4 5 6 7 8 9 10