P25

  Hive 使用手册 文档

而外部表,则是通过Hive建立表的Metadata提供一些数据查询服务,比如一些HDFS文件,Pig,Hbase的文件都可以通过Hive进行批处理和查询。CREATE TABLE IF NOT EXISTS mydb

dacoolbaby 2013-03-13   4915   0
P150

  Hadoop 介绍 文档

进化MapReduce是offline应用 基于HDFS的HBase是online应用 48. 进化MapReduce是offline应用 基于HDFS的HBase是online应用 49. 比较 选择Baidu

tony2007 2015-06-20   625   0

CG_Hadoop:基于MapReduce的计算几何 经验

度者,当所有的存储和空间查询处理通过运行在集群节点上的空间DBMS实例。(3)MD-HBase[27]扩展了HBase去支持多维索引,允许非常高 效的使用范围和字段式查询检索点。(4)通过格网文件和R-

jopen 2016-01-05   23913   0
P150

  Hadoop 入门 文档

进化MapReduce是offline应用 基于HDFS的HBase是online应用 59. 进化MapReduce是offline应用 基于HDFS的HBase是online应用 60. 比较 选择baidu

robinzhang 2012-03-22   713   0

这些年,我工作上走过的路 资讯

从那个时候起,一直到2014年11月,我们终于完整的构建了一个数据支撑平台。 Hadoop/Spark/HBase 体系,支撑BI,数据离线分析,推荐协同计算等 分布式索引服务,支撑搜索,数据平台供查询数据的存储

jopen 2016-01-31   42991   0
P47

  MongoDB开发使用手册 文档

系统:支持高并发,及时响应,并能够实现分布式计算 NOSQL:Memcached, Redis, Hbase, 等NOSQL数据库,不仅仅是简单缓存,并能够提供分布式要求,包括复制,分片,水平分区,并提供复杂格式的数据存储

huafenged 2012-07-20   514   0
P50

  Hadoop 实战手册 文档

bihuman.com dfs.support.append FALSE 支持文件append,主要是支持hbase mapred-size.xml Name Value 说明 mapred.job.tracker

ka520 2015-11-14   434   0
P150

  Hadoop 介绍 文档

进化MapReduce是offline应用 基于HDFS的HBase是online应用 59. 进化MapReduce是offline应用 基于HDFS的HBase是online应用 60. 比较 选择baidu

pnx8 2014-08-17   388   0

码农周刊分类整理 经验

性能测试:SequoiaDB vs. MongoDB vs. Cassandra vs. HBase(云知秋) Bugsnag 的 MongoDB 分片集群使用经验(郭蕾) MYSQL

jopen 2014-11-17   156771   0

身为码农,为12306说两句公道话 资讯

版)、数据库(MySQL 内核 taobao 版,google 和 facebook 也有自己的版本,HBase 淘宝版、还有自己全部从头开发的 OceanBase)、负载均衡器(LVS,LVS 始创人就在淘宝,担任研究员)、Java

jopen 2014-01-11   20938   0

大数据常见术语表 资讯

一个开源的分布式系统基础框架,可用于开发分布式程序,进行大数据的运算与存储。 Hadoop数据库(HBase) – 一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用 HDFS – Hadoop分布式文件系统(Hadoop

jopen 2015-02-22   47724   0

Spark的RDD原理以及2.0特性的介绍 经验

集群和 Spark 平台的运营与研发。曾负责 Intel Hadoop 发行版的 Hive 及 HBase 版本研发。参与过百度用户行为数据仓库的建设和开发,以及淘宝数据魔方和淘宝指数的数据开发工作。给

di742088 2016-05-19   68140   0
P15

  分布式服务框架 Zookeeper - 管理分布式环境中的数据 文档

集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它管理 Hadoop 集群中的 NameNode,还有 Hbase 中 Master Election、Server 之间状态同步等。 本文介绍的 Zookeeper

louiscool 2012-04-25   5139   0

图数据库——大数据时代的高铁 经验

适合于保存在关系型数据库中的结构化数据。 虽然图数据库也能够处理“大数据”,但它毕竟不是Hadoop、HBase或Cassandra,通常不会在图数据库中直接处理海量数据(以PB为单位)的分析。但如果你乐于提

一位资深程序员大牛给予Java初学者的学习路线建议 经验

定是相关的。而且在研究一门新技术时,切忌朝三暮四。有的同学今天去整整大数据,搞搞Hadoop、hbase一类的东西。过不了一段时间,就觉得没意思,又去研究分布式缓存,比如redis。然后又过不了一段时

ThedaSdf 2017-07-18   29296   0

阿里云观察2014 资讯

项目为此划上了一个休止符。此后,阿里云作为集团的统一技术平台,已经成为上上下下的共识。最近,几千台的 HBase 集群也在往 OTS 上迁移。淘宝、天猫、支付宝的负责人,现在已经主动提出,要将核心系统迁移到阿里云提上日程。

jopen 2014-10-10   30784   0
P15

  分布式服务框架 Zookeeper 管理分布式环境中的数据 文档

集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它管理 Hadoop 集群中的 NameNode,还有 Hbase 中 Master Election、Server 之间状态同步等。 本文介绍的 Zookeeper

caoxin1106 2012-04-16   4829   0

Spark 入门(Python、Scala 版) 经验

(1)定义一个或多个RDD,可以通过获取存储在磁盘上的数据(HDFS,Cassandra,HBase,Local Disk),并行化内存中的某些集合,转换(transform)一个已存在的RDD,或者,缓存或保存。

efbb 2015-05-08   210961   0

用Apache Spark进行大数据处理——第一部分:入门介绍 经验

Spark用HDFS文件系统存储数据。它可用于存储任何兼容于Hadoop的数据源,包括HDFS,HBase,Cassandra等。 API : 利用API,应用开发者可以用标准的API接口创建基

jopen 2015-04-02   62295   0

分布式服务框架 Zookeeper -- 管理分布式环境中的数据 经验

集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它管理 Hadoop 集群中的 NameNode,还有 Hbase 中 Master Election、Server 之间状态同步等。 本文介绍的 Zookeeper

jopen 2015-07-11   18278   0
1 2 3 4 5 6 7 8 9 10