后Hadoop时代的大数据架构 经验

用该语言,可以方便地进行数据汇总,特定查询以及分析存放在Hadoop兼容文件系统中的大数据。 Hbase :一种分布的、可伸缩的、大数据储存库,支持随机、实时读/写访问。 Sqoop :为高效传输批量

b77m 2015-04-22   140189   0

8个值得关注的SQL-on-Hadoop框架 资讯

JDBC 驱动 一个用于从已有数据源中读取数据的“连接器”集合。连接器包括:HDFS、Hive和Cassandra 与Hive metastore交互以实现模式共享 何时使用它? Presto的目标和Cloudera

jopen 2014-07-01   22905   0
Hadoop  

60款顶级大数据开源工具 经验

apache.org/confluence/display/FLUME/Home 7. HBase HBase是为有数十亿行和数百万列的超大表设计的,这是一种分布式数据库,可以对大数据进行随机性的实

jopen 2015-11-14   179651   0

Hadoop和大数据:60款顶级大数据开源工具 资讯

apache.org/confluence/display/FLUME/Home 7. HBase HBase是为有数十亿行和数百万列的超大表设计的,这是一种分布式数据库,可以对大数据进行随机性的实

jopen 2015-10-23   46305   0
Hadoop  

60款与Hadoop和大数据相关的顶级开源工具 资讯

apache.org/confluence/display/FLUME/Home 7. HBase HBase 是为有数十亿行和数百万列的超大表设计的,这是一种分布式数据库,可以对大数据进行随机性的实时读取

jopen 2015-08-10   60740   0
Hadoop  

Digg.com 的系统架构 经验

些历史原因。 Cassandra :对诸如文章、用户、Digg操作 记录等“类对象(Object-like)”的信息,都是使用Cassandra来存储的。我们使用的是Cassandra0.6版本,由于0

jopen 2015-03-24   21628   0
P34

  从“被虐”到“落地” - 明略大数据产品演进实践 文档

的知识 7. 目录WHY大数据落地被虐实例如何应对案例分享 8. 信心爆棚的进击Hadoop HBase Spark Storm Impala ML 9. 很快感受到森森的恶意 10. 丰富的数据源 11

w327 2015-05-25   473   0
P10

  大数据平台技术框架选型分析 文档

开源工具汇总整理 类别 名称 备注 查询引擎 Phoenix Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写 Stinger 原叫Tez,下一代Hive,Hor

guet_lee 2017-01-12   675   0
P57

  nosql之redis 文档

table来实现查找速度快数据无结构化,通常只被当作字符串或者二进制数据 列存储数据库Cassandra, HBase, Riak分布式的文件系统以列簇式存储,将同一列数据存在一起查找速度快,可扩展性强,更容易进行分布式扩展功能相对局限

mma5694 2017-02-22   1229   0

Kafka技术内幕-日志压缩 经验

Redis aof rdb 不需要,因为是内存数据库 Cassandra commit log data.db 需要,数据存在本地文件 HBase commit log HFile 需要,数据存在HDFS

szz314159 2016-05-24   56223   0

Java实现的网络爬虫,Apache Nutch v2.3 发布 资讯

Apache Hadoop 1.0.1 & 2.4.0 Apache Cassandra 2.0.2 Apache HBase 0.94.14 Apache Accumulo 1.5.1 MongoDB

m4ed 2015-01-31   18141   0

大数据领域一些实用工具 经验

数据存储(计算) Apache Hadoop NoSql 数据库 – MongoDB , Cassandra , Hbase SQL 数据库 – MySql (Oracle), MariaDB , PostgreSQL

y37f 2015-03-15   37847   0

如何定义NoSQL 资讯

Oskarsson 组织的一个 非正式的会议 上。与会人员来自 Voldemort, Cassandra, Dynomite, HBase, Hypertable, CouchDB, VPork, 以及 MongoDB

openkk 2012-02-15   23708   0
NOSQL  
P25

  Hadoop进阶 文档

据仓库通常将大量数据整合起来,并不支持修改,而是适用于数据分析和挖掘。 另外HadoopDB和HBase都可以考虑用于当前的项目,具体的要结合各个平台自身的特点和项目需求。 首先还是要先对各个平台有所了解。

7at7 2011-04-27   3440   0

Presto 来自Facebook的开源分布式查询引擎 资讯

Facebook就意识到出了HDFS之外,大量数据会被存储在很多其他类型的系统中。 其中一些是像HBase一类的为人熟知的系统,另一类则是象Facebook New Feed一样的定制的后台。Presto设计了一个简单的数据存储的抽象层,

jopen 2015-07-15   18518   0
Presto  

NoSQL数据库概览及其与SQL语法的比较 经验

原文出处: 周兆熊(@周兆熊-IT) HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,同时也是知名的NoSQL数据库之一。NoSQL数据库的产生就是为了解决大规模数据集合多重

jopen 2015-11-14   38430   0

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位 资讯

Vice President, and J. Aaron Farr is Treasurer. HBase, Hive, and Zookeeper enter the Incubator; Apache

jopen 2014-11-24   28520   0
Apache  
P8

  各种NoSQL数据库介绍 文档

NoSQL数据库。针对这种情况,这里对 Cassandra、 Mongodb 、CouchDB、Redis、 Riak、 Membase、Neo4j和HBase进行了比较:(编注1:NoSQL:是一项

290259325 2012-02-15   4766   0
SQL  

全面梳理关系型数据库和NoSQL的使用情景 经验

事务的支持。在Key-Value数据库中故障产生时不可以进行回滚。 Cassandra 1、Cassandra使用场景 1)事件记录 由于列族数据库可存放任意数据结构,所以它很适合用来

lxq 2016-02-29   36332   0

NoSQL开篇——为什么要使用NoSQL 经验

储模型和特点分为很多种类。 类型 部分代表 特点 列存储 Hbase Cassandra Hypertable 顾名思义,是按列存储数据的。最大的特点是方便存储结构

jopen 2013-11-10   23014   0
1 2 3 4 5 6 7 8 9 10