怎样利用Spark Streaming和Hadoop实现近实时的会话连接 经验

些常见的和高级的Spark Streaming功能,然后加载活动有关的统计数据到Apache HBase,用不喜欢的 BI 用具来绘图分析。 ( Sessionization 指的是捕获的单一访问者的

jopen 2015-06-22   21976   0
P46

  云计算之Hadoop 文档

dfs(Hdfs) MapReduce 分布式并行计算模型 Hadoop扩展 Hadoop base(Hbase)基于hadoop核心的高扩展性分布式数据库 Pig-一种高级数据流语言和并行计算的执行框架,也基于hadoop核心

qiu.n@sand 2011-10-26   5538   0

详解Hadoop核心架构 经验

e和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。 通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运

jopen 2015-07-30   19557   0

NoSQL数据库的四大家族 经验

预测它的查询方式,而一旦查询方式改变,我们就必须重新设计列族。 产品:Cassandra、HBase Cassandra Cassandra是一套开源分布式NoSQL数据库系统,是一个混合

TravisGodin 2016-09-26   38097   0

分布式分析引擎 Apache Kylin v1.5.2 发布 资讯

- 其他特性: - Job管理与监控 - 压缩与编码 - 增量更新 - 利用HBase Coprocessor - 基于HyperLogLog的Dinstinc Count近似算法

jopen 2016-05-26   26899   0
P86

  Hadoop 技术架构培训 文档

Hadoop综述 2. 主要内容2 第一篇HDFS 分布式文件系统 第二篇 MapReduce 第三篇 Hbase简单介绍 3. 第一篇HDFS3 一: The Design of HDFS 二: HDFS Concepts

pnx8 2014-08-17   4043   0

Cloudera Manager安装部署 经验

oop-httpfs hadoop-kms hbase-solr hive-hbase hive-webhcat hue-beeswax hue-hbase hue-impala hue-pig hu

BettieDanne 2016-01-28   21166   0

Github上关于大数据的开源项目、论文等合集 资讯

distribuited datastore, inspired by BigTable. Apache HBase - column-oriented distribuited datastore, inspired

jopen 2014-08-20   57775   0
Github  

大数据相关资源集合:Awesome Big Data 经验

distribuited datastore, inspired by BigTable. Apache HBase - column-oriented distribuited datastore, inspired

jopen 2014-10-11   79484   0

Lambda架构与推荐在电商网站实践 经验

读写分离和复杂性隔离等一系列架构原则,可集成Hadoop,Kafka,Storm,Spark,HBase等各类大数据组件。 1.1 Lambda架构理论点 Lambda架构对系统做了如下抽象:

jopen 2015-11-24   31238   0
P25

  Hadoop进阶 文档

据仓库通常将大量数据整合起来,并不支持修改,而是适用于数据分析和挖掘。 另外HadoopDB和HBase都可以考虑用于当前的项目,具体的要结合各个平台自身的特点和项目需求。 首先还是要先对各个平台有所了解。

7at7 2011-04-27   3440   0

海量数据实时计算利器Tec 资讯

通过内部的DAG批量处理输入数据,从而可进一步提高整体吞吐。 海量数据处理 Tec原生支持HBase作为海量数据存储并在使用方式上进行了大量抽象和优化,方便应用使用,并确保支持快速的高并发随机读写。

jopen 2016-01-17   24007   1

2015 Bossie评选:最佳开源大数据工具 资讯

据的嵌套查询,不需要转换或语法改造。 该技术的主要特点之一是它的连接器。从MongoDB,HBase,Cassandra和Apache的Spark,SlamData同大多数业 界标准的外部数据源可

jopen 2015-10-21   51330   0

分布式流处理框架:Tigon 经验

Hadoop 和 Apache HBase . 构建。Tigon 严重依赖开源项目 Tephra 和 Apache Twill 提供紧密的集成到已有的 Hadoop/HBase 集群中。 Tigon

jopen 2014-12-15   15625   0

Cloudera 月底将发布新的开源储存引擎 Kudu 资讯

Hadoop Distributed File System 和 Hadoop-oriented HBase NoSQL 数据库的替代产品,并将集合两者的特点。Kudu 将遵循 Apache 协议开源。

jopen 2015-09-25   9454   0
Kudu  

谷歌推出高性能NoSQL数据库Cloud Bigtable 资讯

Bigtable 数据存储系统,但新增加了对分布式数据库 Apache HBase 应用程序接口的支持。Apache HBase 本身基于谷歌的 Bigtable 项目,后者支撑着 Gmail、谷歌搜索和

efbb 2015-05-06   10726   0
NOSQL  

支持MySQL协议的分布式数据库 经验

管理平台OneAPM 举办的技术公开课中,TiDB的高级工程师刘奇从HBase特性、TiDB的优势和系统架构等方面进行了详细阐述。以下为演讲整理: HBase简介 众所周知,在SQL方面处于顶级的有两个公司,

RandallWing 2016-01-21   22162   0

常用NoSQL比较 经验

GridFS文档系统--功能类似于Hadoop的HDFS,实现分布式存储功能 四、Hbase HBase基于Google的BigTable构建,是一种column-oriented类型的nosql数据库

fmms 2012-02-07   103640   0

Facebook之Thrift简介 经验

( 3 ) HBase 中的 Thrift :Thrift 用于 HBase 中是为了提供跨平台的服务接口,在 HBase 中可以使用 [hbase-root]/bin/hbase thrift start

jopen 2012-01-11   43929   0

分布式分析引擎 Apache Kylin v1.5.3 正式发布 资讯

- 其他特性: - Job管理与监控 - 压缩与编码 - 增量更新 - 利用HBase Coprocessor - 基于HyperLogLog的Dinstinc Count近似算法

jopen 2016-07-29   12355   0
1 2 3 4 5 6 7 8 9 10