用Apache Spark进行大数据处理——第一部分:入门介绍 经验

此外,还有一些用于与其他产品集成的适配器,如Cassandra( Spark Cassandra 连接器 )和R(SparkR)。Cassandra Connector可用于访问存储在Cassandra数据库中的数据并在这些数据上执行数据分析。

jopen 2015-04-02   62295   0

大数据处理框架Apache Spark入门 经验

此外,还有一些用于与其他产品集成的适配器,如Cassandra( Spark Cassandra 连接器 )和R(SparkR)。Cassandra Connector可用于访问存储在Cassandra数据库中的数据并在这些数据上执行数据分析。

jopen 2015-11-16   61047   0

使用Spark Streaming + Kudu + Impala构建一个预测引擎 经验

FS优势在于大数据存储下的快速扫描能力)和HBaseHBase优势是基于主键的快速插入/查询)之间超存储层。本项目可以采用HBase或者Cassandra,但Kudu为数据分析提供了快速的扫描能力、列式存储架构。

让数据告诉你未来:Spark Streaming+Kudu+Impala构建预测引擎 经验

FS优势在于大数据存储下的快速扫描能力)和HBaseHBase优势是基于主键的快速插入/查询)之间超存储层。本项目可以采用HBase或者Cassandra,但Kudu为数据分析提供了快速的扫描能力、列式存储架构。

ususking 2016-05-18   35287   0

NoSQL数据库的35个应用场景 资讯

的论文 BigTable 。 数据模型:列簇,每一行在理论上都是不同的 例子:HBase, Hypertable, Cassandra 优点:处理大量数据,应对极高写负载,高可用,支持跨数据中心, MapReduce。

jopen 2013-02-25   16146   0
NOSQL  

陈超:Spark这一年,从开源到火爆 资讯

的产品与Spark进行了紧密的集成。譬如Datastax将Cassandra与Spark进行了集成,使得 Spark可以操作Cassandra内的数据,又譬如ElasticSearch也和Spark进

jopen 2015-03-10   34447   0
Spark  
P35

  PageRank 的 MapReduce 实现 文档

*Step4:将输出结果存储到分布式数据库中这一步需要安装HBase或者Cassandra分布式数据库,模拟google的bigtable。有兴趣的同学可以可以查阅一些关于HBase或者Cassandra的资料,把Hadoop的计算

平江夜弹 2012-08-11   690   0
Go  

两年内从零到每月十亿 PV 的发展来谈 Pinterest 的架构设计 经验

准,他们选择了:MySQL, Solr, Memcache, and Redis,放弃了 Cassandra ,Mongo。 这两点经验是相互联系的。遵循(2)中提到的标准的工具可以在扩容时简单增加服务器(boxes)

jopen 2013-04-20   47543   0

redis的简介和使用 经验

常见的数据库系统有以下几类: RDBMS:Oracle、DB2、Mysql NoSQL:MongoDB、Redis、HBase、Memcached NewSQL:Aerospike、FounddtionDB、RethinkDB

lieee 2015-12-20   17439   0

盘点大数据开源软件Google Trends指数 资讯

ce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。 ZooKeeper 是一个分布式的应用程序协调服务,是Hadoop和Hbase的重要组件。它是一个为分布式

jopen 2017-04-06   46308   0

用大白话聊聊分布式系统 经验

Hadoop、Apache Spark 等。在大数据和分布式存储方面,我们可以选择 Apache HBase、Apache Cassandra、Memcached、Redis、MongoDB等。在分布式监控方面,常用的技

盘点大数据生态圈,那些繁花似锦的开源项目 资讯

化的HighCharts、D3.js、Kibana、 Echarts等等。此外,加之CassandraHBase、MongoDB、Redis等NoSQL,Lucene、Solr、 ElasticSe

jopen 2015-09-11   33463   0

关于NoSQL数据库你应该了解的10件事 资讯

存储任何结构的数据。即使是相对严格的基于 BigTable 的 NoSQL 数据库(CassandraHBase)通常也允许没有太多限制的创建新列。 结果就是,应用或者数据库模式的改变不需要作为

jopen 2015-12-07   16112   0
NOSQL  
P21

  OceanBase 千亿级海量数据库 文档

实例:Tair,Memcache,Dynamo,Cassandra 分布式B+ Tree 随机读和顺序扫描,支持范围查询; 顺序划分不均匀,需要叶子节点分裂合并 实例:Bigtable & HBase,Google Megastore

jszhaogy 2016-01-27   2169   0
方案   Java   SQL   Go  

28 个 MongoDB NoSQL 数据库的面试问答 资讯

NoSQL数据库的类型 例如:MongoDB, Cassandra, CouchDB, Hypertable, Redis, Riak, Neo4j, HBASE, Couchbase, MemcacheDB

jopen 2014-01-24   21746   0
MongoDB  

RethinkDB:为实时应用而生的开源数据库 资讯

系统,如 MongoDB 的和 Redis。对于要求很高的大型项目,研发团队会选择 HBaseCassandra 和 MongoDB。 最后,对于管制行业,如 HIPAA 合规性,财务审计等等,Oracle

mgwd 2015-03-27   20676   0

淘宝的可伸缩高性能互联网架构 经验

通过最终一致性提升系统可用性,这也是目前很多NOSQL产品所采用的策略,包括facebook 的cassandra,apache hbase,google bigtable等,非常适合一些非结构化的数据,如key-va

openkk 2012-08-22   35646   0

淘宝高性能架构简介 经验

事务软状态以及最终一致性)事务策略 目前此类产品有facebook 的cassandra,apache hbase,google bigtable等,非常适合一些非结构化的数据,如key-va

jopen 2013-05-19   58754   0
淘宝  
P31

  Dockerizing SequoiaDB 文档

Limitations19 20. SequoiaDB vs. MongoDB vs. Cassandra vs. Hbase 高性能 支持事务 开源为何使用SequoiaDB?20 21. 为何使用Dock

b2f5 2015-06-12   524   0
P70

  nosql数据库学习教程 文档

cn/mpl398235717 4 列存系列 4 Hadoop之Hbase 4 耶鲁大学之HadoopDB 4 GreenPlum 4 FaceBook之Cassandra 4 Cassandra特点 4 Keyspace 4 Column

peixy 2016-11-03   1130   0
1 2 3 4 5 6 7 8 9 10