P17

  如何让SQL在Spark上运行的更快 文档

来自于知名外企的创业团队 注册资金一千万元的高科技公司 成功完成近千万美元级别的A轮融资 中国最久的企业级Hadoop核心开发团队 比肩硅谷的企业级架构及功能模块 数十个国内的落地应用案例2星环科技www.transwarp

nn34 2014-12-16   6216   0
P38

  hbase-总结 文档

98.7-hadoop2-bin.tar.gz上传至“/home/etl/_jyy/” 执行命令: cd /home/etl/_jyy/ tar xfz hbase-0.98.7-hadoop2-bin

moshco 2017-02-06   626   0

Coursera数据工程师董飞:硅谷大数据的过去与未来 资讯

是会用到一些通用技术,如 Hadoop、Mahout、HBase、Cassandra 等等;在分析领域,Cloudera、Hortonworks、MapR 是 Hadoop 的三剑客;在运维领域,MongoDB、CouchBase

jopen 2015-01-27   53601   0

分布式发布订阅消息系统 Kafka 架构设计 经验

我们为什么要搭建该系统 Kafka是一个消息系统,原本开发自LinkedIn,用作LinkedIn的活动流(activity stream)和运营数据处理管道(pipeline)的基础。现在它已为

javap 2015-06-25   32133   0
P9

  透过12306五大焦点看高性能高并发系统 文档

2011年在IT业内是一个很热火的一年,云计算、大数据以及Hadoop等概念铺天盖地袭来,并有诸如淘宝、人人网、即刻搜索以及 Facebook等许多率先实践Hadoop的技术人员来分享应用经验。从表面看来,类似12

ccn4 2013-10-18   422   0

从业务驱动和技术实现角度谈腾讯大数据 资讯

级别。可以说,是腾讯的海量数据和业务不断提升的要求驱动我们成长为今天的规模,达到了 8800 台单集群服务器,10000 亿日接入消息数,8.5PB 日扫描数据量等业内引以为傲的体量。可以说我们从离线

jopen 2014-11-25   33331   0

12个最好的免费和开源的NoSQL数据库 资讯

提升,特别是在大型部 署上。 真正的可扩展性 :Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。 多数据中心识别

jopen 2014-01-05   91625   1
NOSQL  
P21

  谭俊青 - 途牛多数据中心分布式数据库同步 文档

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中,可能造成数据丢失 复杂Query效率低

dfwm 2014-10-19   5265   0
方案   SQL  
P21

  途牛多数据中心分布式数据库同步 文档

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中,可能造成数据丢失 复杂Query效率低

ww47 2015-03-06   3497   0
P21

  分布式数据同步 文档

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中,可能造成数据丢失 复杂Query效率低

dy3168729 2016-04-24   1637   0
P21

  途牛多数据中心分布式数据库同步 文档

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中,可能造成数据丢失 复杂Query效率低

byc2 2014-11-19   2879   0

HBase入门 经验

HBase是什么? HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据 存储文件夹的结构

jopen 2012-09-20   35064   0

LTS 任务调度框架(Light Task Schedule) 经验

框架概况: LTS是一个轻任务调度框架,参考hadoop的部分思想。有三种角色, JobClient, JobTracker, TaskTracker。各个节点都是无状态的,可以部署多个,来实现负载均衡,实现更大的负载量

jopen 2014-10-25   166727   0

Kafka+Log4j实现日志集中管理 经验

,因此如果有解释得不好或者错误的地方,欢迎批评指正,如果你有好的想法,也欢迎留言探讨。 第一部分 搭建Kafka环境 安装 Kafka 下载: http://kafka.apache.org/downloads

jopen 2015-12-11   42569   0

小米分布式发布和监控系统:Minos 经验

Minos 是小米公司开发的一个分布式的发布和监控系统。最初是小米开发的用来在 HadoopZooKeeper 集群上发布和管理的工具。Minos 可轻松扩展来支持其他的系统,目前已经支持包括 HDFS、YARN

jopen 2014-06-27   38433   0
P17

  淘宝分布式数据处理实践 文档

zhouchen.zm@taobao.com 2010-09-04 2. 主要内容淘宝的数据 云梯介绍 对Hadoop的主要功能扩展与改造 Hive实践 对Hive的改造 分布式数据仓库构思 3. 淘宝的数据Oracle

P61

  大数据与SequoiaDB 文档

SequoiaDB 研发总监 2 3. Agenda大数据概况1NoSQL3NoSQL + Hadoop4Hadoop2应用场景53 4. 大数据概况Big Data, Big World4 5. 传统的结构化数据依然是最常见的数据

pm36 2014-10-15   2108   0
P61

  大数据与SequoiaDB 文档

SequoiaDB 研发总监 2 3. Agenda大数据概况1NoSQL3NoSQL + Hadoop4Hadoop2应用场景53 4. 大数据概况Big Data, Big World4 5. 传统的结构化数据依然是最常见的数据

xcn4 2014-11-29   1416   0
P61

  大数据与SequoiaDB 文档

SequoiaDB 研发总监 2 3. Agenda大数据概况1NoSQL3NoSQL + Hadoop4Hadoop2应用场景53 4. 大数据概况Big Data, Big World4 5. 传统的结构化数据依然是最常见的数据

nmdb 2014-12-15   2576   0

Swarm、Fleet、Kubernetes、Mesos - 编排工具的对比分析 资讯

排工具,这些工具能帮助我们以集群方式在主机上启动容器,并能够彼此连接,同时也考虑到了扩展性和自动故障转移的重要特性。 Swarm Swarm 是Docker的原生集群工具,Swarm使用标准的Docker

www345 2015-11-16   65664   0
1 2 3 4 5 6 7 8 9 10