开源项目,开源代码,开源文档,开源新闻,开源社区

P17

来自于知名外企的创业团队注册资金一千万元的高科技公司成功完成近千万美元级别的A轮融资中国最久的企业级Hadoop核心开发团队比肩硅谷的企业级架构及功能模块数十个国内的落地应用案例2星环科技www.transwarp

nn34 2014-12-16 6216 0

分布式/云计算/大数据方案 Apache SQL Basic

P38

98.7-hadoop2-bin.tar.gz上传至“/home/etl/_jyy/” 执行命令： cd /home/etl/_jyy/ tar xfz hbase-0.98.7-hadoop2-bin

moshco 2017-02-06 626 0

分布式/云计算/大数据 x86 Java Go

是会用到一些通用技术，如 Hadoop、Mahout、HBase、Cassandra 等等；在分析领域，Cloudera、Hortonworks、MapR 是 Hadoop 的三剑客；在运维领域，MongoDB、CouchBase

jopen 2015-01-27 53601 0

大数据

我们为什么要搭建该系统 Kafka是一个消息系统，原本开发自LinkedIn，用作LinkedIn的活动流（activity stream）和运营数据处理管道（pipeline）的基础。现在它已为

javap 2015-06-25 32133 0

Kafka 消息系统

2011年在IT业内是一个很热火的一年，云计算、大数据以及Hadoop等概念铺天盖地袭来，并有诸如淘宝、人人网、即刻搜索以及 Facebook等许多率先实践Hadoop的技术人员来分享应用经验。从表面看来，类似12

ccn4 2013-10-18 422 0

级别。可以说，是腾讯的海量数据和业务不断提升的要求驱动我们成长为今天的规模，达到了 8800 台单集群服务器，10000 亿日接入消息数，8.5PB 日扫描数据量等业内引以为傲的体量。可以说我们从离线

jopen 2014-11-25 33331 0

腾讯大数据

提升，特别是在大型部署上。真正的可扩展性：Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量，可以指向另一台电脑。你不必重启任何进程，改变应用查询，或手动迁移任何数据。多数据中心识别

jopen 2014-01-05 91625 1

NOSQL

P21

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中，可能造成数据丢失复杂Query效率低

dfwm 2014-10-19 5265 0

方案 SQL

P21

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中，可能造成数据丢失复杂Query效率低

ww47 2015-03-06 3497 0

P21

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中，可能造成数据丢失复杂Query效率低

dy3168729 2016-04-24 1637 0

分布式/云计算/大数据方案 SQL

P21

binlogsmysqlddatabinlogReplication 6. MySQL Cluster 架构 7. MySQL 集群(NDB) GCP(Global check point) 数据存放在内存中，可能造成数据丢失复杂Query效率低

byc2 2014-11-19 2879 0

HBase是什么？ HBase是Apache Hadoop中的一个子项目，Hbase依托于Hadoop的HDFS作为最基本存储基础单元，通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构

jopen 2012-09-20 35064 0

HBase 分布式/云计算/大数据

框架概况： LTS是一个轻任务调度框架，参考hadoop的部分思想。有三种角色, JobClient, JobTracker, TaskTracker。各个节点都是无状态的，可以部署多个，来实现负载均衡，实现更大的负载量

jopen 2014-10-25 166727 0

任务调度作业调度框架

，因此如果有解释得不好或者错误的地方，欢迎批评指正，如果你有好的想法，也欢迎留言探讨。第一部分搭建Kafka环境安装 Kafka 下载： http://kafka.apache.org/downloads

jopen 2015-12-11 42569 0

Kafka 消息系统

Minos 是小米公司开发的一个分布式的发布和监控系统。最初是小米开发的用来在 Hadoop 和 ZooKeeper 集群上发布和管理的工具。Minos 可轻松扩展来支持其他的系统，目前已经支持包括 HDFS、YARN

jopen 2014-06-27 38433 0

Minos 系统监控

P17

zhouchen.zm@taobao.com 2010-09-04 2. 主要内容淘宝的数据云梯介绍对Hadoop的主要功能扩展与改造 Hive实践对Hive的改造分布式数据仓库构思 3. 淘宝的数据Oracle

qooxdoo 2010-11-28 5389 0

淘宝分布式/云计算/大数据淘宝分布式数据处理实践方案 Java

P61

SequoiaDB 研发总监 2 3. Agenda大数据概况1NoSQL3NoSQL + Hadoop4Hadoop2应用场景53 4. 大数据概况Big Data, Big World4 5. 传统的结构化数据依然是最常见的数据

pm36 2014-10-15 2108 0

分布式/云计算/大数据

P61

SequoiaDB 研发总监 2 3. Agenda大数据概况1NoSQL3NoSQL + Hadoop4Hadoop2应用场景53 4. 大数据概况Big Data, Big World4 5. 传统的结构化数据依然是最常见的数据

xcn4 2014-11-29 1416 0

P61

SequoiaDB 研发总监 2 3. Agenda大数据概况1NoSQL3NoSQL + Hadoop4Hadoop2应用场景53 4. 大数据概况Big Data, Big World4 5. 传统的结构化数据依然是最常见的数据

nmdb 2014-12-15 2576 0

分布式/云计算/大数据方案报告 JSON SQL

排工具，这些工具能帮助我们以集群方式在主机上启动容器，并能够彼此连接，同时也考虑到了扩展性和自动故障转移的重要特性。 Swarm Swarm 是Docker的原生集群工具，Swarm使用标准的Docker

www345 2015-11-16 65664 0

Kubernetes

Hadoop2_5_2 HA高可靠性集群搭建(Hadoop Zookeeper) 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

SQL Java JSON NOSQL 系统监控大数据 Kafka 任务调度 Basic Kubernetes x86 作业调度框架分布式/云计算/大数据 Minos 淘宝分布式数据处理实践 Apache HBase 消息系统

如何让SQL在Spark上运行的更快文档

hbase-总结文档

Coursera数据工程师董飞：硅谷大数据的过去与未来资讯

分布式发布订阅消息系统 Kafka 架构设计经验

透过12306五大焦点看高性能高并发系统文档

从业务驱动和技术实现角度谈腾讯大数据资讯

12个最好的免费和开源的NoSQL数据库资讯

谭俊青 - 途牛多数据中心分布式数据库同步文档

途牛多数据中心分布式数据库同步文档

分布式数据同步文档

途牛多数据中心分布式数据库同步文档

HBase入门经验

LTS 任务调度框架(Light Task Schedule) 经验

Kafka+Log4j实现日志集中管理经验

小米分布式发布和监控系统：Minos 经验

淘宝分布式数据处理实践文档

大数据与SequoiaDB 文档

大数据与SequoiaDB 文档

大数据与SequoiaDB 文档

Swarm、Fleet、Kubernetes、Mesos - 编排工具的对比分析资讯

Hadoop2_5_2 HA高可靠性集群搭建(Hadoop Zookeeper) 的相关搜索

关键词

如何让SQL在Spark上运行的更快 文档

hbase-总结 文档

Coursera数据工程师董飞：硅谷大数据的过去与未来 资讯

分布式发布订阅消息系统 Kafka 架构设计 经验

透过12306五大焦点看高性能高并发系统 文档

从业务驱动和技术实现角度谈腾讯大数据 资讯

12个最好的免费和开源的NoSQL数据库 资讯

谭俊青 - 途牛多数据中心分布式数据库同步 文档

途牛多数据中心分布式数据库同步 文档

分布式数据同步 文档

途牛多数据中心分布式数据库同步 文档

HBase入门 经验

LTS 任务调度框架(Light Task Schedule) 经验

Kafka+Log4j实现日志集中管理 经验

小米分布式发布和监控系统：Minos 经验

淘宝分布式数据处理实践 文档

大数据与SequoiaDB 文档

大数据与SequoiaDB 文档

大数据与SequoiaDB 文档

Swarm、Fleet、Kubernetes、Mesos - 编排工具的对比分析 资讯

Hadoop2_5_2 HA高可靠性集群搭建(Hadoop Zookeeper) 的相关搜索

关键词

如何让SQL在Spark上运行的更快文档

hbase-总结文档

Coursera数据工程师董飞：硅谷大数据的过去与未来资讯

分布式发布订阅消息系统 Kafka 架构设计经验

透过12306五大焦点看高性能高并发系统文档

从业务驱动和技术实现角度谈腾讯大数据资讯

12个最好的免费和开源的NoSQL数据库资讯

谭俊青 - 途牛多数据中心分布式数据库同步文档

途牛多数据中心分布式数据库同步文档

分布式数据同步文档

途牛多数据中心分布式数据库同步文档

HBase入门经验

Kafka+Log4j实现日志集中管理经验

淘宝分布式数据处理实践文档

Swarm、Fleet、Kubernetes、Mesos - 编排工具的对比分析资讯