成为专业程序员路上用到的各种优秀资料、神器及框架 经验

Docker资料合集 学习使用Strom Hadoop Internals Spark Internals 大数据时代的数据分析与数据挖掘 – 基于Hadoop实现 如何制作操作系统 借助开源项目学习软件开发

ymquan1987 2017-03-09   38211   0

分布式消息系统Kafka初步 经验

大家可以方便的找到。从这一篇开始分布式消息系统的入门。 在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: l  我想分析一下用户行为( pageviews ),以便我能设计出更好的广告位

jopen 2012-11-30   178734   0

分布式内存文件系统:Tachyon 经验

Tachyon 是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在tachyon里的文件。把Tachyon是架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间件。主要职责是将

jopen 2014-09-03   188748   0
P18

  hbase 简介 文档

HBase prototype created as Hadoop contrib 2007.10 First useable Hbase 2008.1 Hadoop become Apache top-level

xnbw 2016-01-11   1539   0

Hbase存储详解 经验

prototype created as Hadoop contrib 2007.10 First useable Hbase 2008.1 Hadoop become Apache top-level

jopen 2014-11-28   25510   0

讲给硅谷创业者的大数据精华集合 经验

技术,如 Hadoop,Mahout,HBase,Cassandra,我在下面也会涵盖。我可以举几个例子,在分析这一 块,cloudera,hortonworks,mapr作为Hadoop的三剑客,一

jopen 2015-01-25   84829   0
P26

  Hive and Hbase入门 文档

 Hive是Hadoop项目中的一个子项目,由FaceBook向Apache基金会贡献,其中TaoBao也是其中一位使用者+贡献者,Hive被视为一个仓库工具,可以将结构化的数据文件映射为一张数据库表,并可以将sql语句转换为

hywhyw1985 2013-05-24   3884   0

微店的大数据平台建设实践与探讨 经验

熟,而且价值体现不断放大。而在初创公司或者具有一 定规模的创业公司,大数据处理平台的基础设施或开始搭建,或处于较初始的状态,或者在逐步规范中。可能有人会有另外的想法:我们公司规模没有那么大,有必 要整

jopen 2015-09-22   38189   0

推荐引擎mahout安装与配置 经验

04-desktop-i386 jdk安装版本 :jdk-7u51-linux-i586 Hadoop版本 :Hadoop-1.1.1(一个Namenode,三个Datanode部署) 二、安装步骤 在

mx3y 2015-06-30   14524   0

分布式数据库 HBase 经验

HBase是 Hadoop 的正式子项目,它是一个面向列的分布式数据库。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。 它介于nosql和RDBMS之间,仅能通过主键(row

openkk 2011-12-01   137182   0

Docker, Mesos, Marathon以及宠物模式的终结 资讯

前的商家,这些服务限于bind,dhcp,haproxy,zoopkeeper,etcd;略带讽刺色彩的,在像openstack、hadoop namenodes等复杂控制框架中,chef/puppet服务也被这样认为。如此种种。。。

jopen 2015-07-06   28009   0
Docker  

HBase 在淘宝的应用和优化小结 经验

and apply summary in taobao.pdf 1 前言 hbase是从hadoop中分离出来的apache顶级开源项目。由于它很好地用java实现了google的bigtable系统大部分特性,因此在

openkk 2012-03-07   102135   0
P18

  淘宝TFS 文档

shtml hadoop: Yahoo!在06年雇佣Doug Cotting,希望通过支持Hadoop来提高其计算能力,以对抗Google的GFS。Hadoop实现了一个分布式文件系统(Hadoop Distributed

gonow86 2013-01-30   680   0
P30

  淘宝Memorphosis详细手册 文档

ory还默默无闻地在后面帮你做很多事情,包括 1. 服务的查找和发现,通过diamond和zookeeper帮你查找日常的meta服务器地址列表 2. 连接的创建和销毁,自动创建和销毁到meta服务器

narry 2012-03-19   5906   0
P45

  大数据应用解决方案 文档

21 3.3. 大数据处理的核心技术-Hadoop 21 3.3.1. Hadoop的组成 22 3.3.2. Hadoop的优点: 25 3.3.2.1. 高可靠性。 25 3.3.2.2. 高扩展性。

guet_lee 2017-01-12   2609   0

Kafka实战-实时日志统计流程 经验

定是一致的,因此,这里添加了一个中间件来做处理,所使用的是Apache的Kafka,关于Kafka集群部署,大家可以参考我写的《 Kafka实战-Kafka Cluster 》。另外,有一部分数据是流

jopen 2015-06-18   186855   0
P50

  HBase 简介 (来自京东商城) 文档

优化 HBase 用途 3. HBase简介Hadoop生态系统 4. 成员名用途Hadoop CommonHadoop体系最底层的一个模块,为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。AvroAvro是doug

x32577539 2012-12-10   19742   0

Pulsar:来自eBay的开源实时分析平台 资讯

作为全球性的商务平台和支付行业领先者,eBay拥有海量的用户行为数据。过去,eBay使用面向批处理的数据平台(如Hadoop)对用户行为进行分析 以提供良好的用户体验。近来,eBay商务平台出现了新的需求和使用场景,如

n7w77 2015-03-19   10283   0
Pulsar  

实战:在Java Web 项目中使用HBase 经验

Web项目中读取HBase的数据。 先介绍一下必要的一些环境: HBase的版本 :0.98.8-hadoop2 所需的依赖包 : commons-codec-1.7.jar commons-collections-3

n342 2015-04-29   99384   0
P39

  HBase技术研究与应用分析 文档

中国电信上海理想集团 2. Hadoop系列专题内容: 1、Hadoop是什么? 2、分布式云存储:HDFS 3、并行计算:MapReduce 4、案例:全球眼中的应用 5、Hadoop集群构建规划Hadoop 与分布式计算Hive与

furenjievip 2012-05-23   2616   0
1 2 3 4 5 6 7 8 9 10