淘宝面试记 资讯

在淘宝如订单这块的应用,还有如果你有NoSQL或Hadoop相关知识,他们可能会问NoSQL中HBase中HMaster如何保证单点,Hadoop的一些基本运用,如果你没在简历上写可能不会问的。问题可

码头工人 2011-09-12   25310   0
面试  

10大最新的开源项目 资讯

it there's nothing else to manage (like Redis, HBase, or whatever). It's designed to be distributed and

jopen 2014-01-28   20577   0

Hadoop分布式文件系统HDFS介绍 经验

用。 局限性 1、不适合低延迟数据访问 高吞吐量可能要求以高延迟作为代价 Hbase可以弥补不足 2、无法高效存储大量小文件 文件数量大小的限制由NameNode来决定

fdwm 2015-04-19   17745   0

大数据(六) - ZooKeeper 经验

可将节点信息写入Zookeeper的一个znode上; 监听这个znode可获取它的实时状态变化 典型应用 Hbase中Master状态监控与选举 分布式通知/协调 分布式环境中,经常存在一个服务需要知道它所管理的子服务的状态;

jopen 2016-01-20   13280   0
P30

  Tez - 下一代Hadoop上的执行引擎 文档

Time Stream Processing StormOnline Data Processing HBase, Accumulo Monolithic Resource Management Execution

dfwm 2014-10-19   763   0

细细品味大数据--初识hadoop 经验

分布式计算平台最核心的分布式文件系统 HDFS 、 MapReduce 处理过程,以及数据仓库工具 Hive 和分布式数据库 Hbase 的介绍,基本涵盖了 Hadoop 分布式平台的所有技术核心。 HDFS 对外部客户机而

jopen 2015-08-30   15444   0

RocksDB介绍:一个比LevelDB更彪悍的引擎 经验

RocksDB 虽然在代码层面上是在LevelDB原有的代码上进行开发的,但却借鉴了Apache HBase的一些好的idea。在云计算横行的年代,开口不离Hadoop,RocksDB也开始支持HDFS,允许从HDFS读取数据。而

jopen 2015-12-13   83291   0

记录一下互联网日志实时收集和实时计算的简单方案 经验

计累计去重指标,那么可能需要采用其它方式,比如:精确统计当天实时累计用户数,一种简单的办法是在HBase中使用计数器来配合完成。 其它实时数据消费者 如果需要实时统计一小段时间(比如十分钟、一小时

jopen 2015-11-30   50542   0

Apache Flume 性能调优 (第一部分) 经验

性能/重复的权衡,我通常在不同应用场景下选用不同的batch Size。比如使用Flume 的HBase Sink ,经常采用100的Batch Size来降低系统的延迟。 而使用HDFS Sink的时候,

ppbi8196 2016-05-05   26387   0
Flume  

一淘网的系统架构 经验

存储系统负责存储抓取系统和离线处理系统的产出,同时向这两个“厂”提供高性能、大容量的存取服务。目前我们采用的是Hadoop+HBase的体系结构,将网页、链接、图片进行了分类存放。存储系统是一淘存放原料、半成品的“核心仓库”。 在

jopen 2014-01-15   25496   0

Hadoop的辉煌还能延续多久? 经验

我希望在后Hadoop时代下面这些技术能够更具竞争性。 尽 管许多Apache社区的项目和商业化Hadoop项目都非常活跃,并以来自HBase、Hive和下一代MapReduce(YARN)的技术不断完善 着Hadoop体系,我依然认为,

jopen 2014-08-05   27938   0

大型网站系统架构演化之路 经验

擎可以达到更好的性能。并不是所有的数据都要放在关系型数据中。常用的NOSQL有mongodb、hbase、redis,搜索引擎有lucene、solr、elasticsearch。 九、将应用服务器进行业务拆分

jopen 2014-09-27   19023   0

10个使用Java最广泛的现实领域 经验

Hadoop和其他大数据技术也或多或少地在使用Java技术,例如Apache的基于Java的HBase和Accumulo(开源),还有 ElasticSearch。不过Java在此领域并不算是霸主,还有其他技术例如MongoDB则是用C

jopen 2014-12-27   41555   0

超越线程池:Java并发并没有你想的那么糟糕 经验

ommon)。 在这些组件上层还有一些其他很受欢迎的可选工具,比如运行在HDFS上的数据库( HBase )、查询语言平台(Pig)和数据仓库基础结构(Hive)。 Apache Spark 作为

jopen 2015-03-24   17806   0
P6

  Install Ganglia in RedHat 5.4 文档

起见,一定要设定一个访问密码. ganglia 3.1.7 安装 最近在安装ganglia用于hbase监控,还是有点小麻烦的,步骤如下: 第一步:需要下载的包 apr-1.3.2.tar.bz2  

baobamboo 2011-12-28   4902   0

Spotify的监测框架(上) 资讯

Atlas和Prometheus被认真考虑过,但在时间上并不可用。我们最终并没有选择OpenTSDB,因为在使用HBase时的糟糕的运行体验。 InfluxDB不成熟,因为它缺乏自助服务的功能,而这正是我们需要推出的。

jopen 2015-12-17   7923   0
Spotify  

淘宝数据产品技术架构分析 资讯

为此,我们针对前端产品设计了专门的存储层。在这一层,我们有基于MySQL的分布式关系型数据库集群MyFOX和基于HBase的NoSQL存储集群Prom,在后面的文字中,我将重点介绍这两个集群的实现原理。除此之外,其他第三方的模块也被我们纳入存储层的范畴。

jopen 2015-12-31   26083   0
淘宝  

无论是云计算SaaS,PaaS还是IaaS,拼的都是运维! 问答

里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS,分布式计算系 统Hadoop/Hbase等等,分布式的东西都不神秘了。技术的实现在以前可能是问题,现在不是了。 对于云计算工程方

jopen 2015-03-25   10045   0
P28

  Fastjson 介绍 文档

Android/阿里云手机处理JSON MessageQueue传输对象 配置文件代替XML 保存数据到磁盘、数据库、Hbase 8. 功能完备支持序列化和反序列化 支持循环引用 支持泛型 能够定制序列化,可以过滤和修改 支

patrick002 2015-01-10   471   0
JSON   Java   XML  
P31

  Storm对于交通数据的处理 文档

7. 大数据实时流计算系统(二)Facebook 的Puma Facebook使用puma和Hbase相结合来处理实时数据,使批处理计算平台具备一定实时计算能力。 不过这不算是一个开源的产品。只是内部使用。

nd7b 2015-12-09   6303   0
1 2 3 4 5 6 7 8 9 10