雅虎北研的福利:薪资完爆BAT,解决北京户口 资讯

merge。有啥不对或不懂的,当面去请教! 内部的基础设施真是棒极了。比如 hadoop/pig/hbase/hive/openstack/docker/chef,如果你只是小规模用用,不用申请,直接上。雅虎有世界最大的

g2b4 2015-03-24   12120   0
雅虎  

盘点大数据生态圈,那些繁花似锦的开源项目 资讯

hCharts、D3.js、Kibana、 Echarts等等。此外,加之Cassandra、HBase、MongoDB、Redis等NoSQL,Lucene、Solr、 ElasticSearch等

jopen 2015-09-11   33463   0

关于NoSQL数据库你应该了解的10件事 资讯

构的数据。即使是相对严格的基于 BigTable 的 NoSQL 数据库(Cassandra,HBase)通常也允许没有太多限制的创建新列。 结果就是,应用或者数据库模式的改变不需要作为一个复杂的

jopen 2015-12-07   16112   0
NOSQL  

云时代信息系统的数据库 博客

gle的bigtable 以及 amazon的dynamo,开源的实现也很多如mongodb,hbase等。NoSql数据库出身于大型互联网公司,也决定了更适合大型互联网应用。NoSql数据库在信息系

quguiliang 2011-03-18   1337   0
P21

  OceanBase 千亿级海量数据库 文档

随机读和顺序扫描,支持范围查询; 顺序划分不均匀,需要叶子节点分裂合并 实例:Bigtable & HBase,Google Megastore Oceanbase数据结构 动态数据:单机B+树 静态数据:分布式B+树

jszhaogy 2016-01-27   2169   0
方案   Java   SQL   Go  
P30

  Apache Tez - 下一代Hadoop上的执行引擎 文档

Time Stream Processing StormOnline Data Processing HBase, Accumulo Monolithic Resource Management Execution

byc2 2014-11-18   348   0

如何提升网站的性能? 经验

据库通过优化数据模型、存储结构、伸缩特性等手段在性能方面的优势也日趋明显。(MongoDB, HBase) 衡量网站性能有一系列指标,重要的有响应时间、TPS、系统性能计数器等,通过测试这些指标以

wpuj4315 2016-02-18   11058   0

大数据时代 微软被迫接受开源 资讯

Microsoft的目标是兼容所有的Hadoop组件。Hadoop生态系统中的Zookeeper、HBase、HCatalog和 Mahout等组件也会被附加到Microsoft的Hadoop版本之中。在

fmms 2012-04-01   18994   0

淘宝面试记 资讯

在淘宝如订单这块的应用,还有如果你有NoSQL或Hadoop相关知识,他们可能会问NoSQL中HBase中HMaster如何保证单点,Hadoop的一些基本运用,如果你没在简历上写可能不会问的。问题可

码头工人 2011-09-12   25310   0
面试  

10大最新的开源项目 资讯

it there's nothing else to manage (like Redis, HBase, or whatever). It's designed to be distributed and

jopen 2014-01-28   20577   0

28 个 MongoDB NoSQL 数据库的面试问答 资讯

Cassandra, CouchDB, Hypertable, Redis, Riak, Neo4j, HBASE, Couchbase, MemcacheDB, RevenDB and Voldemort are

jopen 2014-01-24   21746   0
MongoDB  

RethinkDB:为实时应用而生的开源数据库 资讯

NoSQL 系统,如 MongoDB 的和 Redis。对于要求很高的大型项目,研发团队会选择 HBase、Cassandra 和 MongoDB。 最后,对于管制行业,如 HIPAA 合规性,财务审计等等,Oracle

mgwd 2015-03-27   20676   0

淘宝的可伸缩高性能互联网架构 经验

通过最终一致性提升系统可用性,这也是目前很多NOSQL产品所采用的策略,包括facebook 的cassandra,apache hbase,google bigtable等,非常适合一些非结构化的数据,如key-value形式数据存储

openkk 2012-08-22   35646   0

Hadoop分布式文件系统HDFS介绍 经验

用。 局限性 1、不适合低延迟数据访问 高吞吐量可能要求以高延迟作为代价 Hbase可以弥补不足 2、无法高效存储大量小文件 文件数量大小的限制由NameNode来决定

fdwm 2015-04-19   17745   0

大数据(六) - ZooKeeper 经验

可将节点信息写入Zookeeper的一个znode上; 监听这个znode可获取它的实时状态变化 典型应用 Hbase中Master状态监控与选举 分布式通知/协调 分布式环境中,经常存在一个服务需要知道它所管理的子服务的状态;

jopen 2016-01-20   13280   0
P30

  Tez - 下一代Hadoop上的执行引擎 文档

Time Stream Processing StormOnline Data Processing HBase, Accumulo Monolithic Resource Management Execution

dfwm 2014-10-19   763   0

细细品味大数据--初识hadoop 经验

分布式计算平台最核心的分布式文件系统 HDFS 、 MapReduce 处理过程,以及数据仓库工具 Hive 和分布式数据库 Hbase 的介绍,基本涵盖了 Hadoop 分布式平台的所有技术核心。 HDFS 对外部客户机而

jopen 2015-08-30   15444   0

RocksDB介绍:一个比LevelDB更彪悍的引擎 经验

RocksDB 虽然在代码层面上是在LevelDB原有的代码上进行开发的,但却借鉴了Apache HBase的一些好的idea。在云计算横行的年代,开口不离Hadoop,RocksDB也开始支持HDFS,允许从HDFS读取数据。而

jopen 2015-12-13   83291   0

记录一下互联网日志实时收集和实时计算的简单方案 经验

计累计去重指标,那么可能需要采用其它方式,比如:精确统计当天实时累计用户数,一种简单的办法是在HBase中使用计数器来配合完成。 其它实时数据消费者 如果需要实时统计一小段时间(比如十分钟、一小时

jopen 2015-11-30   50542   0

Apache Flume 性能调优 (第一部分) 经验

性能/重复的权衡,我通常在不同应用场景下选用不同的batch Size。比如使用Flume 的HBase Sink ,经常采用100的Batch Size来降低系统的延迟。 而使用HDFS Sink的时候,

ppbi8196 2016-05-05   26387   0
Flume  
1 2 3 4 5 6 7 8 9 10