• 一条数据的HBase之旅,简明HBase入门教程-Write全流程

     发表于 9 个月 前

    本文基于提供的样例数据,介绍了写数据的接口,RowKey定义,数据在客户端的组装,数据路由,打包分发,以及RegionServer侧将数据写入到Region中的全部流程。...

  • HBase原理 – 所有Region切分的细节都在这里了

     发表于 1 年 前

    Region自动切分是HBase能够拥有良好扩张性的最重要因素之一,也必然是所有分布式系统追求无限扩展性的一副良药。HBase系统中Region自动切分是如何实现的?这里面涉及很多...

  • HBase 高可用集群运维实践

     发表于 1 年 前

    随着越来越多的业务选择HBase作为存储引擎,对HBase的可用性要求也越来越高,对于HBase的运维也提出了新的挑战。目前运维集群超过30+,而且接入的业务类型繁多,对于性能要求...

  • HBase 跨版本迁移总结帖

     发表于 1 年 前

    目前公司运维着两个版本HBase,分别对应社区的94版本和1.1版本。从16年开始推广新版本,新版本在功能和性能上都比94好,未来方向也在新版本上,所以有些业务需要从94版本升级到...

  • HBase最佳实践-写性能优化策略

     发表于 2 年 前

    这篇文章要说道说道如何诊断HBase写数据的异常问题以及优化写性能。...

  • HBase最佳实践-读性能优化

     发表于 2 年 前

    任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确...

  • 部署流水线搭建小记:Docker、Jenkins、Java和Couchbase

     发表于 2 年 前

    这篇文章讲述了如何用Jenkins和Docker来为一个需要和数据库交互的Java应用创建 部署流水线 ( deployment pipeline )。...

  • 一文读懂Hadoop、HBase、Hive、Spark分布式系统架构

     发表于 2 年 前

    机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据库,hbase...

  • Kudu:支持快速分析的新型Hadoop存储系统

     发表于 2 年 前

    Kudu 是 Cloudera 开源的新型列式存储系统,是 Apache Hadoop 生态圈的新成员之一( incubating ),专门为了对快速变化的数据进行快速的分析,填补...

  • 为什么AppDynamics重构指标服务时选择了HBase而不是别的NOSQL

     发表于 2 年 前

    AppDynamics 公司的 智能程序平台 可以帮助客户分析软件程序的性能、用户体验和业务影响等,并可以提供实时的监控、故障解决和分析等服务。...

  • HBase最佳实践-内存规划

     发表于 2 年 前

    线上HBase集群应该如何进行参数配置?这其实是很多HBase初学者在实践环节都可能会遇到的问题,有些人会选择默认配置,有些人会选择其他公司的推荐配置;诚然,这样的参数配置在大多数...

  • HBase – 坐台诊断客户端读写阻塞异常

     发表于 2 年 前

    大数据时代,HBase作为一款扩展性极佳的分布式存储系统,越来越多地受到各种业务的青睐,以求在大数据存储的前提下实现高效的随机读写操作。对于业务方来讲,一方面关注HBase本身服务...

  • Hbase的Python API模块Starbase介绍

     发表于 2 年 前

    The following guest post is provided by Artur Barseghyan, a web developer currently employ...

  • 大数据分析需要把hbase、mysql等数据导入hive吗?

     发表于 2 年 前

    看做什么,如果不需要对数据进行实时处理,那么大部分情况下都需要把数据从hbase/mysql(数据库)“导入”到hive(数据仓库)中进行分析。 “导入”的过程中会做一些元数据转换...

  • 在 HBase 上使用 Big SQL 实现快速单点查询

     发表于 2 年 前

    随着一些组织开始探索将其数据转移到分布式文件系统中的可能性,他们被如今丰富多样的工具惊呆了。挑选出与其访问模式匹配的正确工具可能很难。如果过去使用 SQL 和 JDBC 作为主要客...

  • HBase Rest客户端使用

     发表于 2 年 前

    REST Server默认监听8080端口,如果8080端口被占用,可以修改HBase的hbase-site.xml文件,添加下列属性:...

  • Hbase学习笔记01

     发表于 3 年 前

    最近做项目接触到了HDFS、mapreduce以及Hbase,有了实战机会,今天打算将这些知识好好总结下,以备不时之需。首先从Hbase开始吧。...

  • HBase高可用原理与实践

     发表于 3 年 前

    前段时间有套线上HBase出了点小问题,导致该套HBase集群服务停止了2个小时,从而造成使用该套HBase作为数据存储的应用也出现了 服务异常。在排查问题之余,我们不禁也在思考,...

  • HBase原理、设计与优化实践

     发表于 3 年 前

    HBase —— Hadoop Database的简称,Google BigTable的另一种开源实现方式,从问世之初,就为了解决用大量廉价的机器高速存取海量数据、实现数据分布式存...