HBase入门

HBase简介

配置

Java API

案例

查询

公司架构

优化

表设计


  • 通过单个rowkey访问
  • 通过rowkey的range进行scan
  • 全表scan

rowkey可以是任何字符串, 最大长度是64kb, 实际用 10-100byte

rowkey设计规则:

  • 越小越好
  • rowkey的设计根据实际业务
  • 散列性
    • 取反
    • Hash

列族的定义:

  • 最多定义为2个

In Memory

  • 缓存放在RegionServer中
  • 保证在读取的时候被cache命中

Versions: 以列族

  • 设置最大版本
  • 设置最小版本

Time To Live

过期数据删除

Compact and split


写表操作

HTable参数设置

  • autoflush:: 默认是开启, 需要关闭,不需要每次put都进行写入
  • writebuffer
  • WAL Flag: 对于不重要的数据设置false, 提高性能
  • 批量写

读表操作

  • 缓存查询结果
  • Blockcache
Donate comment here