HBase简介
略
配置
Java API
案例
查询
公司架构
优化
表设计
- 通过单个rowkey访问
- 通过rowkey的range进行scan
- 全表scan
rowkey可以是任何字符串, 最大长度是64kb, 实际用 10-100byte
rowkey设计规则:
- 越小越好
- rowkey的设计根据实际业务
- 散列性
- 取反
- Hash
列族的定义:
- 最多定义为2个
In Memory
- 缓存放在RegionServer中
- 保证在读取的时候被cache命中
Versions: 以列族
- 设置最大版本
- 设置最小版本
Time To Live
过期数据删除
Compact and split
写表操作
HTable参数设置
- autoflush:: 默认是开启, 需要关闭,不需要每次put都进行写入
- writebuffer
- WAL Flag: 对于不重要的数据设置false, 提高性能
- 批量写
读表操作
- 缓存查询结果
- Blockcache