hbase rowkey排序的规则
HBase的Rowkey设计是按照以下规则进行排序的:
1. Rowkey的唯一原则:必须在设计上保证其唯一性。由于在HBase中数据存储是Key-Value形式,若HBase中同一表插入相同Rowkey,则原先的数据会被覆盖掉(如果表的version设置为1的话),所以务必保证Rowkey的唯一性。字符串长度规则
2. Rowkey的排序原则:HBase的Rowkey是按照ASCII有序设计的,我们在设计Rowkey时要充分利用这点。比如视频网站上对影片《泰坦尼克号》的弹幕信息,这个弹幕是按照时间倒排序展示视频里,这个时候我们设计的Rowkey要和时间顺序相关。可以使用"_VALUE - 弹幕发表时间"的 long 值作为 Rowkey 的前缀。
3. Rowkey的散列原则:我们设计的Rowkey应均匀的分布在各个HBase节点上。
4. Rowkey长度原则:rowkey是一个二进制码流,可以是任意字符串,最大长度64kb,实际应用中一般为10-100bytes,以byte[]形式保存,一般设计成定长。
以上内容仅供参考,建议查阅HBase官方文档或咨询相关技术专家,以获取更准确的信息。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论