如果Rowkey是按时间戳的方式递增,不要将时间放在二进制码的前面,建议将Rowkey的高位作为散列字段,由程序循环生成,低位放时间字段,这样将提高数据均衡分布在每个Regionserver实现负载均衡的几率。如果没有散列字段,首字段直接是时间信息将产生所有新数据都在一个 RegionServer上堆积的热点现象,这样在做数据检索的时候负载将会集中在个别RegionServer,降低查询效率。
面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦
提 问题
写 面经
写 文章
微信 公众号
回到 顶部
没有帐户? 立即注册
已有帐号?立即登录