Bitmaps

用bit存储数据,数据只有0和1,例如01010100110101101,可以应用于信息状态统计

Bitmaps类型的基础操作

  • 获取指定key对应偏移量上的bit值
getbit key offset
  • 设置指定key对应偏移量上的bit值,value只能是1或0
setbit key offset value
  • 对指定key按位进行交、并、非、异或操作,并将结果保存到destKey中
  1. and:交
  2. or:并
  3. not:非
  4. xor:异或
bitop op destKey key1 [key2...]
  • 统计指定key中1的数量
bitcount key [start end]

Bitmaps类型的扩展操作

业务场景

  • 统计每天某一部电影是否被点播
  • 统计每天有多少部电影被点播
  • 统计每周/月/年有多少部电影被点播
  • 统计年度哪部电影没有被点播

QQ截图20201019165237.png

HyperLogLog

统计独立UV,通过特定算法,计算出唯一值,存在一定误差

基数

  • 基数是数据集去重后元素个数
  • HyperLogLog是用来做基数统计的,运用了LogLog的算法

QQ截图20201019165611.png

  • LogLog算法

$$DV_{LL}=constant*m*2^{\overline R}$$

  • HyperLogLog

$$DV_{HLL}=constant*m^2*(\sum_{j=1}^m2^{-R_j})^{-1}$$

  • 程序中的源码

QQ截图20201019165644.png

HyperLogLog类型的基本操作

  • 添加数据
pfadd key element [element ...]
  • 统计数据
pfcount key [key ...]
  • 合并数据
pfmerge destkey sourcekey [sourcekey...]

相关说明

  • 用于进行基数统计,不是集合,不保存数据,只记录数量而不是具体数据
  • 核心是基数估算算法,最终数值存在一定误差
  • 误差范围:基数估计的结果是一个带有 0.81% 标准错误的近似值
  • 耗空间极小,每个hyperloglog key占用了12K的内存用于标记基数
  • pfadd命令不是一次性分配12K内存使用,会随着基数的增加内存逐渐增大
  • Pfmerge命令合并后占用的存储空间为12K,无论合并之前数据量多少

GEO

通过输入经纬度,实现相关功能,可以应用于地理位置计算

GEO类型的基本操作

  • 添加坐标点
geoadd key longitude latitude member [longitude latitude member ...]
  • 获取坐标点
geopos key member [member ...]
  • 计算坐标点距离
geodist key member1 member2 [unit]
  • 根据坐标求范围内的数据
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
  • 根据点求范围内数据
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
  • 获取指定点对应的坐标hash值
geohash key member [member ...]