Bitmaps
用bit存储数据,数据只有0和1,例如
01010100110101101
,可以应用于信息状态统计
Bitmaps类型的基础操作
- 获取指定key对应偏移量上的bit值
getbit key offset
- 设置指定key对应偏移量上的bit值,value只能是1或0
setbit key offset value
- 对指定key按位进行交、并、非、异或操作,并将结果保存到destKey中
- and:交
- or:并
- not:非
- xor:异或
bitop op destKey key1 [key2...]
- 统计指定key中1的数量
bitcount key [start end]
Bitmaps类型的扩展操作
业务场景
- 统计每天某一部电影是否被点播
- 统计每天有多少部电影被点播
- 统计每周/月/年有多少部电影被点播
- 统计年度哪部电影没有被点播
HyperLogLog
统计独立UV,通过特定算法,计算出唯一值,存在一定误差
基数
- 基数是数据集去重后元素个数
HyperLogLog
是用来做基数统计的,运用了LogLog
的算法
- LogLog算法
$$DV_{LL}=constant*m*2^{\overline R}$$
- HyperLogLog
$$DV_{HLL}=constant*m^2*(\sum_{j=1}^m2^{-R_j})^{-1}$$
- 程序中的源码
HyperLogLog类型的基本操作
- 添加数据
pfadd key element [element ...]
- 统计数据
pfcount key [key ...]
- 合并数据
pfmerge destkey sourcekey [sourcekey...]
相关说明
- 用于进行基数统计,不是集合,不保存数据,只记录数量而不是具体数据
- 核心是基数估算算法,最终数值存在一定误差
- 误差范围:基数估计的结果是一个带有 0.81% 标准错误的近似值
- 耗空间极小,每个hyperloglog key占用了12K的内存用于标记基数
pfadd
命令不是一次性分配12K内存使用,会随着基数的增加内存逐渐增大Pfmerge
命令合并后占用的存储空间为12K,无论合并之前数据量多少
GEO
通过输入经纬度,实现相关功能,可以应用于地理位置计算
GEO类型的基本操作
- 添加坐标点
geoadd key longitude latitude member [longitude latitude member ...]
- 获取坐标点
geopos key member [member ...]
- 计算坐标点距离
geodist key member1 member2 [unit]
- 根据坐标求范围内的数据
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
- 根据点求范围内数据
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
- 获取指定点对应的坐标hash值
geohash key member [member ...]
最后一次更新于2020-10-19 17:20
0 条评论