Redis HyperLogLog操作

2018-08-03 11:05 更新

HyperLogLog主要解決大數據應用中的非精確計數(可能多也可能少,但是會在一個合理的范圍)操作,它可以接受多個元素作為輸入,并給出輸入元素的基數估算值,基數指的是集合中不同元素的數量。比如 {'apple', 'banana', 'cherry', 'banana', 'apple'} 的基數就是 3 。 HyperLogLog 的優(yōu)點是,即使輸入元素的數量或者體積非常非常大,計算基數所需的空間總是固定的、并且是很小的。在 Redis 里面,每個 HyperLogLog 鍵只需要花費 12 KB 內存,就可以計算接近 2^64 個不同元素的基數。這和計算基數時,元素越多耗費內存就越多的集合形成鮮明對比。但是,因為 HyperLogLog 只會根據輸入元素來計算基數,而不會儲存輸入元素本身,所以 HyperLogLog 不能像集合那樣,返回輸入的各個元素。

關于這個數據類型的誤差:在一個大小為12k的key所存儲的hyperloglog集合基數計算的誤差是%0.81.

參考文獻:http://highscalability.com/blog/2012/4/5/big-data-counting-how-to-count-a-billion-distinct-objects-us.html


以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號