布隆過濾器誤判怎么辦 面試遇難題,問:游戲中的敏感詞過濾是如何實(shí)現(xiàn)的,該怎么回答?
面試遇難題,問:游戲中的敏感詞過濾是如何實(shí)現(xiàn)的,該怎么回答?你好,你應(yīng)該像我一樣是個(gè)程序員。涉及Java和web。有一個(gè)replace()方法,后跟兩個(gè)參數(shù),用于“set and replace”和用
面試遇難題,問:游戲中的敏感詞過濾是如何實(shí)現(xiàn)的,該怎么回答?
你好,你應(yīng)該像我一樣是個(gè)程序員。涉及Java和web。有一個(gè)replace()方法,后跟兩個(gè)參數(shù),用于“set and replace”和用“*”替換一些“敏感詞”。具體技術(shù)可以關(guān)注我,我?guī)闳W(xué)技術(shù)!@很難找到新的高質(zhì)量數(shù)據(jù)。關(guān)注和重新分配它們是不好的
布魯姆過濾器是由布魯姆過濾器在1970年提出的。它實(shí)際上是一個(gè)很長的二進(jìn)制向量和一系列隨機(jī)映射函數(shù)。Bloom過濾器可用于檢索元素是否在集合中。它的優(yōu)點(diǎn)是在空間效率和查詢時(shí)間上都比一般的算法好很多,缺點(diǎn)是有一定的錯(cuò)誤識別率和刪除困難。
海量數(shù)據(jù)處理之什么是bloomfilter?
請記住,您可以制作一個(gè)程序,例如查找定點(diǎn)單詞。我只是不記得了。人們真的很蠢。
給你一個(gè)含有1億個(gè)QQ號碼的文件,如何快速的查找某個(gè)QQ號碼?
Bloom filter的特點(diǎn)是會有誤報(bào),但不會有漏報(bào)。也就是說,對于Bloom filter驗(yàn)證的數(shù)據(jù)文件,它可能不包含您要查找的數(shù)據(jù)項(xiàng),但是包含您要查找的數(shù)據(jù)項(xiàng)的數(shù)據(jù)文件將被返回。在key-value系統(tǒng)中,bloom會返回?cái)?shù)據(jù)文件,過濾器返回的數(shù)據(jù)文件還需要檢查內(nèi)容,以知道是否有所需的數(shù)據(jù),從而保證執(zhí)行結(jié)果的正確性和完整性。
因此,鍵值系統(tǒng)不會因此出錯(cuò),只需訪問更多的數(shù)據(jù)文件即可。
在數(shù)據(jù)量大的鍵值系統(tǒng)中,建立統(tǒng)一的b樹索引的成本很高,維護(hù)成本也很高,所以Bloom filter的性能最好。
布隆過濾器既然有錯(cuò)誤率,為什么還能應(yīng)用在key-value系統(tǒng)中?
redis bloom filter的功率為1000,bitmap的功率為1100。不同的是力量不同