elasticsearch 分頁查詢優(yōu)化如何提高elasticsearch的查詢速度？

2023-06-12

3440

如何提高elasticsearch的查詢速度？數(shù)據(jù)的增刪改查一直都也是互聯(lián)網(wǎng)最基本的需求！而這些操作的90%是查?。?！上世紀(jì)60年代，數(shù)據(jù)查詢需求旺盛，關(guān)系型數(shù)據(jù)查詢蓬勃發(fā)展，孕育而出了各種各樣的數(shù)據(jù)

如何提高elasticsearch的查詢速度？

數(shù)據(jù)的增刪改查一直都也是互聯(lián)網(wǎng)最基本的需求！而這些操作的90%是查?。?！

上世紀(jì)60年代，數(shù)據(jù)查詢需求旺盛，關(guān)系型數(shù)據(jù)查詢蓬勃發(fā)展，孕育而出了各種各樣的數(shù)據(jù)庫和SQL語言！數(shù)據(jù)庫查詢效率極高，建立起索引也只有為字段的粒度！要是是想對字段中的某些數(shù)據(jù)做查詢，不能在用like語句，逐字版本問題，網(wǎng)站查詢效率不高！

這時候全文搜索就能體現(xiàn)出更為強(qiáng)橫無比的效率！

全文搜索是對所有的數(shù)據(jù)并且拆細(xì)，對每一個詞都共有成立索引，資料記錄詞語所在的位置和出現(xiàn)的次數(shù)，然后把在網(wǎng)站查詢的時候能急速找到文檔的地方處，基于快速查詢！

比如1，我是一個兵！2，我愛你！兩句話會四個拆分之后存放到一個索引文檔中通過能維護(hù)，比如我字都會需要保存有兩次的頻率，因此在兩句話中都有又出現(xiàn)，在搜索我字的時候，就能把兩句話搜出去！

比如下圖:

無論是淘寶，百度網(wǎng)頁等也是對鏈接或是標(biāo)題等參與索引保存，在關(guān)鍵字搜索的時候就能中,選擇出關(guān)鍵詞原先的標(biāo)題，據(jù)查找度參與排序，最后去查詢出所有需要的標(biāo)題進(jìn)行總是顯示！

而全文搜索的實現(xiàn)程序都很多，除了底層的lucence，企業(yè)級應(yīng)用solr，elasticsearch等等！elasticsearch而且其天然的分布特性，和便于掌握大量水平擴(kuò)大的特性，restful的服務(wù)接口收到消息廣泛的關(guān)注和使用！

清楚全文搜索基本原理以后，本文不對elasticsearch的原理，集群建議使用，索引分片，傳輸協(xié)議展開來講，但而且elasticsearch是開源的，這個可以簡單的配置就能更方便在用，而你不了解其內(nèi)部實現(xiàn)程序，回到問題原先，怎莫才能越快的搜索？

1，服務(wù)器內(nèi)存要大一點，因為索引讀取要大量內(nèi)存，另外比較大最大值內(nèi)存設(shè)置中相同值，以免GC時候的大量stopthe world！

2，設(shè)置合理不的索引可以刷新時間，_interval如果不是設(shè)置過大，索引查不出來太容易導(dǎo)致極其，設(shè)置里太小，服務(wù)器壓力會太大！

3，啟用_more，然后打開會倒致u盤拷貝減少，可以查詢效率變低！

4，能夠防止設(shè)置中過多的分片副本，速度變大合并時間，影響不大網(wǎng)上查詢效率！

5，優(yōu)化軟件網(wǎng)站查詢趕往字段，降低內(nèi)存占用！

6，先添加查詢緩存！

elasticsearch是一門分布式搜索技術(shù)，牽涉到到的知識點很多，沒什么辦法很簡單可以介紹，找時間會具體一點的討論并奉上Demo，必須的同學(xué)，勞請關(guān)注。。。

mysql分庫分表后，跨庫跨表搜索如何排序？

mysql分庫分表后，跨庫跨表搜索怎么降序排列？數(shù)據(jù)庫分庫分表的確是更加最常見的一種應(yīng)對單表數(shù)據(jù)量過大的手段了。.例如：我們的訂單表，通常情況下，我們會將運單表明確的1個月、3個月、三個月的維度并且劃分，恐怕也可能會通過時間并且訂單表的水平切分。

那種情況下的分庫分表太好一次性處理，而且我們都能夠噬魂之手的通過時間線將訂單存儲到相同的庫中。不過，有可能我們的電商系統(tǒng)用戶量大，訂單量多，三天就有幾十萬單，肯定不僅僅十幾天，我們的訂單量就會上千萬，再而且訂單的商品數(shù)據(jù)表，要是不分表，訂單表肯定都會把系統(tǒng)給搞垮。

那就我們就需要獨自面對將1個月內(nèi)的數(shù)據(jù)也要聽從當(dāng)然的規(guī)則通過分庫分表。我們可以不將訂單表兩半，可分了OrderDB1，OrderDB2，遵循我們聽從訂單號來并且區(qū)分。訂單號是單數(shù)，我們就弄到OrderDB1中，訂單號是雙數(shù)，我們就弄到OrderDB2中。若是那樣的話，訂單表的數(shù)據(jù)就被來算的分配到了兩個數(shù)據(jù)庫的表中了，單表的壓力也就降底了。

而這樣分庫分表以后，我們的訂單表假如必須參與分頁的排序就更加很難了，兩個數(shù)據(jù)庫中的數(shù)據(jù)要如何通過跨庫的分頁排序網(wǎng)站查詢呢？

就像我們有三種方法，各是：全局視野、愿意精度損失、二次里查。

先說全局視野正常情況我們要直接輸入第三頁的100條訂單數(shù)據(jù)，我們會寫一個SQL

select*returningTorder bytimeoffset200limit100但是分庫以后，這100條數(shù)據(jù)可能存在很多種。

有可能是總平均其分布（極端情況）

也有可能是所有依附一個庫（極端情況）

有可能是散亂分布的位置的（常見情況）

的原因情況依據(jù)我們的Order By條件有很多的可能，所以我們很難知道第三頁的數(shù)據(jù)到底從哪個庫的哪個位置正在取數(shù)。要是我們是需要精準(zhǔn)的取到數(shù)據(jù)，這樣就前提是恢復(fù)自動還原單庫的那種全局視野。

該如何還原全局視野呢？

那就用我們要去查詢第三頁的數(shù)據(jù)來舉例子，我們之所以沒了了全局視野，是只不過我們不能一次性能得到所有的數(shù)據(jù)結(jié)果，這樣的話還原全局視野的應(yīng)該是讓我們都能夠換取所有的數(shù)據(jù)結(jié)果。所以，我們是可以將兩個庫中的從第一頁到第三頁的全部數(shù)據(jù)查詢不出來，然后把在內(nèi)存中合并后再接受排序，然后再就也能拿出正確的的第三頁數(shù)據(jù)了。

自然，我們的sql也就不可能發(fā)生了變化，從

select*aroundTorder bytimeoffset200limit100中改

select*returningTorder bytimeoffset0limit100200使用全局視野的好處很明顯，應(yīng)該是數(shù)據(jù)的確的精準(zhǔn)。但是缺點也同時的確，當(dāng)網(wǎng)站查詢的數(shù)據(jù)量大時，內(nèi)存的消耗都會變多，但在頁碼速度變大的時候，去查詢效率會疾速的逐漸下降。當(dāng)我們有N個數(shù)據(jù)庫，我們要從查詢X到XY區(qū)間的數(shù)據(jù)時，這樣我們的內(nèi)存中可以說要組合N*(XY)條數(shù)據(jù)后再排序。

既然全局網(wǎng)站查詢的有缺點，那我們就來解決的辦法這個缺點，但肯定會有一些其他方面的犧牲。

不允許精度損失容許精度損失其實更加的好再理解，那是我不去管數(shù)據(jù)在兩個DB中是怎么的分布的，我只不過是平均的從兩個庫中排序后接過50條數(shù)據(jù)，然后陣列曾經(jīng)的100條接受不顯示。

其實，這種的精度就是參照你降序排列的條件和數(shù)據(jù)存儲的相同而變化的了。打比方我們的數(shù)據(jù)也是遵循時間穩(wěn)定有序的存儲的，我們的排序又是據(jù)時間來通過排序的，那你我們換取的結(jié)果是會都很三連射。

但如果我們的數(shù)據(jù)是洗技能再插入多個DB的，我們要通過時間參與排序查找，或是我們的數(shù)據(jù)是通過時間順序直接插入DB的，只不過我們需要參照其他條件接受中搜索時，數(shù)據(jù)的精度都會特別差。這就看我們是對業(yè)務(wù)的需要是什么樣的了。

當(dāng)然了，在用這種中搜索，我們就可以不需要判斷性能上的問題，可以查詢的復(fù)雜程度比較低，只需我們的業(yè)務(wù)沒有過于的要求，那么建議使用這種查看是極其幫我推薦的。

當(dāng)然了，如果沒有你的業(yè)務(wù)不允許這樣的情況又出現(xiàn)，還必須滿足的條件交互、效率等等各種需求，這樣的話，就我們還可以使用下面這個。

二次查詢這可以說是解決分庫網(wǎng)上查詢的究級武器了，都能夠只要數(shù)據(jù)的精準(zhǔn)度、查詢的效率、用戶的交互頁面，犧性的僅僅小小的性能開銷和一些代碼難度的上升。

當(dāng)然也不算難，舉例我們要可以查詢第21頁的數(shù)據(jù)，頁碼5條。這個時候，我們先假設(shè)數(shù)據(jù)是換算下來廣泛分布的，可是我們在每個庫都去查詢?nèi)康?條數(shù)據(jù)。也就是：

select*returningTorder bytimeoffset100limit5

這時，我們我得到的數(shù)據(jù)很可能是這樣的。

而兩個DB中，最小的時間是1487500001【minTime】，這個時間資料記錄下了。兩個DB中各自的比較大時間也記錄下去，三個是DB1：1487500041【maxTime1】和DB2：1487500061【maxTime2】。

這時，我們在使用時間去兩個數(shù)據(jù)庫中再度并且查詢。

select*returningTwheretimebetweenminTimebecausemaxTime1order bytimeselect*fromTwheretimebetweenminTimebothmaxTime2order bytime而以前regtime依附于DB1，并且，DB1的數(shù)據(jù)不會突然發(fā)生變化，不過DB2中的條件被條件放寬了，但可能會網(wǎng)上查詢出更多的數(shù)據(jù)。最后很有可能追加：

而兩個結(jié)果集擴(kuò)展以后，等同于就獲得了全局視野，也就也可以非常容易的看出這一頁需要的5條數(shù)據(jù)了。

其實，我們還是可以自身elasticsearch來能夠完成分庫的排序里查，而elasticsearch核心中了緩存機(jī)制，能夠讓查詢更快。

成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

如何提高elasticsearch的查詢速度？

mysql分庫分表后，跨庫跨表搜索如何排序？

相關(guān)推薦

如何提高elasticsearch的查詢速度？

mysql分庫分表后，跨庫跨表搜索如何排序？