kmeans算法基本步驟 K-means的算法缺點(diǎn)?
K-means算法是聚類分析中最基本、應(yīng)用最廣泛的一種劃分算法。它是一種已知聚類類別數(shù)的聚類算法。當(dāng)類別數(shù)為k時(shí),對(duì)樣本集進(jìn)行聚類,并根據(jù)給定的聚類目標(biāo)函數(shù)(或聚類效果準(zhǔn)則)由k來確定聚類結(jié)果,算法采
K-means算法是聚類分析中最基本、應(yīng)用最廣泛的一種劃分算法。它是一種已知聚類類別數(shù)的聚類算法。當(dāng)類別數(shù)為k時(shí),對(duì)樣本集進(jìn)行聚類,并根據(jù)給定的聚類目標(biāo)函數(shù)(或聚類效果準(zhǔn)則)由k來確定聚類結(jié)果,算法采用迭代更新的方法。每次迭代都是在目標(biāo)函數(shù)值遞減的方向上進(jìn)行的。最終的聚類結(jié)果使目標(biāo)函數(shù)的值達(dá)到最小值,達(dá)到較好的聚類效果。采用平均誤差準(zhǔn)則函數(shù)E作為評(píng)價(jià)聚類結(jié)果的準(zhǔn)則之一,保證了算法的可靠性和有效性。
K-means的算法缺點(diǎn)?
K-means聚類算法的優(yōu)點(diǎn)如下:1。算法簡(jiǎn)單快速。對(duì)于大數(shù)據(jù)集具有較高的效率和可擴(kuò)展性。時(shí)間復(fù)雜度近似線性,適合于挖掘大型數(shù)據(jù)集。K-means聚類算法的時(shí)間復(fù)雜度為O(NKT),其中n表示數(shù)據(jù)集中的對(duì)象個(gè)數(shù),T表示迭代次數(shù),K表示聚類個(gè)數(shù)。