異常數(shù)據(jù)4種剔除方法 異常值剔除方法有哪些?
異常值剔除方法有哪些?統(tǒng)計(jì)中消除異常數(shù)據(jù)的方法有很多,但檢測(cè)和檢驗(yàn)中常用的方法有兩種:1-萊達(dá)準(zhǔn)則(又稱3σ準(zhǔn)則):非常簡(jiǎn)單,即首先得到n個(gè)獨(dú)立檢測(cè)結(jié)果的實(shí)驗(yàn)標(biāo)準(zhǔn)差s和殘差,如果殘差大于3S,則刪除異
異常值剔除方法有哪些?
統(tǒng)計(jì)中消除異常數(shù)據(jù)的方法有很多,但檢測(cè)和檢驗(yàn)中常用的方法有兩種:1-萊達(dá)準(zhǔn)則(又稱3σ準(zhǔn)則):非常簡(jiǎn)單,即首先得到n個(gè)獨(dú)立檢測(cè)結(jié)果的實(shí)驗(yàn)標(biāo)準(zhǔn)差s和殘差,如果殘差大于3S,則刪除異常值,然后反復(fù)計(jì)算以消除所有異常值。然而,這種方法有其局限性。數(shù)據(jù)樣本必須大于10,一般要求大于50。因此,該方法現(xiàn)在不常用,該方法已在國(guó)標(biāo)中取消
如何剔除異常值?
可以在數(shù)據(jù)菜單中首先標(biāo)記異常情況。步驟是:數(shù)據(jù)--“標(biāo)記異常案例,案例識(shí)別變量可以取數(shù)據(jù)集中不同值的變量。之后,SPSS會(huì)自動(dòng)標(biāo)記出所有異常情況的值以及異常原因。如果要?jiǎng)h除,可以手工刪除
輔助列A為原始數(shù)據(jù),B1=If(A1=“,”,If(ABS(A1平均值(A:A))>3*StdevP(A:A),“”,A1))下拉復(fù)制公式,將公式復(fù)制到右邊,直到某一列中的數(shù)據(jù)與該列中的數(shù)據(jù)完全一致為止左欄,表示所有不合格的數(shù)據(jù)都已消除。原來的公式使用了全角度“”,缺少空值判斷,現(xiàn)在改了。我已經(jīng)試過了,不會(huì)有錯(cuò)誤
常用的方法如下:
1。你可以通過“頻率”下的“描述統(tǒng)計(jì)”下的“分析”畫出“直方圖”,看圖表發(fā)現(xiàn)頻率最小的值可能是一個(gè)異常值,但也取決于與其他情況的距離程度。
2. 通過“分析”下“描述統(tǒng)計(jì)”的“葉莖圖”和“繪圖”選項(xiàng)下的“探索”,我們可以看到案例距離框邊(上端和下端)的距離是框邊的數(shù)倍,“0”代表1.5-3倍(異常值),“*”代表3倍以上(極端異常值)。
3. 您可以通過“分析”下“描述統(tǒng)計(jì)”下的“將標(biāo)準(zhǔn)化另存為變量Z”選項(xiàng)選擇相應(yīng)的變量“確定”。生成一個(gè)新變量,如果值超過2,則它必須是一個(gè)異常值。