實驗離群數據的判斷
時間:2017-07-13
作者:
閱讀:4574
離群數據來源與判斷:
1、離群值按產生原因分為兩類:
a)第一類離群值是總體固有變異性的極端表現,這類離群值與樣本中其余觀測值屬于同一總體;
b)第二類離群值是由于試驗條件和試驗方法的偶然偏離所產生的結果,或產生于觀測、記錄、計算中的失誤,這類離群值與樣本中其余觀測值不屬于同一總體。對離群值的判定通常可根據技術上或物理上的理由直接進行,例如當試驗者已經知道試驗偏離了規定的試驗方法,或測試儀器發生問題等。當上述理由不明確時,可用本標準規定的方法。
2、離群值的三種情形:
本標準在下述不同情形下判斷樣本中的離群值:
a)上側情形:根據實際情況或以往經驗,離群值都為高端值;
b)下側情形:根據實際情況或以往經驗,離群值都為低端值;
c)雙側情形:根據實際情況或以往經驗,離群值可為高端值,也可為低端值。
3、檢出離群值個數的上限
應規定在樣本中檢出離群值個數的上限(與樣本量相比應較小),當檢出離群值個數超過了這個上限時,對此樣本應作慎重的研究和處理。
4、單個離群值情形
a)依實際情況或以往經驗選定,選定適宜的離群值檢驗規則(格拉布斯檢驗、狄克遜檢驗等);
b)確定適當的顯著性水平,
c)根據顯著性水平及樣本量,確定檢驗的臨界值;d)由觀測值計算相應統計量的值,根據所得值與臨界值的比較結果作出判斷。
5、判定多個離群值的檢驗規則
在允許檢出離群值的個數大于1的情況下,重復使用檢驗規則進行檢驗。若沒有檢出離群值,則整個檢驗停止;若檢出離群值,當檢出的離群值總數超過上限時,檢驗停止,對此樣本應慎重處理,否則,采用相同的檢出水平和相同的規則,對除去已檢出的離群值后余下的觀測值繼續檢驗。