當我們在進行T檢定、變異數分析時,有可能會因為某些組的樣本數過少而導致估計產生過高的偏誤。所以我們在做T檢定、變異數分析前,要先確認每一組的樣本數個數不至於相差過大。篩選的依據如下:
一、每一組樣本數都要占總樣本數10%以上
二、最大組與最小組之間樣本數比值不能超過4倍
若有一組沒有符合上述的規定,則需要進行並組的動作,也就是將相鄰的組別合併在一起,並賦予新的題項說明。在此特別強調,只有順序尺度才能進行並組的動作,其餘的尺度皆不能操作並組的動作。
例如我們的樣本在學歷上的次數分配表如表1。學歷位於國中以下的人數為8位、佔總樣本數的2.7%,不符合要求,因此將國中以下組別跟高中組別進行合併。
表1 學歷次數分配表(合併前)
次數
|
百分比
|
有效百分比
|
累積百分比
|
||
有效
|
國中以下
|
8
|
2.7
|
2.7
|
2.7
|
高中
|
46
|
15.6
|
15.6
|
18.3
|
|
大學
|
190
|
64.4
|
64.4
|
82.7
|
|
研究所以上
|
51
|
17.3
|
17.3
|
100
|
|
總計
|
295
|
100
|
100
|
操作過程如下:
1.「轉換」→「重新編碼為不同變數」
2.將「school學歷」選入à右邊數值變數對話方塊中à在右邊輸出變數對話方塊中的名稱輸入「school_new」à點選「變更」
3. 點選「舊值和新值」,在舊值框中輸入舊數值,新值框中輸入新的數值,點選「新增」,依序完成後,點選「繼續」,如此就完成合併。
合併組後新的次數分配表如表2,由表2可知,新的組別名稱高中以下人數為54位、佔總樣本的18.3%,並且最大組(大學)與最小組(研究所以上)間樣本數不超過4倍,因此可以做接下來的分析。
表2 學歷次數分配表(合併後)
次數
|
百分比
|
有效百分比
|
累積百分比
|
||
有效
|
高中以下
|
54
|
18.3
|
18.3
|
18.3
|
大學
|
190
|
64.4
|
64.4
|
82.7
|
|
研究所以上
|
51
|
17.3
|
17.3
|
100
|
|
總計
|
295
|
100
|
100
|
沒有留言:
張貼留言