當我們在研究一份數據的時候,首先會先研究數據有沒有一個共同的趨勢或是數據有沒有一個聚集的中心位置,可以反映出該數據的水準。在研究數據集中的趨勢時,我們有最常用的幾個指標,分別是平均數、中位數、眾數,一一介紹如下:
1.平均數(Mean)
平均數在統計中是最常用的一個指標,它代表著整體的水準,最接近實際的數值,即代表有效度(Validity)。所謂的效度即為越接近真實數值的程度,平均數越接近實際數值,代表越具效度。另外,假如數據符合常態分佈,則平均數是最具代表性的數值。
在計算平均數上,我們常用的計算方法有下列幾種:
(1)算術平均數:在統計學之中最常用的計算平均數的方法。算術平均數的計算是將所有數值相加除以所有數值的個數即可。這是日常生活中或是統計計算上最常用的計算平均數的方法。
(2)幾何平均數:在日常生活中,在報酬率或是增長率的計算上比較常使用到幾何平均數的計算,其計算上是將所有數值相乘後開觀測值個數的方根。
(3)調和平均數:在日常生活中,在計算平均速率的計算上比較常使用到調和平均數的計算,其計算是將數值個數除以數值倒數的總和。
(4)加權平均數:在計算算術平均數的時候,並沒有考慮到權重的問題,像在計算考試成績平均時,做算術平均數並沒有考慮到上課時數的問題,可能國文上課時數為6節、地理上課時數僅3節,若要將國文成績與地理成績直接做算術平均可能不太公平。因此,利用加權平均計算考試成績平均會比較公平,而其計算方法是該專案權重與該分數乘積總和除以總權重。
2.中位數(Median)
我們在計算平均數時,有一個很大的問題,如果在數據之中有一個離群值,在計算平均數時會因為這個離群值受到影響,如計算國民所得的平均,會因為有幾位的富豪而讓國民平均所得拉高,而無法較精確顯示出國民平均所得。這時,可以利用中位數進行衡量平均的國民所得較為準確。
中位數是將資料由小到大排序後,最中間的數值,代表著所有觀測數據中,位居中間位置的代表量。計算上若觀察值個數為奇數,則取排序後位居中間的數值為中位數;若觀察值個數為偶數,則取排序後位居中間的兩個數值的平均值作為中位數。在數據呈現非常態分佈的情況下,相較於平均數,中位數更具有代表性、更具參考價值。
3.眾數(Mode)
眾數即所謂數據中出現最多次的數值。一般運用於複選題,例如,我調查大家對水果的喜好,結果喜歡蘋果的人最多,有30人次,那麼最多的那個值30即為眾數。
沒有留言:
張貼留言