2019年7月10日 星期三

為什麼研究中變數的變異數越大越好?


變異數反映的是樣本的差異程度,變異數越大,意味著樣本成分的複雜性也就越大。這難道不是在給自己找“麻煩”嗎?可是,在研究中,為什麼說變數的變異數要越大越好呢?且聽“亞洲一哥”為你解析這其中的道理。


自變數:研究中的自變數,變異數為什麼越大越好
首先,自變數的變異數大,說明引數的取樣範圍較大,代表性更廣。比如,你想要研究年齡對親社會意願的影響,即人們會不會年齡越大越願意或者越不願意幫助他人。如果你的樣本只選取了20-30歲的年輕人,作為自變數的年齡波動範圍較小,變異數較小,那麼你做出來的結論只能推論到20-30歲的年輕人。但如果你選取的樣本年齡範圍很大,從16歲到60歲的人都有,那麼你做出來的結論適用範圍明顯會更廣。

其次,統計學在研究變數之間關係的時候,基本思路是看自變數的變化如何造成依變數的變化。如果自變數的變異數過小,即自變數本身並沒有什麼變化,那麼依變數即使有變化也很難是自變數造成的,也就是說很難做出顯著的結果。


依變數:研究中的依變數,變異數為什麼也是越大越好
首先,依變數變異數大,說明依變數的波動較大,才更有研究價值。沿用上面的例子,你想要拿親社會意願作為研究的依變數。如果現實生活中你發現,有的人非常樂於助人,而有的人則是常常對周圍漠不關心,由於這個差距的存在,去瞭解這個差距究竟是什麼原因造成的,便是一個很有意義的問題。

其次,因變數波動範圍越大,越有可能符合正態分佈。統計學中的大部分方法對依變數都有常態性的要求,即中等程度的很多,低分高分的較少。但如果你的依變數本身波動很小,大家基本上都是同一個水準,那麼很容易違背常態性。

再次,統計學檢驗的是自變數的變化如何造成依變數的變化,即自變數的分類或者連續變化如何解釋依變數的變異數以及能夠解釋多少、是否能夠顯著解釋。如果依變數本身就沒有多少變異數給自變數來解釋,那麼也很難做出顯著的結果。

所以變異數越大,代表你我他的意見越不同,是什麼造成我們之間的意見如此不同,便是統計學派上用場的時候,如果每一個人的意見都一樣,調查一個人就是調查所有的人,那何必還搜集樣本,何必勞煩統計學呢?你是否也刹那間豁然開朗了呢!


沒有留言:

張貼留言

EFA與CFA能否用相同樣本進行?

請問在 SEM 模型中,有一個潛變數要做 EFA, 請問可以用搜集到的所有樣本先做 EFA, 然後再用相同的這些樣本做 SEM 嗎?還是要用一些樣本做 EFA, 然後用總體中剩下的那部分樣本做 SEM ?