2019年7月19日 星期五

SPSS分析大數據真的慢得像烏龜爬? 亞洲一哥一招讓你的SPSS飛起來



對於一個研究人員來說,大數據代表著杠杠的說服力,代表著文章更高的錄用率。可是,SPSS運行大樣本就像蝸牛爬。當跑幾千個樣本時,喝個咖啡回來繼續盯著螢幕,數據像烏龜一樣還在爬!SPSS不適合做大數據分析?!NONONO!聽聽統計學“亞洲一哥”分享,如何一招解除SPSS大數據封印。


SPSS到底可以跑多大的數據量?

SPSS可以跑多少變數?一哥告訴我們:SPSS可以同時分析4,294, 967,295個變數。它可以跑多少樣本數呢?65,535個樣本數。(OMG!這麼給力,從來沒人告訴過我它這麼厲害!)是的,它跑Big Data 絕對給力。而且SPSS有專門做大數據分析的功能模組——直銷。可是,為什麼我每次跑幾千個樣本它就那麼慢呢?因為SPSS有個封印。好比,SPSS有個大寶藏一樣的虛擬空間庫,平時被一紙封條封了起來。只有解除封印,它才能釋放出足夠大的空間。快來跟一哥學,只需三步,解除封印,讓你的SPSS飛起來。

如何解除封印?

第一步:弄清工作區間的總容量。

先從檔裡打開語法檔。瞭解SPSS現在的RAM佔用多少。通過寫語法檔Set Workspace,設定工作區間(如圖1),工作區間設置越大,可以抓取的運行區間越大。如果一開始設定的工作區間很少,它每一個計量很小,就會跑很久,所以先要知道工作區間有多大。這好比作為調兵遣將的將軍,先要知道有多少士兵可以供我們調用。
1

第二步:根據最大值重新設置語法檔。

如何設置語法檔呢?用一個不符合語法的數位,比如在正常數據後面加一個點,比如-99999,然後Set Workspace,執行。它就會告訴你語法寫錯了(如圖2)。對,是故意寫錯的,因為不寫錯,你就無法得到它的最大運行有多大。通過這種方式,我們可以看到,此項語法上面至少是6144,而且不能大於2097151,所以把它重新設置為2097151, 記住這個數字,將Set Workplace設置為2097151再將它執行一遍(如圖3),相當於給電腦臨時釋放巨大空間,你的Work Space 將會變成2097151那麼大,100萬筆數據帶進來照樣會以閃電般的速度執行。兵貴神速,這好比我們兵法上使用一大招,探明敵人總共有多少的實力,然後根據這個最大的可能的實力來對己方排兵佈陣。知己知彼,百戰不殆。



2


3

第三步:怎樣回歸原設置?

最大可用空間的語法檔設置會佔用掉很大的RAM,導致別的軟體動不起來。因此,當我們跑完大數據要記得再次設置語法檔改回到最初的設置(如圖4)。好借好還,借來的臨時空間一定要記得及時歸位哦。

4

怎麼樣,一哥的這招讓你在SPSS上的大數據運行如虎添翼吧。跑大數據就需要大空間,只需一招,幾百萬樣本依舊神速運行。先修改Workspace的語法檔,向你的SPSS借用它最大的臨時空間,就會以閃電一樣的速行。記得臨時借來的空間要還(改)回去哦!

好啦,只有瞭解它,才能駕馭它!一哥如此機智有內涵的大招學會了嗎?快快上手試試吧!一哥的大招讓你大數據運行飛起來!


沒有留言:

張貼留言

EFA與CFA能否用相同樣本進行?

請問在 SEM 模型中,有一個潛變數要做 EFA, 請問可以用搜集到的所有樣本先做 EFA, 然後再用相同的這些樣本做 SEM 嗎?還是要用一些樣本做 EFA, 然後用總體中剩下的那部分樣本做 SEM ?