量化Q&A: SPSS分析大數據真的慢得像烏龜爬？亞洲一哥一招讓你的SPSS飛起來

對於一個研究人員來說，大數據代表著杠杠的說服力，代表著文章更高的錄用率。可是，SPSS運行大樣本就像蝸牛爬。當跑幾千個樣本時，喝個咖啡回來繼續盯著螢幕，數據像烏龜一樣還在爬！SPSS不適合做大數據分析？！NO！NO！NO！聽聽統計學“亞洲一哥”分享，如何一招解除SPSS大數據封印。

SPSS到底可以跑多大的數據量？

SPSS可以跑多少變數？一哥告訴我們：SPSS可以同時分析4,294, 967,295個變數。它可以跑多少樣本數呢？65,535個樣本數。（OMG！這麼給力，從來沒人告訴過我它這麼厲害！）是的，它跑Big Data 絕對給力。而且SPSS有專門做大數據分析的功能模組——直銷。可是，“為什麼我每次跑幾千個樣本它就那麼慢呢？”因為SPSS有個封印。好比，SPSS有個大寶藏一樣的虛擬空間庫，平時被一紙封條封了起來。只有解除封印，它才能釋放出足夠大的空間。快來跟一哥學，只需三步，解除封印，讓你的SPSS飛起來。

如何解除封印？

第一步：弄清工作區間的總容量。

先從檔裡打開語法檔。瞭解SPSS現在的RAM佔用多少。通過寫語法檔Set Workspace，設定工作區間（如圖1），工作區間設置越大，可以抓取的運行區間越大。如果一開始設定的工作區間很少，它每一個計量很小，就會跑很久，所以先要知道工作區間有多大。這好比作為調兵遣將的將軍，先要知道有多少士兵可以供我們調用。

圖1

第二步：根據最大值重新設置語法檔。

如何設置語法檔呢？用一個不符合語法的數位，比如在正常數據後面加一個點，比如－99999，然後Set Workspace，執行。它就會告訴你語法寫錯了（如圖2）。對，是故意寫錯的，因為不寫錯，你就無法得到它的最大運行有多大。通過這種方式，我們可以看到，此項語法上面至少是6144，而且不能大於2097151，所以把它重新設置為2097151, 記住這個數字，將Set Workplace設置為2097151再將它執行一遍（如圖3），相當於給電腦臨時釋放巨大空間，你的Work Space 將會變成2097151那麼大，100萬筆數據帶進來照樣會以閃電般的速度執行。“兵貴神速”，這好比我們兵法上使用一大招，探明敵人總共有多少的實力，然後根據這個最大的可能的實力來對己方排兵佈陣。知己知彼，百戰不殆。

圖2

圖3

第三步：怎樣回歸原設置？

最大可用空間的語法檔設置會佔用掉很大的RAM，導致別的軟體動不起來。因此，當我們跑完大數據要記得再次設置語法檔改回到最初的設置（如圖4）。“好借好還”，借來的臨時空間一定要記得及時歸位哦。

圖4

怎麼樣，一哥的這招讓你在SPSS上的大數據運行如虎添翼吧。跑大數據就需要大空間，只需一招，幾百萬樣本依舊神速運行。先修改Workspace的語法檔，向你的SPSS借用它最大的臨時空間，就會以閃電一樣的速行。記得臨時借來的空間要還（改）回去哦！

好啦，只有瞭解它，才能駕馭它！一哥如此機智有內涵的大招學會了嗎？快快上手試試吧！一哥的大招讓你大數據運行飛起來！

量化Q&A

2019年7月19日星期五

SPSS分析大數據真的慢得像烏龜爬？亞洲一哥一招讓你的SPSS飛起來

沒有留言:

張貼留言

EFA與CFA能否用相同樣本進行?

檢舉濫用情形

2019年7月19日 星期五

SPSS分析大數據真的慢得像烏龜爬？ 亞洲一哥一招讓你的SPSS飛起來

沒有留言:

張貼留言

EFA與CFA能否用相同樣本進行?

2019年7月19日星期五

SPSS分析大數據真的慢得像烏龜爬？亞洲一哥一招讓你的SPSS飛起來