對於一個研究人員來說,大數據代表著杠杠的說服力,代表著文章更高的錄用率。可是,SPSS運行大樣本就像蝸牛爬。當跑幾千個樣本時,喝個咖啡回來繼續盯著螢幕,數據像烏龜一樣還在爬!SPSS不適合做大數據分析?!NO!NO!NO!聽聽統計學“亞洲一哥”分享,如何一招解除SPSS大數據封印。
SPSS到底可以跑多大的數據量?
SPSS可以跑多少變數?一哥告訴我們:SPSS可以同時分析4,294, 967,295個變數。它可以跑多少樣本數呢?65,535個樣本數。(OMG!這麼給力,從來沒人告訴過我它這麼厲害!)是的,它跑Big Data 絕對給力。而且SPSS有專門做大數據分析的功能模組——直銷。可是,“為什麼我每次跑幾千個樣本它就那麼慢呢?”因為SPSS有個封印。好比,SPSS有個大寶藏一樣的虛擬空間庫,平時被一紙封條封了起來。只有解除封印,它才能釋放出足夠大的空間。快來跟一哥學,只需三步,解除封印,讓你的SPSS飛起來。
如何解除封印?
第一步:弄清工作區間的總容量。
先從檔裡打開語法檔。瞭解SPSS現在的RAM佔用多少。通過寫語法檔Set Workspace,設定工作區間(如圖1),工作區間設置越大,可以抓取的運行區間越大。如果一開始設定的工作區間很少,它每一個計量很小,就會跑很久,所以先要知道工作區間有多大。這好比作為調兵遣將的將軍,先要知道有多少士兵可以供我們調用。
圖1
第二步:根據最大值重新設置語法檔。
如何設置語法檔呢?用一個不符合語法的數位,比如在正常數據後面加一個點,比如-99999,然後Set Workspace,執行。它就會告訴你語法寫錯了(如圖2)。對,是故意寫錯的,因為不寫錯,你就無法得到它的最大運行有多大。通過這種方式,我們可以看到,此項語法上面至少是6144,而且不能大於2097151,所以把它重新設置為2097151, 記住這個數字,將Set Workplace設置為2097151再將它執行一遍(如圖3),相當於給電腦臨時釋放巨大空間,你的Work Space 將會變成2097151那麼大,100萬筆數據帶進來照樣會以閃電般的速度執行。“兵貴神速”,這好比我們兵法上使用一大招,探明敵人總共有多少的實力,然後根據這個最大的可能的實力來對己方排兵佈陣。知己知彼,百戰不殆。
圖2
圖3
第三步:怎樣回歸原設置?
最大可用空間的語法檔設置會佔用掉很大的RAM,導致別的軟體動不起來。因此,當我們跑完大數據要記得再次設置語法檔改回到最初的設置(如圖4)。“好借好還”,借來的臨時空間一定要記得及時歸位哦。
圖4
怎麼樣,一哥的這招讓你在SPSS上的大數據運行如虎添翼吧。跑大數據就需要大空間,只需一招,幾百萬樣本依舊神速運行。先修改Workspace的語法檔,向你的SPSS借用它最大的臨時空間,就會以閃電一樣的速行。記得臨時借來的空間要還(改)回去哦!
好啦,只有瞭解它,才能駕馭它!一哥如此機智有內涵的大招學會了嗎?快快上手試試吧!一哥的大招讓你大數據運行飛起來!
沒有留言:
張貼留言