在大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析有多重要?對(duì)企業(yè)來說,面對(duì)大數(shù)據(jù)“洪流”,要想從中提取有效信息,“如同從打開的高壓水管中喝水一樣困難”。 機(jī)器學(xué)習(xí)準(zhǔn)確率也與數(shù)據(jù)的關(guān)系? 大數(shù)據(jù)也包含以下四種分析方法- 大數(shù)據(jù),小分析:即數(shù)據(jù)倉庫領(lǐng)域的OLAP分析思路,也就是多維分析思想。
- 大數(shù)據(jù),大分析:這個(gè)代表的就是數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)分析法。
- 流式分析:這個(gè)主要指的是事件驅(qū)動(dòng)架構(gòu)。
- 查詢分析:經(jīng)典代表是NoSQL數(shù)據(jù)庫。
然而在大數(shù)據(jù)時(shí)代下,SPSS也是助推“數(shù)據(jù)分析”能力培養(yǎng)為關(guān)鍵之一。 SPSS是世界上最早的統(tǒng)計(jì)分析軟件。SPSS Modeler 中讀取數(shù)據(jù)格式- 文本文件
- Excel文件
- CSV文件
- Statistics 數(shù)據(jù)文件
- ODBC 兼容的數(shù)據(jù)庫
- SAS 數(shù)據(jù)文件
- 用戶輸入文件
SPSS Modeler用戶界面主要優(yōu)點(diǎn)如下: - 操作簡(jiǎn)便:界面非常友好,除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外,大多數(shù)操作可通過鼠標(biāo)拖曳、點(diǎn)擊“菜單”、“按鈕”和“對(duì)話框”來完成。
- 編程方便:具有第四代語言的特點(diǎn),告訴系統(tǒng)要做什么,無需告訴怎樣做。只要了解統(tǒng)計(jì)分析的原理,無需通曉統(tǒng)計(jì)方法的各種算法,即可得到需要的統(tǒng)計(jì)分析結(jié)果。對(duì)于常見的統(tǒng)計(jì)方法,SPSS的命令語句、子命令及選擇項(xiàng)的選擇絕大部分由“對(duì)話框”的操作完成。因此,用戶無需花大量時(shí)間記憶大量的命令、過程、選擇項(xiàng)。
- 功能強(qiáng)大:具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、報(bào)表、圖形制作等功能。自帶11種類型136個(gè)函數(shù)。SPSS提供了從簡(jiǎn)單的統(tǒng)計(jì)描述到復(fù)雜的多因素統(tǒng)計(jì)分析方法,比如數(shù)據(jù)的探索性分析、統(tǒng)計(jì)描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗(yàn)、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。
- 數(shù)據(jù)接口:能夠讀取及輸出多種格式的文件。比如由dBASE、FoxBASE、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。能夠把SPSS的圖形轉(zhuǎn)換為7種圖形文件。結(jié)果可保存為*.txt及html格式的文件。
- 模塊組合:SPSS for Windows軟件分為若干功能模塊。用戶可以根據(jù)自己的分析需要和計(jì)算機(jī)的實(shí)際配置情況靈活選擇。
- 針對(duì)性強(qiáng):SPSS針對(duì)初學(xué)者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡(jiǎn)單的操作分析,大多青睞于SPSS。
具體實(shí)際操作如下: 可視化編程- 節(jié)點(diǎn) –一個(gè)圖標(biāo)代表在 SPSS Modeler 中進(jìn)行的一個(gè)操作
- 工作流 –一系列連接在一起的節(jié)點(diǎn)
- 選項(xiàng)板 –包含一系列不同功能的圖標(biāo)
選項(xiàng)板- 源節(jié)點(diǎn) –用來將數(shù)據(jù)讀入 SPSS Modeler 中
- 記錄選項(xiàng)節(jié)點(diǎn) –在記錄上進(jìn)行操作 –一條記錄是一種“情形”或一“行”數(shù)據(jù)
- 字段選項(xiàng)節(jié)點(diǎn) –在字段上進(jìn)行操作 –一個(gè)字段是一個(gè)變量
- 圖形節(jié)點(diǎn) –在建模之前和之后用來可視化數(shù)據(jù)
- 建模節(jié)點(diǎn)代表有效建模算法
- –注意:建模算法產(chǎn)生生成的模型
增加一個(gè)節(jié)點(diǎn)- 在選項(xiàng)板上雙擊節(jié)點(diǎn),自動(dòng)放置節(jié)點(diǎn)到數(shù)據(jù)流區(qū)域注意:它會(huì)自動(dòng)地連接到“中心”節(jié)點(diǎn)
- 將節(jié)點(diǎn)從選項(xiàng)板拖放到數(shù)據(jù)流區(qū)域中
- 在選項(xiàng)板上點(diǎn)擊一個(gè)節(jié)點(diǎn),然后在數(shù)據(jù)流區(qū)域中點(diǎn)擊一下
- 當(dāng)節(jié)點(diǎn)在選項(xiàng)板中被選中后,會(huì)變成淡藍(lán)色
連接節(jié)點(diǎn) 刪除節(jié)點(diǎn)之間的連接 關(guān)于連接節(jié)點(diǎn):源節(jié)點(diǎn) 關(guān)于連接節(jié)點(diǎn):終端節(jié)點(diǎn)? 注釋流和節(jié)點(diǎn)小結(jié)在本文中我們簡(jiǎn)單介紹了數(shù)據(jù)分析其中一點(diǎn)SPSS,每天一點(diǎn)小知識(shí),一天一個(gè)小技能。 還有關(guān)于更多SPSS的知識(shí),比如處理缺失數(shù)據(jù)的建議, 數(shù)據(jù)審核,SPSS數(shù)據(jù)文件的結(jié)構(gòu)等詳細(xì)解析,在PDF源文件都有,可領(lǐng)取資料全文下載。
領(lǐng)取方式
|