一、數(shù)據(jù)預(yù)處理
|
關(guān)注SPSSAU 數(shù)據(jù)分析 簡單一點 論文問卷 快人一步 數(shù)學(xué)建模國賽 SPSSAU出品 · 必屬精品 · 建議收藏 ↓↓↓↓↓↓↓↓ SPSSAU 數(shù)學(xué)建模常用方法大致可分為四大部分:數(shù)據(jù)預(yù)處理、基本描述、建模、模型評價,如下圖:
一、數(shù)據(jù)預(yù)處理 國賽的數(shù)據(jù)預(yù)處理是指進行數(shù)據(jù)的清洗和變換,預(yù)處理的質(zhì)量會直接影響到后續(xù)建模和預(yù)測的準(zhǔn)確性。數(shù)據(jù)清洗也就是我們常說的缺失值處理和異常值處理,數(shù)據(jù)變換是指對數(shù)據(jù)進行標(biāo)準(zhǔn)化、歸一化等無量綱化處理,常見的數(shù)據(jù)預(yù)處理方式見下圖:
異常值也稱離群值,其數(shù)值明顯偏離它所屬樣本集的其余觀測值。忽視異常值的存在可能會對建模結(jié)果產(chǎn)生不良影響。
異常值處理通常有以下4種方式:
對缺失值進行處理方法通常有刪除、填充、插值3類方法,說明如下表:
對于異常值和缺失值的處理,可以使用SPSSAU【數(shù)據(jù)處理】模塊的【異常值】方法進行處理,操作如下:
點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊: 量綱處理是指通過數(shù)據(jù)變換來消除原始變量的量綱影響的方法,使模型更加穩(wěn)定和準(zhǔn)確。常見的量綱處理方法包括標(biāo)準(zhǔn)化、歸一化、中心化、正向化、逆向化、適度化等等,說明如下:
SPSSAU提供17種數(shù)據(jù)無量綱化處理方法,在【數(shù)據(jù)處理】模塊選擇【生成變量】操作如下:
選擇合適的無量綱化方法取決于數(shù)據(jù)的分布特征和后續(xù)建模的需求。通常需要嘗試多種方法并比較效果。點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊: 二、描述性分析 在數(shù)學(xué)建模中,描述性統(tǒng)計分析是一種基本的數(shù)據(jù)探索方法,是理解數(shù)據(jù)特征的重要步驟。它幫助模型開發(fā)者理解數(shù)據(jù)的基本特征、分布情況以及變量之間的關(guān)系。
點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊: 三、建模 數(shù)學(xué)建模關(guān)鍵的步驟就在于模型的選擇與構(gòu)建,根據(jù)問題的性質(zhì)選擇合適的模型類型,如分類模型、評價模型、預(yù)測模型等。
(1)聚類分析 常用的聚類分析分為K-means聚類、K-modes聚類、K-prototype聚類以及分層聚類。其中前三種聚類方法是按行聚類(R型聚類),分層聚類是按列聚類(Q型),最常用的為K-means聚類,各自適用場景說明如下表:
點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:
點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:
點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊: 多元線性回歸
四、模型評估 在進行模型構(gòu)建與分析時,模型評價是非常關(guān)鍵的一步。合適的評價指標(biāo)可以幫助我們準(zhǔn)確地衡量模型的性能,從而進行優(yōu)化和改進。然而,不同的模型和應(yīng)用場景需要使用不同的評價指標(biāo)。下圖為回歸模型和分類模型常用評價指標(biāo):
關(guān)于模型評價常用指標(biāo)可以查看下方文章,已經(jīng)做過總結(jié): 以上就是數(shù)學(xué)建模競賽可能涉及到的大部分模型以及方法,使用SPSSAU系統(tǒng)都可以快速完成,即便是不會建模的小白,也可以沖刺一下獎項哦~ 若要了解數(shù)學(xué)建模相關(guān)的更詳細知識,可進入SPSSAU官網(wǎng)查看幫助手冊or聯(lián)系智能客服or人工客服為您解答。 ![]() 以上就是今天的全部內(nèi)容啦~ 若您想看其他干貨內(nèi)容 請在評論區(qū)告訴SPSSAU
數(shù)據(jù)分析救命神器 讓你的數(shù)據(jù)處理 非常簡單! ![]() 點擊下方 跳轉(zhuǎn)至SPSSAU官方賬號 ![]() |
|
|