小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

2024國賽數(shù)學(xué)建模全流程,從數(shù)據(jù)預(yù)處理到模型評估

 洛工人 2024-08-28 發(fā)布于河南

關(guān)注SPSSAU

數(shù)據(jù)分析 簡單一點

論文問卷 快人一步

數(shù)學(xué)建模國賽

SPSSAU出品 · 必屬精品 · 建議收藏

↓↓↓↓↓↓↓↓

有些同學(xué)臨近比賽開始緊張心慌,快比賽了覺得自己什么都不會怎么辦?隊友和我都不會編程建模怎么辦?說到底這只是一次比賽,賽前一定要調(diào)整好自己的心態(tài),至于怎么去學(xué),沒有比直接參賽更能促進學(xué)習(xí)的方法,比賽中遇到不會的知識再正常不過了,學(xué)會去網(wǎng)上搜現(xiàn)學(xué)現(xiàn)用就夠了。第一次參加數(shù)學(xué)建模比賽的同學(xué),可能不太知道數(shù)學(xué)建模拿到題目之后的整個流程是怎么樣的,今天就和大家來分享一下數(shù)學(xué)建模的全流程。

SPSSAU 

數(shù)學(xué)建模常用方法大致可分為四大部分:數(shù)據(jù)預(yù)處理、基本描述、建模、模型評價,如下圖:

圖片接下來將逐個進行介紹說明。

一、數(shù)據(jù)預(yù)處理

國賽的數(shù)據(jù)預(yù)處理是指進行數(shù)據(jù)的清洗和變換預(yù)處理的質(zhì)量會直接影響到后續(xù)建模和預(yù)測的準(zhǔn)確性。數(shù)據(jù)清洗也就是我們常說的缺失值處理和異常值處理,數(shù)據(jù)變換是指對數(shù)據(jù)進行標(biāo)準(zhǔn)化、歸一化等無量綱化處理,常見的數(shù)據(jù)預(yù)處理方式見下圖:

圖片

1

異常值處理


異常值也稱離群值,其數(shù)值明顯偏離它所屬樣本集的其余觀測值。忽視異常值的存在可能會對建模結(jié)果產(chǎn)生不良影響。

(1)識別異常值
  • 可視化方法:使用箱線圖、散點圖等可視化工具來識別異常值。
  • 統(tǒng)計方法:使用Z-score、IQR(四分位距)等方法來識別數(shù)據(jù)點是否為異常值。
(2)處理異常值的方法

異常值處理通常有以下4種方式:

圖片

2

缺失值處理


對缺失值進行處理方法通常有刪除、填充、插值3類方法,說明如下表:

圖片

對于異常值和缺失值的處理,可以使用SPSSAU【數(shù)據(jù)處理】模塊的【異常值】方法進行處理,操作如下:

圖片

點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

異常值處理

3

量綱處理


量綱處理是指通過數(shù)據(jù)變換來消除原始變量的量綱影響的方法,使模型更加穩(wěn)定和準(zhǔn)確。常見的量綱處理方法包括標(biāo)準(zhǔn)化、歸一化、中心化、正向化、逆向化、適度化等等,說明如下:

圖片

SPSSAU提供17種數(shù)據(jù)無量綱化處理方法,在【數(shù)據(jù)處理】模塊選擇【生成變量】操作如下:

圖片

選擇合適的無量綱化方法取決于數(shù)據(jù)的分布特征和后續(xù)建模的需求。通常需要嘗試多種方法并比較效果。點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

生成變量

二、描述性分析

在數(shù)學(xué)建模中,描述性統(tǒng)計分析是一種基本的數(shù)據(jù)探索方法,是理解數(shù)據(jù)特征的重要步驟。它幫助模型開發(fā)者理解數(shù)據(jù)的基本特征、分布情況以及變量之間的關(guān)系。

描述性統(tǒng)計分析步驟:
  • 計算基本統(tǒng)計量:均值、中位數(shù)、標(biāo)準(zhǔn)差等
  • 繪制可視化圖表:直方圖、箱線圖等
  • 分析數(shù)據(jù)分布:是否正態(tài)分布,是否有偏態(tài)
  • 檢查相關(guān)性:變量間的關(guān)系

描述性統(tǒng)計分析方法整理表格如下:

圖片

點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

描述分析

正態(tài)性檢驗

直方圖

箱線圖

散點圖

相關(guān)分析


三、建模

數(shù)學(xué)建模關(guān)鍵的步驟就在于模型的選擇與構(gòu)建,根據(jù)問題的性質(zhì)選擇合適的模型類型,如分類模型、評價模型、預(yù)測模型等。

1

分類模型


分類模型是一種按照數(shù)學(xué)模型來分類數(shù)據(jù)的算法。它通過對給定的歷史數(shù)據(jù)進行分析,根據(jù)已知的分類規(guī)則來對新的數(shù)據(jù)進行預(yù)測。常見的分類模型有聚類分析、判別分析、logistic回歸以及機器學(xué)習(xí)。

圖片

(1)聚類分析

常用的聚類分析分為K-means聚類、K-modes聚類、K-prototype聚類以及分層聚類。其中前三種聚類方法是按行聚類(R型聚類),分層聚類是按列聚類(Q型),最常用的為K-means聚類,各自適用場景說明如下表:


圖片


有關(guān)4種聚類方法的詳細介紹,可以查看往期這篇文章:
干貨合集→聚類分析

(2)判別分析
判別分析用于根據(jù)已知的分類信息對觀測數(shù)據(jù)進行分類。判別分析有很多種,比如Fisher判別、距離判別、Beyes判別等,其中Fisher判別使用頻率最高

圖片


(3)logistic回歸
logistic回歸可以用于分類,它的核心思想是利用邏輯函數(shù)將線性回歸的結(jié)果轉(zhuǎn)化成一個概率值,這個概率值可以用來進行分類。logistic回歸分析可細分為二元logistic回歸、多分類logistic回歸、有序logistic回歸。各自適用場景說明如下表:

圖片


點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

二元logistic回歸

多分類logistic回歸

有序logistic回歸


(4)機器學(xué)習(xí)
機器學(xué)習(xí)算法中常用于分類的模型包括決策樹、隨機森林、KNN、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、支持向量機等等。具體說明如下:

圖片


點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:
決策樹
隨機森林
KNN
神經(jīng)網(wǎng)絡(luò)
樸素貝葉斯
支持向量機

2

評價模型


在數(shù)學(xué)建模中,評價模型通常指的是對構(gòu)建的模型進行評估,以確定其性能和適用性。評價模型的目的是確保模型能夠準(zhǔn)確地反映實際問題,并且能夠提供有效的決策支持。在評價模型中,常用的方法如層次分析法、模糊綜合評價、灰色關(guān)聯(lián)法、主成分分析法、TOPSIS法、數(shù)據(jù)包絡(luò)分析、秩和比等等,如下表:

圖片


除以上單一評價模型以外,還可以使用多種方法進行組合評價,點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

層次分析法

模糊綜合評價
灰色關(guān)聯(lián)法
主成分分析

TOPSIS法

數(shù)據(jù)包絡(luò)分析

秩和比


3

預(yù)測模型


數(shù)學(xué)建模預(yù)測模型是一種利用數(shù)學(xué)模型和統(tǒng)計方法來預(yù)測未來可能發(fā)生的結(jié)果的模型。它通常基于歷史數(shù)據(jù)和已知信息,通過建立數(shù)學(xué)模型來分析問題,并預(yù)測未來的發(fā)展趨勢。預(yù)測類常見的方法有時間序列類預(yù)測、回歸分析進行預(yù)測、機器學(xué)習(xí)進行預(yù)測、馬爾科夫預(yù)測或者其它方法組合預(yù)測。

圖片



(1)時間序列預(yù)測
時間序列數(shù)據(jù)是按照時間順序排列的數(shù)據(jù)集合,例如每天的銷售量、每月的股票價格等。預(yù)測時間序列數(shù)據(jù)可以幫助我們了解未來的趨勢和模式,從而做出更準(zhǔn)確的決策。比較常用的時間序列數(shù)據(jù)預(yù)測方法有ARIMA預(yù)測、指數(shù)平滑法、灰色預(yù)測模型、VAR模型、季節(jié)Sarima模型,說明如下:

圖片

點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

ARIMA預(yù)測
指數(shù)平滑法
灰色預(yù)測模型
VAR模型
季節(jié)Sarima模型分析

(2)回歸分析預(yù)測
回歸分析是一種常用的統(tǒng)計方法,用于建立變量間的關(guān)系模型,并通過該模型對未知數(shù)據(jù)進行預(yù)測。常用方法如多元線性回歸、logistic回歸、非線性回歸等,說明如下:

圖片


點擊下方鏈接跳轉(zhuǎn)至相應(yīng)方法幫助手冊:

多元線性回歸

logistic回歸

非線性回歸


(3)機器學(xué)習(xí)預(yù)測
機器學(xué)習(xí)用于從數(shù)據(jù)中學(xué)習(xí)模式和規(guī)律,并利用這些知識進行預(yù)測通過訓(xùn)練算法來自動發(fā)現(xiàn)數(shù)據(jù)中的模式,并根據(jù)這些模式進行未知樣本的預(yù)測。常用方法及說明如下:

圖片


有關(guān)預(yù)測模型的總結(jié)可查看往期這篇文章,做過完整介紹:
常用預(yù)測類數(shù)據(jù)分析方法分類匯總

四、模型評估

在進行模型構(gòu)建與分析時,模型評價是非常關(guān)鍵的一步。合適的評價指標(biāo)可以幫助我們準(zhǔn)確地衡量模型的性能,從而進行優(yōu)化和改進。然而,不同的模型和應(yīng)用場景需要使用不同的評價指標(biāo)。下圖為回歸模型和分類模型常用評價指標(biāo)

圖片

圖片

關(guān)于模型評價常用指標(biāo)可以查看下方文章,已經(jīng)做過總結(jié):

模型評價指標(biāo)——回歸模型&分類模型


以上就是數(shù)學(xué)建模競賽可能涉及到的大部分模型以及方法,使用SPSSAU系統(tǒng)都可以快速完成,即便是不會建模的小白,也可以沖刺一下獎項哦~


若要了解數(shù)學(xué)建模相關(guān)的更詳細知識,可進入SPSSAU官網(wǎng)查看幫助手冊or聯(lián)系智能客服or人工客服為您解答。



圖片

以上就是今天的全部內(nèi)容啦~

若您想看其他干貨內(nèi)容

請在評論區(qū)告訴SPSSAU

圖片

圖片

數(shù)據(jù)分析救命神器

讓你的數(shù)據(jù)處理

非常簡單!

圖片

點擊下方  跳轉(zhuǎn)至SPSSAU官方賬號

圖片

圖片

圖片


圖片

SPSSAU

數(shù)據(jù)科學(xué)分析平臺

www.

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多