小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

學科建設 | 十字路口的統(tǒng)計學: 誰在應對挑戰(zhàn)?

 菌心說 2021-07-25

編者按

最近國內(nèi)統(tǒng)計學屆召開多次學科建設相關會議,故重發(fā)本報告作為一種思路參考。本報告討論了統(tǒng)計學科面臨的機遇和挑戰(zhàn),由“統(tǒng)計和數(shù)據(jù)科學的作用/價值”、“科學和社會應用中的挑戰(zhàn)”、“基礎研究”、“專業(yè)文化與社區(qū)責任”、“博士教育”五部分組成,內(nèi)容來源于2018年10月15日至10月17日在弗吉尼亞州舉行的“十字路口的統(tǒng)計:數(shù)據(jù)科學時代的挑戰(zhàn)和機遇”研討會的報告。該報告由Xuming He組織并由指導委員會(成員為James Berger, Xuming He, David Madigan, Susan Murphy, Bin Yu和Jon Wellner)審核,由吳喜之老師翻譯,已得到委員會和譯者授權。

什么是未來?未來的數(shù)據(jù)分析能夠涉及巨大的進步,克服真正的困難,并為科技的各個領域提供出色的服務。會是這樣嗎?這完全依賴于我們,依賴于我們是愿意選擇解決實際問題的坎坷道路,還是選擇由不真實的假定、武斷的準則及脫離實際的抽象的結(jié)果構成的平坦的道路。誰來應對挑戰(zhàn)?

——JOHN W. TUKEY (1962), “FUTURE OF DATA ANALYSIS”

圖片

執(zhí)行摘要



我們的世界越來越依賴數(shù)據(jù)和計算來創(chuàng)造知識、做出關鍵決策以及更好地預測未來。數(shù)據(jù)科學已成為一個新的領域,通過集成和開發(fā)來自統(tǒng)計、計算機科學及實際領域的想法、概念和工具來支持這些數(shù)據(jù)驅(qū)動的活動。數(shù)據(jù)科學現(xiàn)在推動著生物學、天文學、材料科學、政治科學和醫(yī)學等多元化領域,更不用說全球經(jīng)濟的廣闊領域、政府的主要活動以及日常社交和社會功能。

統(tǒng)計領域正處于十字路口:我們要么通過擁抱和引領數(shù)據(jù)科學而蓬勃發(fā)展,要么拒絕并變得無關緊要。從長遠來看,要繁榮發(fā)展,我們必須重新定義、擴展和轉(zhuǎn)變統(tǒng)計領域。我們必須發(fā)展并成長為從數(shù)據(jù)中收集和提取有用信息的跨學科科學。隨著各數(shù)據(jù)科學實體在校園、行業(yè)和政府中快速建立,成功轉(zhuǎn)型的機會窗口有限,我們絕不能錯過。為實現(xiàn)這個變革,我們現(xiàn)在必須通過重新構想我們的教育計劃、重新思考教師的招聘和晉升以及加速必要的文化變遷。

我們的領域受益于對畢業(yè)生日益增長的需求,但一些新領域提供了更相關的訓練,而至少相對而言,統(tǒng)計教育停滯不前。此外,在領導位置上缺乏統(tǒng)計人員,我們并沒有主導校園或其他地方的數(shù)據(jù)科學對話。如果我們現(xiàn)在不站出來,我們就有可能失去資源、人才,甚至失去統(tǒng)計的未來。今天,我們的畢業(yè)生很容易找到工作,這反映出數(shù)據(jù)科學家對市場的絕望,不應該讓我們感到輕松。

學術院系必須采取大膽和戰(zhàn)略性的步驟來領導和推動轉(zhuǎn)型,然而,我們現(xiàn)有的大多數(shù)教師都準備不足,無法引領道路。使問題更加復雜的是,那些尚未接觸到統(tǒng)計可以解決實際問題的天才學生正傾向于那些更明顯地這樣做的學科,從而扼殺了將產(chǎn)生急需的未來統(tǒng)計領袖的關鍵教師渠道。我們需要重新思考我們?nèi)绾纹刚埥y(tǒng)計教師、如何資助他們的工作、以及用于規(guī)范和獎勵學術生涯發(fā)展的指標。統(tǒng)計領域正在擴大,并將繼續(xù)這樣做,但戰(zhàn)略性的及不斷變化的資源分配必須仍然是學術院系的高度優(yōu)先事項。統(tǒng)計學家需要與現(xiàn)實世界的問題合作,以影響外部世界,超越具體的問題解決,以區(qū)別于領域科學家,并開發(fā)基于經(jīng)驗證據(jù)和理論研究的一般工具,在程式化模型下,為數(shù)據(jù)科學提供見解。

理論可以為實踐提供關鍵的支架。例如,Stein關于James-Stein估計的開創(chuàng)性理論工作是思想開放的和根本的;它引導我們進行規(guī)范化,這在當今的大數(shù)據(jù)問題中非常有用。理論分析還提供了經(jīng)驗上成功的自助法、廣義估計方程和序貫蒙特卡羅的見解和支持。另一方面,如果統(tǒng)計中的理論工作既與實踐無關,也無源于實踐的動機,那么,前面引用的Tuky(1962)的話,“不真實的假定、武斷的標準和抽象的結(jié)果”,那么大多數(shù)此類工作的僅有的實際目的將是在簡歷中生成一個條目(并犧牲從審稿者到編輯的大量工作)。優(yōu)雅和深度是數(shù)學中合理的治理指標;偶爾統(tǒng)計理論也可以優(yōu)雅而深入,但不管怎樣,我們的指標是不同的。良好的統(tǒng)計理論必須指導和加強實踐,否則我們在浪費我們的時間和精力——時間和精力可以更好地花費并且在數(shù)據(jù)科學時代推動統(tǒng)計工作是十分必要的。

統(tǒng)計是一門基礎學科,對數(shù)據(jù)科學至關重要。與我們的計算機科學和領域科學的伙伴合作,我們可以在我們的基礎上構建并轉(zhuǎn)換統(tǒng)計成為Fisher、Box、Tukey和Breiman最初設想的學科。統(tǒng)計包括實踐、計算和理論,但這些組成部分之間的平衡已經(jīng)嚴重扭曲,而且缺乏聯(lián)系。在必須繼續(xù)推動理論界限的同時,更多的統(tǒng)計人員需要投入于實踐以證明我們對社會的價值,為基礎研究方向提供信息,并有效地教學,使學生學習實用技能?,F(xiàn)在,更新基本概念、基礎設施、教學模式和適應新的數(shù)據(jù)科學時代的文化的時機已經(jīng)成熟。更具體地說,我們總結(jié)我們的主要調(diào)查結(jié)果和建議如下:

1. 實踐的中心作用

今天,我們緊迫地需要以相關的計算和理論為支撐,把實踐放在學科的中心。統(tǒng)計和數(shù)據(jù)科學的研究和教育必須著眼于解決現(xiàn)實世界的問題,總體上必須投入科學和領域問題,對統(tǒng)計以外的領域產(chǎn)生可衡量的影響和貢獻。隨著數(shù)據(jù)科學的迅速成熟,這是行業(yè)轉(zhuǎn)型以擁抱和引領以數(shù)據(jù)為中心的世界的關鍵時期。統(tǒng)計領域的領導人需要做更多的工作,以加快轉(zhuǎn)型,并將這一領域推廣到廣大科學界和公眾領域。

2. 強調(diào)影響

該專業(yè)需要在學術成就評估中更加重視統(tǒng)計研究的科學和社會影響。NSF等政府機構應鼓勵統(tǒng)計學家和其他科學家之間的研究伙伴關系,以確?;A研究在科學、工程和社會方面具有良好基礎。ASA和IMS等專業(yè)組織也應促進這一點。主要大學的晉升和任期研究評估需要更廣闊的視野,不僅要衡量專業(yè)內(nèi)的影響,還要衡量在應用領域的影響。社區(qū)需要重視軟件/平臺開發(fā)的重要性。當前過分強調(diào)出版物的數(shù)量對專業(yè)是有害的。對于實踐和理論而言,質(zhì)量和影響應該是主要的評估指標。

3. 為更好的實踐做研究?

為了使統(tǒng)計研究有效地支持科學與現(xiàn)實世界中的數(shù)據(jù)問題,毋庸置疑,統(tǒng)計研究的表述必須反映和捕捉現(xiàn)代數(shù)據(jù)問題中存在的現(xiàn)實。例如,基礎研究在動態(tài)建模,因果分析和關于依賴性及異質(zhì)性的推斷方法中是需要的。

4. 迎接重大挑戰(zhàn)

該領域已準備好接受重大研究問題,以開發(fā)經(jīng)過實踐證明的統(tǒng)計調(diào)查過程,包括問題制定、數(shù)據(jù)處理以及統(tǒng)計和機器學習方法/算法,用于分析新興數(shù)據(jù)類型(例如文本,圖像,關系型數(shù)據(jù))、開發(fā)支持和推進此類工作的相關理論、發(fā)展計算平臺,這些計算平臺考慮了統(tǒng)計效率、計算、通信和存儲成本以及人員參與成本之間的各種平衡。我們必須解決統(tǒng)計和數(shù)據(jù)科學所有研究領域的研究協(xié)議、評估指標和基礎架構開發(fā)方面的問題。

5. 更廣泛的方法評估指標

方法論的發(fā)展需要較少關注單一目標下的最優(yōu)性,而應更多地關注涉及穩(wěn)定性/穩(wěn)健性、可再現(xiàn)性、公平性、計算可行性、經(jīng)驗證據(jù)和在領域科學中已證明的影響的適當指標。

6. 訓練現(xiàn)代技能

我們必須培養(yǎng)在批判性思維、建模、計算和交流等方面有重要技能的下一代統(tǒng)計學家和數(shù)據(jù)科學家。我們需要重新構想我們的博士學位課程,以適應統(tǒng)計學的必要轉(zhuǎn)變。


背景


“十字路口的統(tǒng)計:數(shù)據(jù)科學時代的挑戰(zhàn)和機遇”研討會于2018年10月15日星期一至10月17日星期三在弗吉尼亞州阿靈頓的萬豪水晶門戶酒店舉行。此次研討會聚集了約48位領先的研究人員和教育工作者,利用數(shù)據(jù)科學時代前所未有的機遇和挑戰(zhàn),為統(tǒng)計領域制定10-20年的愿景。2018年9月10日至10月2日舉行了兩次研討會前網(wǎng)絡研討會,數(shù)百名在線參與者參加了此次研討會。網(wǎng)絡研討會和研討會由來自Knowinnovation的促進團隊協(xié)助,目的是尋求社區(qū)的廣泛投入,并牢記以下三個目標:

1.識別需要新的統(tǒng)計基礎,方法論和計算思想的新興研究主題;

2.應對不同應用領域中數(shù)據(jù)驅(qū)動的重要挑戰(zhàn),并促進跨學科合作以應對重要的科學挑戰(zhàn);

3.創(chuàng)建一個充滿活力的研究社區(qū),在統(tǒng)計的不同子領域之間保持適當?shù)钠胶?包括對基金會的投資。

該項目由NSF贊助,由指導委員會和一組主題負責人組織。這個由六名成員組成的指導委員會由James Berger, Xuming He, David Madigan, Susan Murphy, Bin Yu和Jon Wellner組成,負責項目的總體規(guī)劃。十名主題負責人負責主持和總結(jié)在線論壇和研討會上的討論。主題負責人包括David Banks, Alicia Carriquiry, David Higdon, Jennifer Hill, Nicholas Horton, Michael Jordan, Marianthi Markatou, Dylan Small, Marina Vannucci和Ming Yuan。

本執(zhí)行摘要由Xuming He, David Madigan, Bin Yu和Jon Wellner編寫。該報告的第一版是由Xuming He組織并由指導委員會監(jiān)督的大量撰稿人提供的。我們的撰稿人代表不同的統(tǒng)計人員小組,他們共享報告中討論的核心價值,但不一定在每個細節(jié)上都達成一致。指導委員會有意選擇在報告中包含挑釁性言論,以鼓勵更廣泛社區(qū)的討論和辯論。

該報告旨在能讓廣泛的統(tǒng)計和數(shù)據(jù)科學領域的主要利益相關的讀看到,包括學術院系,大學行政管理部門和資助機構。

在第1節(jié)中討論了統(tǒng)計和數(shù)據(jù)科學的作用和價值之后,本報告重點關注與新興研究和應用中的數(shù)據(jù)驅(qū)動挑戰(zhàn)相關的兩個目標。第2節(jié)從科學和社會應用引起的數(shù)據(jù)挑戰(zhàn)中確定新興研究主題,第3節(jié)討論基礎研究中的許多新興領域。執(zhí)行摘要中還總結(jié)了如何應對這些數(shù)據(jù)驅(qū)動的挑戰(zhàn)并促進跨學科合作。第4節(jié)(專業(yè)文化和社區(qū)責任)和第5節(jié)(博士教育)涉及創(chuàng)建充滿活力的研究社區(qū)并保持適當平衡的第三個目標。

1. 統(tǒng)計和數(shù)據(jù)科學的作用/價值

2002年,NSF舉辦了一個研討會,討論統(tǒng)計學界未來的挑戰(zhàn)和機遇;參見Lindsay Kettenring, and Siegmund(2004)。那時,統(tǒng)計界看到了越來越多的大規(guī)模數(shù)據(jù)的出現(xiàn)帶來的快速變化和持續(xù)增長。從那時起,該領域的發(fā)展加速了,包括統(tǒng)計領域的本科和研究生課程的規(guī)模以及統(tǒng)計領域與其他領域之間相互作用的廣度。同時,公共和私營部門都接受了大數(shù)據(jù),因為越來越多的人認識到大數(shù)據(jù)可以深入了解生物過程的本質(zhì)、精密醫(yī)學、氣候變化、社會和經(jīng)濟行為、風險評估和決策。數(shù)據(jù)科學已將自身展示為一種自然的跨領域發(fā)現(xiàn)方法。

毫無疑問,被認為是從數(shù)據(jù)中學習的統(tǒng)計學在數(shù)據(jù)科學中具有中心地位。實際上,一些統(tǒng)計系最近更名為統(tǒng)計和數(shù)據(jù)科學系(例如,耶魯大學,卡內(nèi)基梅隆大學和UT奧斯汀分校)。全國各地的大學(例如,密歇根大學)現(xiàn)在都為本科生提供數(shù)據(jù)科學專業(yè),并且越來越多的機構以各種名稱提供了數(shù)據(jù)科學碩士學位課程,這些機構來自各個領域,例如商學院,信息學院和計算機科學學院。統(tǒng)計界認識到,我們正處在十字路口,擁有前所未有的機會,使其自身現(xiàn)代化成為數(shù)據(jù)科學的主要參與者。

1.1 統(tǒng)計作為數(shù)據(jù)驅(qū)動的學科

自從統(tǒng)計學作為一個領域誕生以來,它就一直受到科學技術進步的影響。今天,在幾乎每個學科中都需要收集和分析數(shù)據(jù)的情況下,這一點可能尤其如此。隨著數(shù)據(jù)驅(qū)動的科學范式成為一種新規(guī)范,我們有機會改變自己的領域,并在數(shù)據(jù)科學中發(fā)揮領導作用,尤其是在統(tǒng)計思維與計算思維之間的相互作用上。正如Wender(2017)在國家科學院的報告所討論的那樣,大數(shù)據(jù)既有希望,也有危險。統(tǒng)計數(shù)據(jù)正處于以數(shù)據(jù)為中心的世界的中心,可以幫助私營和公共部門的科學家和領導者實現(xiàn)大數(shù)據(jù)的真正潛力。

為了融入當今重要的社會和科學計劃,我們絕不能將研究局限于純粹的知識好奇心,也不能將對下一代統(tǒng)計學家和數(shù)據(jù)科學家的培訓僅限于傳統(tǒng)課程,無論它們曾經(jīng)多么成功。10月的研討會以三位在精密醫(yī)學領域最前沿的數(shù)據(jù)科學家(Simon Tavaré)、微數(shù)據(jù)的使用(Julia Lane)和天文數(shù)據(jù)(Robert Lupton)的演講為開端,并繼續(xù)討論了許多數(shù)據(jù)挑戰(zhàn)。我們同意,雖然統(tǒng)計數(shù)據(jù)本身就是一個領域,但它與應用的緊密聯(lián)系必須繼續(xù)并加強,這些應用自然包括來自物理科學、社會科學、醫(yī)學、工程、金融、工業(yè)、治理、體育和藝術的各種數(shù)據(jù)問題。

統(tǒng)計和數(shù)據(jù)科學的核心價值在于它如何促進科學和社會的理解與發(fā)現(xiàn)。合理的數(shù)據(jù)收集實驗設計可提高效率和數(shù)據(jù)質(zhì)量。統(tǒng)計過程控制導致制造質(zhì)量的提高。不確定性的統(tǒng)計量化在確認分析和減少錯誤發(fā)現(xiàn)的風險中起著至關重要的作用。重采樣方法和貝葉斯計算在廣泛的應用中很有用,因為它們可以容納復雜的模型。對于統(tǒng)計和數(shù)據(jù)科學而言,持續(xù)證明其對現(xiàn)實世界問題的價值很重要。

統(tǒng)計學發(fā)展了作為數(shù)據(jù)分析指導原則的基礎和理論。計算方法和軟件開發(fā)對于實踐同樣重要。我們工作的影響不應局限于任何單個應用程序,統(tǒng)計的進步可以對許多應用產(chǎn)生重大影響(例如,Bootstrap、MCMC和貝葉斯計算、類似LASSO的壓縮感知方法、一般的適用于大數(shù)據(jù)的非參數(shù)化方法,例如隨機森林和深度神經(jīng)網(wǎng)絡)。

許多成熟的統(tǒng)計方法已被“商品化”—有免費的,高質(zhì)量的軟件可以執(zhí)行許多統(tǒng)計分析。這些方法通??梢蕴峁﹥r值,但需要統(tǒng)計學家扮演新角色。我們需要訓練下一代的數(shù)據(jù)科學家,他們具有在問題表述和對統(tǒng)計概念的正確解釋等方面的關鍵技能。

新理論、方法和方法的動機可能源于由新的調(diào)查領域驅(qū)動的大規(guī)模協(xié)作調(diào)查,這些調(diào)查通過現(xiàn)代傳感和數(shù)據(jù)收集技術以及最先進的數(shù)據(jù)存儲和計算平臺而得以實現(xiàn)。這些調(diào)查幾乎影響了所有領域,并改變了統(tǒng)計與之相關的方式。從農(nóng)業(yè)到社交網(wǎng)絡,從遺傳學到商業(yè)分析,統(tǒng)計學家和數(shù)據(jù)科學家都處于獨特的位置,可以幫助科學家解決有關數(shù)據(jù)發(fā)現(xiàn)的重要問題。

統(tǒng)計人員和統(tǒng)計學如何協(xié)助和進行科學研究有很多方式。它們包括:

1.通用方法和軟件(例如,回歸,用于設計實驗的DOE軟件)的應用

由于改進的軟件和數(shù)據(jù)平臺,在線幫助(例如堆棧交換)、開放源代碼的用戶支持的靈活通用軟件環(huán)境(python,R),通用工具的使用近來有迅速的強大正面效果。統(tǒng)計方法和軟件已經(jīng)出現(xiàn)爆炸式增長,現(xiàn)在可供所有用戶使用(R包,python)。大數(shù)據(jù)科學家顯然從這種把統(tǒng)計提供給應用的模式中受益。此外,由于他們具有從現(xiàn)代(數(shù)據(jù)密集型,HPC和網(wǎng)格)平臺訪問數(shù)據(jù)的技能,因此可以將已開發(fā)的方法和軟件應用于新出現(xiàn)的問題。

2.作為大學環(huán)境中的顧問或自由職業(yè)者

統(tǒng)計人員和數(shù)據(jù)科學家可能會專注于特定類型的問題或各種類型的問題,通常是多學科團隊努力的一部分。這是統(tǒng)計學和數(shù)據(jù)科學在以后幾十年需要產(chǎn)生影響的領域—因此,我們應該牢記這一點來進行激勵、培訓和開展研究。統(tǒng)計人員和數(shù)據(jù)科學家可以而且應該在國家實驗室、國家項目(例如大型天氣觀測望遠鏡,DARPA),主要行業(yè)(例如制藥公司,保險公司)和政府(例如美國人口普查,USDA)中發(fā)揮積極作用)。

3.作為學術研究人員

在這種環(huán)境下,研究與教學自然融合。但是,協(xié)作/多學科科學的深度可能會受到其他約束的限制。一個主要的約束是教師需要以主要作者的身份出版大量出版物。學術院系需要找到鼓勵研究人員參與大規(guī)模,多學科科學工作的方法。對學術成就的評估需要不限于只考慮本領域的出版物數(shù)量。應該強調(diào)對實際領域科學和數(shù)據(jù)科學實踐中的領導作用的可衡量的影響。為了使我們的領域在未來十年中蓬勃發(fā)展,迫切需要這樣的變革。

1.2 統(tǒng)計與人工智能

在許多技術和科學領域,“人工智能”(AI)一詞已開始被廣泛地用來描述使用數(shù)據(jù)分析和基于數(shù)據(jù)的決定來代替?zhèn)鹘y(tǒng)的計算機編程,這往往是在補充甚至取代人類的判斷。

大約在1955年,人工智能的最初目標是在軟件和硬件方面模仿人類的智慧。這一目標仍然是一個崇高的愿望,但可以說,這一目標遠未實現(xiàn)。在接下來的幾十年中,人工智能研究人員致力于實現(xiàn)這一目標,探索了一系列方法,包括邏輯推理、約束滿意度、規(guī)劃、概率推理和從數(shù)據(jù)中學習。后者通常被稱為“機器學習”(ML),這個術語在20世紀80年代開始被自我認定為人工智能研究人員的研究人員所廣泛使用。然而,到20世紀90年代,ML的方法和理論原理顯然與統(tǒng)計方法和原則密切相關,即使不是一模一樣的,ML和統(tǒng)計之間的區(qū)別開始消失。這兩個傳統(tǒng)的研究人員對跨越舊邊界的問題做出了重大貢獻。對ML產(chǎn)生了粗略的表征,強調(diào)分類、預測、非參數(shù)和計算效率。

這些新興理念直接適用于工業(yè)中新出現(xiàn)的問題,20世紀90年代和2000年代,ML在關鍵任務領域,如欺詐檢測、供應鏈建模、推薦系統(tǒng)、診斷、個性化搜索、廣告展示、工業(yè)機器人和物流。這些應用依靠開發(fā)平臺來收集和處理日益大量的數(shù)據(jù),這項活動需要計算機科學其他分支,特別是分布式系統(tǒng)和數(shù)據(jù)庫的專門知識。工業(yè)界開始使用“數(shù)據(jù)科學”一詞來指能夠以這種方式混合統(tǒng)計、數(shù)據(jù)庫和分布式系統(tǒng)的個人和研究團隊。同時,科學界的研究者,尤其是天文學,基因組學和地球科學的研究者,開始建立用于大規(guī)模數(shù)據(jù)分析的平臺,并經(jīng)常與業(yè)界共享資源(通過開源軟件的出現(xiàn)),并且他們的企業(yè)通常也被稱為“數(shù)據(jù)科學”。最后,整個企業(yè)不僅涉及平臺,而且與大規(guī)模數(shù)據(jù)有關,“數(shù)據(jù)科學”也在挑戰(zhàn)新環(huán)境中開始涉及應用統(tǒng)計的一些經(jīng)典問題(例如,缺失數(shù)據(jù)、可視化和因果關系)。

在過去十年中,這些趨勢發(fā)生了哪些變化,以至于被貼上了“AI”的標簽?主要的變化是,數(shù)據(jù)集在計算機視覺、語音識別和語言翻譯等領域出現(xiàn),這些領域具有足夠的規(guī)模和范圍,可以構建系統(tǒng),利用這些數(shù)據(jù)來模擬人類的感知和語言技能。實現(xiàn)這一點的算法是ML算法,這些算法與20世紀80年代相比變化不大,其中最重要的算法是神經(jīng)網(wǎng)絡中的反向傳播,該算法在80年代開發(fā),其根源在于20世紀50年代在最佳控制、信號處理、優(yōu)化和統(tǒng)計。平臺已經(jīng)改變,但是這些變化是工業(yè)和科學中大規(guī)模數(shù)據(jù)分析的更大趨勢的一部分。簡而言之,新的數(shù)據(jù)集的出現(xiàn)使得計算機視覺、語音識別和語言翻譯的經(jīng)典AI中心取得了顯著進展,這引發(fā)了整個企業(yè)的擴張,以反映其模仿人類的初衷。

Jordan(2019)將經(jīng)典的模仿人類的人工智能與智能增強(intelligence augmentation,IA)區(qū)別開來。在智能增強(IA)中,計算機用于增強人類的感知,認知和決策能力,如搜索引擎和圖像處理;在智能基礎設施(intelligent infrastructure, II)中,網(wǎng)絡的設備需要與多個人類決策者一起做出大量近乎同時的決策,例如在現(xiàn)代交通、商業(yè)、醫(yī)藥和金融系統(tǒng)中。統(tǒng)計原則在IA和II中至少與AI一樣重要。此外,在II中,統(tǒng)計原則將需要與微觀經(jīng)濟學原則相融合,以便相互作用的決策者可以有效地合作以應對稀缺性并確保公平和機會的獲取。

數(shù)據(jù)科學、機器學習和統(tǒng)計在它們要解決的問題方面有著基本相同的目標。這些領域的研究人員從不同但相互重疊的角度開發(fā)了方法論和方法。統(tǒng)計學并不認同模仿人類來構建自主學習系統(tǒng)的總體目標,而是側(cè)重于不確定性下的推理和決策過程中涉及的科學、數(shù)學、計算和社會問題。這些交錯領域之間正在發(fā)生一些交互和協(xié)作,并且還需要更多。對于深度學習的最新突破,人類的印記或參與以及計算能力是必不可少的,但是對于某些任務(例如病理報告解讀),我們可以想象,隨著時間的推移,人類將在人類前進到下一個挑戰(zhàn)時,機器將扮演更重要的角色。

2. 科學和社會應用中的挑戰(zhàn)

2.1 數(shù)據(jù)挑戰(zhàn)

新興的數(shù)據(jù)問題將推動數(shù)據(jù)挑戰(zhàn)。數(shù)據(jù)科學和IT市場的生態(tài)系統(tǒng)正在迅速進化,從而創(chuàng)造了具有可能無法預料的創(chuàng)新的新跨度。Netflix建立了電視內(nèi)容推薦系統(tǒng),然后對其進行反向工程,以創(chuàng)造新的流派來吸引觀眾。同樣,YouTube也為小眾表演者創(chuàng)造了新的機會來發(fā)現(xiàn)他們的藝術并將其商品化––比如業(yè)余樂隊的一個音樂家表演吸引了萬分之一的美國人,YouTube和其他載體便可以將他們的音樂賣給三萬個客戶,并且他們可以辭去日常工作。我們腳下的大地正在變化,我們必須比前幾代統(tǒng)計學家變得更加敏捷和富有企業(yè)家精神,以實現(xiàn)統(tǒng)計學的轉(zhuǎn)變。國家科學院的報告“海量數(shù)據(jù)分析的前沿”(http:///18374)討論了大數(shù)據(jù)帶來的許多挑戰(zhàn)。

復雜的領域問題伴隨著不同的數(shù)據(jù)形式:數(shù)字、圖像/視頻、語音和文本、以及這些形式的集成。統(tǒng)計的轉(zhuǎn)變是由大膽的實踐和跨學科研究驅(qū)動的,這些學科在計算和理論的支持下來解決此類數(shù)據(jù)問題。相關的理論和計算是始終需要的,但與過去相比,在很大程度上,有價值的學術成就將建立在在實踐和跨學科研究的基礎上。

具體來說,在新時代,我們看到以下數(shù)據(jù)挑戰(zhàn):

1.  數(shù)據(jù)的復雜方式多種多樣:數(shù)量、速度、多樣性、有效性,如果包括對抗性訓練,甚至用V代表Vendetta(仇殺隊)

2.  在許多情況下,可用數(shù)據(jù)并不是總體的有代表性的樣本

3.  通常,觀察到的數(shù)據(jù)是許多不同數(shù)據(jù)生成機制的疊加

4.  一些特定的解決方案可以推廣,而某些則不能。我們可以在類似問題上借用其強項及獲得啟發(fā),但是每種分析都必須適合于實際情況,以實現(xiàn)最大的收益

5.  歐盟的“通用數(shù)據(jù)保護條例”對分析施加了緊迫性,因為人們可能會反復隨意地選擇加入或退出研究,并且分析人員可能需要不斷進行昂貴的重新計算

6.  “通用數(shù)據(jù)保護條例”還要求透明性和可解釋性。如果某人被拒絕貸款,那么分析師必須能夠解釋原因——他們需要再穩(wěn)定工作兩年,或者他們每年需要多賺5000美元。定義可解釋性的含義是當前的研究

7.  可重復性:數(shù)據(jù)的清潔程序和處理需要成為可重復性管道的一部分。我們需要制定一套通用標準

8.  公平性:負責任的數(shù)據(jù)分析必須解決公平性問題。當數(shù)據(jù)涉及人群的時候,抽樣或測量中的偏差會導致歧視。我們必須教育所有人在數(shù)據(jù)分析中關于確保公平性的需要;參見,例如,Dwork et al(2012)

相應的文化和人類結(jié)構需要與這些數(shù)據(jù)挑戰(zhàn)保持一致:

1. 基礎設施:需要考慮到與數(shù)據(jù)分析有關的“費用”,包括組織大量數(shù)據(jù)和理解數(shù)據(jù)結(jié)構。這需要物理基礎設施(數(shù)據(jù)庫、在線存儲庫、數(shù)據(jù)管理、GitHub和共享軟件)以及具有適當知識/培訓的數(shù)據(jù)“專家”

2. 隨著問題空間變得越來越復雜(例如,基因組學或社交網(wǎng)絡中的因果推理),需要多學科團隊,甚至需要確定一個可處理的問題

3. 數(shù)據(jù)挑戰(zhàn)通常是依賴于領域的;不同的領域(從物理科學到社會科學)需要具有不同技能/專業(yè)知識的統(tǒng)計學家和數(shù)據(jù)科學家。重新構想的統(tǒng)計教育計劃需要用這樣的技能來訓練我們的學生

統(tǒng)計本身產(chǎn)生于科學家需要量化地使用測量、觀察和實驗以更好地理解科學現(xiàn)象的需要。天文學、賭博和遺傳學等初始應用領域推動了統(tǒng)計理論、概念和方法的開發(fā)和使用。自Breiman(2001)以來,我們在將機器學習作為統(tǒng)計的一部分方面取得了進展。在數(shù)據(jù)科學時代,新興應用非常豐富。在接下來的幾個小節(jié)中,我們討論了選定的幾個,并不做出列表是詳盡無遺的任何暗示。

2.2 精準健康/醫(yī)學

精確的健康/醫(yī)學研究需要對多模式、多尺度、多視角、異質(zhì)和相依賴數(shù)據(jù)進行集成和推斷;預測和不確定性量化以解決臨床醫(yī)學最大問題;將根據(jù)療效數(shù)據(jù)(即臨床試驗數(shù)據(jù))獲得的結(jié)果外推至有效性數(shù)據(jù)和個別患者的治療。

由于生物醫(yī)學研究技術的進步以及捕獲和存儲大量數(shù)據(jù)的整體能力的提高,生命科學,醫(yī)學科學以及公共衛(wèi)生領域的研究已經(jīng)發(fā)生了重大轉(zhuǎn)變。這些變化將科學生產(chǎn)力的瓶頸從數(shù)據(jù)生成和收集轉(zhuǎn)移到了數(shù)據(jù)管理、分析和解釋。生物醫(yī)學和生命科學中數(shù)據(jù)的爆炸式增長可以用來構建更精確,更準確的疾病分類以進一步發(fā)展精確的健康/醫(yī)學概念,從而有可能徹底改變診斷,治療和臨床決策的制定,以導致進行更個性化的治療并改善患者預后。例如,降低基因組測序的成本會增加可用的遺傳數(shù)據(jù),這些數(shù)據(jù)可用于了解許多疾病的根本原因。此外,電子健康記錄可用性的提高提供了對臨床數(shù)據(jù)的訪問,而各種移動設備提供了生活方式和其他類型的數(shù)據(jù),可用于促進疾病的更準確診斷和治療。

因此,精密醫(yī)學是一種新興的疾病治療和預防方法,它可以解決個體差異并整合一系列個性化數(shù)據(jù),包括基因組、表觀遺傳、環(huán)境、生活方式和病史數(shù)據(jù)。它著重于將個體分為對疾病的易感性和可能的治療反應不同的亞群。

為了實現(xiàn)精確健康的承諾,我們需要克服許多科學挑戰(zhàn),這些挑戰(zhàn)來自考慮所使用的多個數(shù)據(jù)源的特征—每個人被收集的數(shù)據(jù)歷史記錄,包括醫(yī)療記錄、健康概況、可穿戴設備、它們所接觸的環(huán)境、遺傳信息等。這些包括不同的數(shù)據(jù)類型,例如,數(shù)值、文本和圖像數(shù)據(jù)(多模式數(shù)據(jù))、多分辨率、多視角依賴數(shù)據(jù),具有許多不同類型的相關性,例如時間、空間和局部相關。此外,數(shù)據(jù)中可能存在測量誤差和偏差、異質(zhì)性(局部和空間環(huán)境異質(zhì)性)以及個體變異性和總體異質(zhì)性。所有上述數(shù)據(jù)特征都帶來了需要解決的基本挑戰(zhàn)。

精確健康的基本挑戰(zhàn)之一是識別治療效果的亞組。這是實現(xiàn)精確健康益處的重要一步,因為它提供了關于具有特定特征的個人對特定治療在療效或不良反應下如何作出反應的證據(jù)。不同的治療效果不僅包括各亞組發(fā)生的治療效果的數(shù)量差異,還包括治療效果的質(zhì)量差異。此外,根據(jù)研究目標,亞組的特征可能是探索性、數(shù)據(jù)驅(qū)動性或確認性。區(qū)分治療效果的亞組鑒定方法背后的一個關鍵思想是鑒定可以推動治療效果改變的預測協(xié)變量(生物標志物)。數(shù)據(jù)驅(qū)動的方法通常用于亞組識別,考慮到這一挑戰(zhàn)對精確健康的重要性,需要新的方法。一個基本問題是開發(fā)用于子組后選擇的推斷方法。在精密醫(yī)學研究中需要納入適當?shù)慕y(tǒng)計程序和對事后選定子組進行確認分析。

在精密醫(yī)學領域中出現(xiàn)的其他挑戰(zhàn)包括需要開發(fā)一種方法來測量一系列疾病的風險以及開發(fā)數(shù)據(jù)集成方法以使人們能夠解決重要的推斷性問題。數(shù)據(jù)集成是當前活躍的研究領域,許多科學領域都對此做出了貢獻。在生物統(tǒng)計學領域,通過各種形式的薈萃分析在一定條件下進行數(shù)據(jù)整合。盡管過去和現(xiàn)在在數(shù)據(jù)集成領域有很多活動,但仍有一些基本問題有待解決。需要開發(fā)具有良好統(tǒng)計屬性和相關高質(zhì)量軟件的方法,特別是針對各種大規(guī)模、高維數(shù)據(jù)的方法。此外,還需要回答何時不能集成數(shù)據(jù)集/數(shù)據(jù)源問題的方法。需要詢問何時在分析中合并其他數(shù)據(jù)沒有什么用處,以及如何證明這一行動的合理性。

如果能夠獲得針對上述挑戰(zhàn)的可靠且經(jīng)過充分測試的解決方案,則其影響將是實質(zhì)性的,而且將在許多層面上產(chǎn)生影響。在個人層面,它將促進更有效的健康管理,并更好地了解影響健康的外部、非生物因素,以及更好地了解疾病的生物學、社會、環(huán)境和其他決定因素;根據(jù)個體基因組和表觀遺傳信息提出更好的治療方法,并為個體提供更好的自我指導管理;允許個人管理符合其需求的成本效益;并幫助減少不必要的治療處方。在公共衛(wèi)生層面,它將更好地了解不同環(huán)境因素對健康的影響;提供飲食、運動和其他相關因素對健康影響的更準確歸因;增進對健康干預措施副作用的了解;提高新產(chǎn)品開發(fā)的有效率;通過提前識別最有可能從特定治療中受益的個人并確定可能遭受不良事件的個人,從而降低醫(yī)療保健成本。

2.3 物理科學中的統(tǒng)計

對于物理科學中出現(xiàn)的復雜數(shù)據(jù)問題,需要一種新的統(tǒng)計方法。應用程序中的常見主題包括時空數(shù)據(jù)、不確定性量化、錯誤設定的逆問題、組合跨尺度的信息(例如,物質(zhì)科學中的原子尺度到大尺度尺度,人口統(tǒng)計學中從家庭到城市到都市區(qū)域)以及使用能夠模擬特定的物理現(xiàn)象。

物理科學中的現(xiàn)代研究通常利用新穎的數(shù)據(jù)源、各種子系統(tǒng)苛刻的計算模型以及為推進科學而需要獲取的詳細專家知識。這樣的研究是多學科的,需要在物理科學、計算建模、數(shù)據(jù)管理和統(tǒng)計分析方法的多個方面具有專業(yè)知識。應用領域眾多。部分列表包括天文學和宇宙學、地球物理學、水文學、高能物理、材料科學、預測化學、核物理和粒子物理學。

對于復雜數(shù)據(jù)的類型和物理科學中出現(xiàn)的問題,迫切需要新的統(tǒng)計方法和計算思想。迄今為止,現(xiàn)代統(tǒng)計推斷中的許多工作都是由技術行業(yè)或生物醫(yī)學研究中相對較好的問題驅(qū)動的,但是下一代數(shù)據(jù)(如遙感、衛(wèi)星圖像、天文學、粒子物理學、地球科學、現(xiàn)代成像和探索材料動力學的診斷設施)更加復雜,需要新的統(tǒng)計方法以及規(guī)模算法。復雜性源于于底層物理系統(tǒng)的復雜性和測量過程的復雜性(例如,從低信噪圖像中解波的對象的形狀,由于非線性、物體模型不正確以及計算不正確的卷積內(nèi)核而導致的偏差;這些都非常重要,因為物理上有趣的參數(shù)來自平均數(shù)以千萬到數(shù)億次的測量)。

與物理科學應用中的新統(tǒng)計方法開發(fā)相關的常見主題包括:

·處理時空數(shù)據(jù);

·不確定性量化方法,將物理觀測與要求苛刻的計算模型相結(jié)合,以進行統(tǒng)計推斷;

·不適當?shù)哪鎲栴}(例如,根據(jù)材料與激光或中子束的相互作用來推斷材料結(jié)構);

·利用大量低信噪比進行推理;

·利用通過搜索空間和/或時間收集的非代表性“機會”數(shù)據(jù);

·結(jié)合不同類型的測量,這些測量通常來自不同的物理系統(tǒng),并且通常處于不同的空間和時間分辨率水平(例如,在宇宙學中——超新星的亮度、宇宙微波背景的波動以及遙遠星系的畸變);

·將不同分辨率的信息聯(lián)系起來(例如,從材料的分子成分中推斷散裝材料的特性,從化學結(jié)構推斷化合物性質(zhì));

·使用基于物理學的知識在未經(jīng)測試的新體制(例如極端溫度、極端應力條件、極端環(huán)境下的材料相互作用)下產(chǎn)生外推預測;

·使用數(shù)據(jù)(和其他類型的證據(jù))在競爭模型之間進行選擇,并通過模型組合產(chǎn)生更可靠的預測;

·開發(fā)有效利用可用數(shù)據(jù)源、計算模型、計算資源和統(tǒng)計分析方法的途徑,以便做出可靠的科學推斷;

·并開發(fā)統(tǒng)計方法,以更好地理解和預測罕見的高后果事件(例如流星撞擊、橋梁倒塌、特大風暴)。

正如許多人所指出的(包括國家科學院的報告,“海量數(shù)據(jù)分析的前沿”),大數(shù)據(jù)中的挑戰(zhàn)不僅僅是由于規(guī)模:它們還涉及復雜性(物理科學中遇到的復雜性類型本質(zhì)上是不同于諸如人的數(shù)據(jù)、遺傳和技術數(shù)據(jù))。實際上,數(shù)據(jù)的龐大與數(shù)據(jù)異質(zhì)性有很大關系。科學進步將越來越多地源于使用復雜物理過程的可解釋模型獲得的知識。統(tǒng)計人員和數(shù)據(jù)科學家必須與領域科學家緊密合作,以了解問題,挑戰(zhàn)和科學目標。解決物理科學中特定問題的現(xiàn)有方法可能會忽略統(tǒng)計學家可以識別的數(shù)據(jù)分析機會。此外,重要的是跨領域轉(zhuǎn)移技術,重點放在可推廣的方法上。如果從解決單個問題的方法中得出可推廣的方法,科學將進步得更快。

2.4 統(tǒng)計與量子信息科學

量子信息科學研究量子理論和技術,以開發(fā)量子器件,用于信息處理、傳輸、計算、測量和基本理解,而經(jīng)典方法的效率要低得多,或者根本無法做到。它包括量子通信、量子計算和量子計量學,其中量子通信利用量子資源進行安全通信和其他與密碼學有關的任務。量子計算通過使用量子設備而不是遵循經(jīng)典物理學并被經(jīng)典計算機使用的電子設備來執(zhí)行計算;量子計量學利用相干量子系統(tǒng)來增強物理量測量的性能。全球范圍內(nèi)都在進行深入研究,以發(fā)掘利用量子特性的許多技術,這些技術可能會導致功能更強大,更普遍的量子設備得到更好的計算、通信和加密?,F(xiàn)在,量子技術的發(fā)展正處于關鍵點,正在以超越傳統(tǒng)設備的能力來構建量子通信設備和量子計算機,例如量子退火器、量子模擬器和量子密碼設備。一方面,統(tǒng)計可以在量子信息科學中發(fā)揮關鍵作用,例如量子設備的認證及其在科學研究中的用途。另一方面,量子計算在革新計算統(tǒng)計和加速機器學習算法方面具有巨大潛力。量子技術發(fā)展和基于量子的計算技術(用于統(tǒng)計和機器學習)的統(tǒng)計方法迫切需要,并且量子科學和統(tǒng)計之間的相互作用可能是少數(shù)幾個最重要的新興應用之一。量子信息科學利用諸如疊加和糾纏等怪異的量子特性來發(fā)明新的量子設備,以實現(xiàn)比相應的經(jīng)典技術更快的計算、更安全的通信和更好的物理測量。它利用新的量子資源來完成傳統(tǒng)技術無法完成的任務。這些量子資源還可能提供不具有經(jīng)典對應物的數(shù)據(jù)收集和處理新手段。所有這些將為統(tǒng)計和機器學習提供新的理論、方法和計算技術。

2.5 匿名數(shù)據(jù)的統(tǒng)計分析

根據(jù)最近的一項估算,人類平均每天會產(chǎn)生2.5×1018字節(jié)的數(shù)據(jù);參見https://www./learn/data-never-sleeps-6.幾乎所有這些數(shù)據(jù)都以這樣或那樣的形式記錄,但是當前的法律和法規(guī)框架需要進行重大改革,以解決數(shù)據(jù)收集和使用的道德問題。像1964年的“民權法”一樣,某些領域(例如住宿、教育和就業(yè))的道德規(guī)范已經(jīng)制定了五十多年,但目前沒有機制來規(guī)范使用數(shù)據(jù)的公司。另外,公眾對用戶隱私缺乏興趣。

有一些關于數(shù)據(jù)匿名化的統(tǒng)計研究,例如統(tǒng)計披露限制、差異性隱私或數(shù)據(jù)清潔。差異隱私(DP)試圖通過注入采樣以外的其他噪聲來最大程度地降低隱私對個人數(shù)據(jù)集的影響。截至2018年,人們對獲得常用統(tǒng)計算法的差異隱私版本有極大的興趣,這是一個蓬勃發(fā)展的研究領域。DP框架在行業(yè)中也有重要用途。例如,蘋果公司利用局部差異隱私來了解其用戶的行為,而無需跟蹤特定用戶的使用模式。參見https://www.apple.com/privacy/docs/Differential_Privacy_Overview.pdf.數(shù)據(jù)清潔是指試圖對數(shù)據(jù)進行匿名處理的一大套做法,以保護對象的身份或其在公開發(fā)布的數(shù)據(jù)集中的機密屬性,或確保公平對待每個對象。這可以通過以多種方式進行數(shù)據(jù)屏蔽,如通過刪除(或變換)可能包含標識信息的變量,或者隨機生成其分布接近實際數(shù)據(jù)集的新數(shù)據(jù)來實現(xiàn)。

隨著對隱私的日益重視,數(shù)據(jù)清潔和差異隱私,或它們的改進版本,都可能成為數(shù)據(jù)分析的主要工具。但是,仍然存在許多問題和挑戰(zhàn)。參見,例如,Bambauer et al.(2014)和Mervis(2019)的《科學》雜志文章。后者討論了在普查數(shù)據(jù)上使用DP的可能弊端,包括在對DP過濾(普查數(shù)據(jù))后沒有足夠的信息用于社會科學研究。顯然存在一個問題,即如何進行研究以在隱私和數(shù)據(jù)準確性之間取得平衡?特別是對于統(tǒng)計學家和數(shù)據(jù)科學家來說,一些關鍵問題包括:

·各種不同水平的隱私問題能否建成統(tǒng)計模型?當前差異隱私框架旨在最大限度地減少所有用戶的數(shù)據(jù)泄漏。實際上,某些人愿意分享比其他人更多的個人信息,尤其是如果這樣可以為他們提供更準確的建模和分析。

·差異性隱私與其他隱私定義的關系如何?更具體地說,是否存在?差異隱私還可以保證其他諸如k匿名的隱私概念的條件?此設置還需要數(shù)據(jù)集的背景分布,尤其是變量的相關性上,做出假定。

·我們?nèi)绾握_考慮隱私保護機制引入的附加隨機性,無論它們是DP還是別的?這是否需要新的統(tǒng)計推斷工具?

·還有其他類似的方法可以簡化數(shù)據(jù)的匿名化嗎?這些方法中的任何一種是否提供DP以外的更多功能?

上述問題必須通過經(jīng)驗和理論研究來解決。研究中使用的理論模型和模擬模型需要捕獲現(xiàn)實的關鍵方面,例如,有關普查數(shù)據(jù)并考慮到實際相關的目標和目標受眾。當前的人口普查局使用的隱私保護方法需要與諸如DP等新方法進行系統(tǒng)比較,并明確定義相關和實際目標。提倡DP進行普查的統(tǒng)計研究人員需要了解使用普查數(shù)據(jù)進行研究和提出政策建議的社會科學家的關注。DP的普查決定應與社會科學研究員和其他利益相關者協(xié)商。

3. 基礎研究

統(tǒng)計理論的基礎研究為我們在統(tǒng)計實踐中的工作提供了寶貴的指導和深入的了解。過去20到30年間,統(tǒng)計學基礎研究的兩個主題涉及一般經(jīng)驗過程的理論以及半?yún)?shù)和非參數(shù)模型下限工具的系統(tǒng)開發(fā)。隨著我們對集中度不平等的理解的迅速發(fā)展,推動了經(jīng)驗過程的理論發(fā)展。

統(tǒng)計的一個成功案例包括非常通用的可驗證Efron的非參數(shù)自助法的自助法極限定理,以及在各種問題中更通用的可交換加權的自助法。這些結(jié)果已得到進一步開發(fā),以產(chǎn)生適用于海量數(shù)據(jù)的可擴展自助法。

其他成功案例包括對基于Talagrand(1994)的基礎工作的新的濃縮約束技術對模型選擇方法的理解,以及非參數(shù)貝葉斯方法的巨大發(fā)展。半?yún)?shù)和非參數(shù)模型的下界和用于構造有效估計量的方法的開發(fā)也在持續(xù)發(fā)展。這些方法開始在因果推理和模型后選擇推斷方面產(chǎn)生回報。

我們對應用和數(shù)據(jù)挑戰(zhàn)的強調(diào)絕不降低統(tǒng)計學基礎研究的價值。相反,它更令人信服和迫切地主張對統(tǒng)計學和數(shù)據(jù)科學的基礎研究進行更多的投資。需要新的理論范式來支持和指導新的統(tǒng)計實踐,以應對新的數(shù)據(jù)挑戰(zhàn)。我們理論的發(fā)展需要擺脫簡單化的模型和假設,采用新的框架來反映當今的領域問題和數(shù)據(jù)現(xiàn)實,從而允許非獨立同分布樣本以及異構總體和數(shù)據(jù)源。基礎研究的評估指標應包括創(chuàng)新,質(zhì)量和影響力。在本節(jié)中,我們將討論一些重要的新興主題。

3.1 模型與算法的作用

傳統(tǒng)的統(tǒng)計思維集中在數(shù)據(jù)生成建模上。簡單和可解釋的模型通常是黃金標準。但是對于現(xiàn)代應用程序而言,現(xiàn)實往往過于復雜,以至于無法用簡單的模型來描述。盡管完全摒棄建模在這些應用程序中的作用將是一個錯誤,但當今的科學和社會問題促進了對現(xiàn)代應用程序建模的重新校準。

正如George Box的名言所說的:“所有模型都是錯誤的,但有些模型是有用的。”模型是對現(xiàn)實的近似,它們?yōu)樘囟康亩婚_發(fā)。通常,數(shù)據(jù)分析的目的是制定詳細的決策,然后建模應反映出這一目標。一個典型的例子是分類,在許多應用中,判別建模是生成建模的更合適的替代選擇。在大數(shù)據(jù)分析中,不建議為所有目的都使用一個模型,無論它多么復雜和適應。在某些應用程序中,可解釋和可擴展的局部模型可能是首選,如何跨局部模型有效地借用信息需要進行新的研究。

隨著計算機科學思想的注入,數(shù)據(jù)分析中經(jīng)常采用算法觀點。支持向量機就是一個例子??梢詫⑵湟暈榉诸愃惴ā5?,將支持向量機與平滑度正則化綁定在一起并重現(xiàn)內(nèi)核Hilbert空間,已經(jīng)對如何工作以及如何對其進行了改進產(chǎn)生了深刻的見識。

許多統(tǒng)計工作都使用生成模型來激勵和分析數(shù)據(jù)分析程序。這樣的模型對于設計新程序以及理解和比較現(xiàn)有程序可能是有價值的。但是,我們絕不能止步于此,因為任何關鍵地依賴于生成模型的推論工作,無論如何謹慎選擇,都可能與相識脫節(jié)。

在實踐中,建模的一個相關挑戰(zhàn)是穩(wěn)健性。需要開發(fā)健壯性的新概念,以解決數(shù)據(jù)科學的統(tǒng)計和計算方面的問題。大部分早期的穩(wěn)健性文獻都是在參數(shù)模型的背景下進行的,其中否認了模型的真實性。在這些文獻中,統(tǒng)計方法被設計為在給定參數(shù)模型的鄰域中很好地工作,但是鄰域的概念通常在范圍上受到限制。穩(wěn)健性需要一種不同的方法,不僅用于建模,而且還用于數(shù)據(jù)質(zhì)量、計算限制等。Yu(2013)主張在統(tǒng)計和數(shù)據(jù)科學中的穩(wěn)定性對數(shù)據(jù)和模型/算法擾動的重要性,以及具有可重復性、穩(wěn)健性和可解釋性的自然連接的重要性。

3.2 不同約束條件下的統(tǒng)計效率

傳統(tǒng)的統(tǒng)計效率集中在如何充分利用給定的樣本上。雖然這仍然至關重要,但越來越經(jīng)常地,還需要考慮到其他資源限制因素。最值得注意的之一是計算資源。隨著數(shù)據(jù)量的增加,需要注意任何推斷技術的計算方面,并且計算效率應該與旨在推斷的統(tǒng)計效率一起考慮。這種需求促使我們在過去幾年中研究多項式時間可計算方法的分布推斷和極小極大限。盡管取得了一些初步的成功,但到目前為止,我們還沒有一個統(tǒng)一而通用的統(tǒng)計框架來解決統(tǒng)計和計算效率之間的關系和平衡。

一個相關的約束是空間。完整存儲或分析海量數(shù)據(jù)集通常不切實際。自從大數(shù)據(jù)出現(xiàn)以來,計算機科學家就一直在處理這個問題,并提出了許多非常有用的想法來以有限的內(nèi)存進行存儲和查詢。值得注意的例子包括隨機投影,其中大量變量的主要特征可以通過少量的隨機測量來保留,而數(shù)據(jù)流式傳輸中的內(nèi)存非常稀缺,因此我們只能存儲單個數(shù)據(jù),并且希望以在線形式進行推斷。然而,這些非常重要的問題卻很少受到統(tǒng)計界的關注。

3.3 數(shù)據(jù)驅(qū)動范式中的推斷框架

在許多現(xiàn)代科學應用中,首先收集數(shù)據(jù),然后在看到數(shù)據(jù)后制定科學問題或假設。這種數(shù)據(jù)驅(qū)動的科學范式給統(tǒng)計推斷帶來了新的挑戰(zhàn)。在這種情況下,對經(jīng)典統(tǒng)計推斷的作用的誤解可能會導致“呼吁應用較少的能力,放棄對有效的統(tǒng)計方法的研究。”相反,“應該有動機創(chuàng)造統(tǒng)計推理,將目前沒有考慮的非正式數(shù)據(jù)分析活動整合在一起”(Buja和Brown對Lockhart et al。(2014)的討論)。

此類活動通常以大規(guī)模探索性數(shù)據(jù)分析的形式出現(xiàn),并且可能涉及交互式數(shù)據(jù)分析的多次迭代。它們在許多應用中至關重要,并且非常成功。然而,從統(tǒng)計的角度來看,如何在一個更正式的推理框架中適當?shù)乜紤]這些活動仍然是一個巨大的挑戰(zhàn)。一個相關的挑戰(zhàn)是如何實現(xiàn)科學的可重復性/可復制性,并傳達來自這些復雜數(shù)據(jù)分析管道的數(shù)據(jù)驅(qū)動發(fā)現(xiàn)的不確定性。

Taylor and Tibshirani(2015)提出了一種選擇推理的新方法,其中感興趣的參數(shù)可能與數(shù)據(jù)有關。但是,對無模型結(jié)構參數(shù)的統(tǒng)計推斷仍然是任何驗證性分析的重要組成部分;感興趣的參數(shù)可以是科學中的固有數(shù)量,也可以是所研究人群的平均治療效果。在模型選擇之后進行基于模型的推斷時,我們必須開發(fā)適當?shù)耐茢喾椒?,以解決模型選擇中的不確定性。重要的是,我們應更多地注意許多有用但特別的過程,例如數(shù)據(jù)拆分,并描述何時及為什么這些方法可行以及如何對其進行改進。

3.4 觀察研究與實驗設計

對原因及后果進行推斷,即因果推斷,是日常生活和公共政策的核心。因果推斷問題的一些示例如下:雙膦酸鹽是否會導致食道癌?街道上的人口密度(跨時間和鄰域)如何影響犯罪率?房東有種族歧視嗎?

在線和其他電子活動留下的數(shù)據(jù)痕跡“數(shù)據(jù)耗盡”提供了非常大的數(shù)據(jù)集,可能為因果推斷提供了新的機會。這樣的數(shù)據(jù)集的示例包括運輸數(shù)據(jù)集(例如,紐約市出租車數(shù)據(jù)、Waze/Google地圖數(shù)據(jù)、公共交通數(shù)據(jù)、Strava數(shù)據(jù)、交通事故數(shù)據(jù))、健康數(shù)據(jù)集(例如,Medicare/Medicaid數(shù)據(jù),保險索賠數(shù)據(jù)),住宿數(shù)據(jù)(例如AirBNB數(shù)據(jù))、公共安全數(shù)據(jù)(例如Shotspotter槍聲數(shù)據(jù)、警察公共聯(lián)系數(shù)據(jù)、CCTV、遠程信息處理)、交易數(shù)據(jù)(例如金融交易、零售)、教育數(shù)據(jù)(例如學生水平的管理數(shù)據(jù)、學校水平的管理數(shù)據(jù))、就業(yè)數(shù)據(jù)(例如ADP薪資數(shù)據(jù))、公眾與政府數(shù)據(jù)的交互(例如在https://catalog./dataset/311-data-in-development的311數(shù)據(jù))以及大規(guī)模傳感器數(shù)據(jù)(例如,起搏器數(shù)據(jù),F(xiàn)itbit數(shù)據(jù))。

需要法治因果推斷的新方法,以充分利用這些大數(shù)據(jù)集進行因果推斷??梢詮男卵芯恐惺芤娴囊蚬茢嗟奶魬?zhàn)性問題包括:

1. 如何整合來自各種數(shù)據(jù)源的因果關系證據(jù)?我們?nèi)绾握{(diào)和得到截然不同結(jié)果的觀察研究結(jié)論?

2. 我們?nèi)绾瘟炕c因果效應估計相關的真實不確定性?

3. 我們?nèi)绾卫玫途龋推顢?shù)據(jù)和高精度,中等偏差數(shù)據(jù)的優(yōu)勢?

4. 我們是否可以結(jié)合使用無效測試,陰性對照等來建立更好的模型或幫助驗證假設?如何將這些準實驗設備納入推斷?

5. 已針對相對簡單的因果假設(如治療引起比對照組更高的影響)開發(fā)了諸如空試驗,陰性對照和多個對照組之類的準實驗裝置。如果我們想檢驗復雜的因果假設,例如關于一組基因如何共同作用以調(diào)節(jié)蛋白質(zhì)X的生成量該怎么辦?如何將這些準實驗設備用于有關大型機制模型的復雜因果假設?

6. 如果您具有高維度的結(jié)果,可以使用觀測數(shù)據(jù)來幫助定義對于幫助確定未來實驗的最佳測試統(tǒng)計量最重要的低維度結(jié)構嗎?

基于觀察性研究進行因果推理的另一個重要挑戰(zhàn)是,是否有可能區(qū)分模型或程序的成功使用和不成功使用,這是Freedman(1991)提出的一個老問題。對于統(tǒng)計學家和數(shù)據(jù)科學家來說,這是一個至關重要的問題,因為因果推理在觀察研究比隨機實驗更常見的社會科學和其他領域中流行。這也是統(tǒng)計學家比其他許多人都有更好見解的地方。

3.5 有限人口抽樣設計:模型輔助有限采樣

抽樣調(diào)查中通常采用有限的人口抽樣,但是至少在最近之前,統(tǒng)計方法已經(jīng)不在統(tǒng)計的主流范圍之內(nèi)。Cassel,Sarndal,and Wretman(1977)以及Sarndal,Swensson,and Wretman(1992)的書開始在統(tǒng)計理論的框架內(nèi)系統(tǒng)地處理這些方法。Meng(2018)最近發(fā)表的有關采樣在大數(shù)據(jù)中的作用的有啟發(fā)性的論文應被視為Neyman(1934)所倡導主題的延續(xù)。在數(shù)據(jù)科學時代,這些主題的進一步發(fā)展,特別是與兩相和多相設計相關的工具,以及模型輔助采樣背景下的兩階段和多階段設計,可能會在使用采樣來衡個體子集的昂貴協(xié)變量時及使用諸如子采樣、“草圖”、和“分而治之”方法來減少與大數(shù)據(jù)計算有關的困難時變得越來越重要。

適用于獨立同分布的許多工具采樣(包括對相關經(jīng)驗過程方法的系統(tǒng)性理解,例如類似于Talagrand(1994)的簡單隨機采樣的有限采樣指數(shù)范圍)對于大多數(shù)更復雜的采樣設計尚未出現(xiàn)。

3.6 大規(guī)模非凸優(yōu)化

大數(shù)據(jù)通常由異構數(shù)據(jù)或子群體組成。大數(shù)據(jù)分析的一個重要目標是將每個對象聚集到一個亞人群中,并為每個亞人群提供個性化的處理。這個基本概念是精準醫(yī)學(第2。2節(jié))和精準營銷的基礎。這種聚類分析是在高維設置下進行的,其中包括高維變量、潛在因素以及具有數(shù)據(jù)真實性的環(huán)境(如粗尾,缺失值和有偏采樣)之間的相互作用。一旦了解了亞群,尋找個性化的治療方法和預期的反應仍然是一項挑戰(zhàn)。如此復雜的系統(tǒng)的現(xiàn)實建模對于精密醫(yī)學和市場營銷以及其他應用極為重要。一種工作模型是在高維環(huán)境中采用專家模型的混合。這涉及選擇變量,潛在因素及其相互作用以進行聚類,并分別進行處理分配,這通常會導致復雜的大規(guī)模非凸優(yōu)化問題。了解用于此類統(tǒng)計模型的算法和方法在智力上具有挑戰(zhàn)性,并且在實踐中很重要。

深度學習(將在3.7節(jié)中進一步討論)可以看作是一類現(xiàn)代的高維非參數(shù)模型,在許多機器學習問題中都取得了巨大的成功。已經(jīng)針對諸如此類的大規(guī)模非凸優(yōu)化問題開發(fā)了許多啟發(fā)式算法,例如具有動量的隨機梯度方法。但是,關于算法收斂和統(tǒng)計特性的理論很少。這阻礙了我們對問題的理解以及對那些需要關聯(lián)和因果研究的學科科學(如經(jīng)濟學和社會學)的成功應用。在最壞的情況下,這些高維優(yōu)化目標函數(shù)的情況非常嚇人,包括指數(shù)級數(shù)量的局部最小值,但在大多數(shù)典型情況下對統(tǒng)計問題是良性的。理解所使用算法的統(tǒng)計屬性(與經(jīng)典統(tǒng)計中的全局最小值相反)對于大數(shù)據(jù)的統(tǒng)計實踐非常重要。

混合模型和深度學習算法只是統(tǒng)計學家和數(shù)據(jù)科學家在分析高維非凸優(yōu)化問題的統(tǒng)計和算法屬性方面面臨的新挑戰(zhàn)的兩個實例。其他示例包括Z2同步化、矩陣完成和解決許多工程問題中的二次系統(tǒng)。概率工具和統(tǒng)計模型在理解典型案例的算法復雜性以及所得基于算法的對象的統(tǒng)計屬性方面起著至關重要的作用。

3.7 深度學習

今天,似乎有一種對深度學習的熱情的海嘯;參見LeCun,Bengio,and Hinton(2015)。由于該技術在某些圖像分類和自然語言處理任務中已達到超人的性能,因此,現(xiàn)在正投入大量資金來更廣泛地部署該技術。媒體宣傳了關于在其它信息處理任務中開發(fā)超人性能時可能出現(xiàn)的技術未來的猜測。伴隨著這股熱情的浪潮對統(tǒng)計領域提出了巨大的挑戰(zhàn),因為輕信的媒體報道促使許多非統(tǒng)計愛好者相信,你不再需要統(tǒng)計了。這種信念是錯誤的;大量的深度學習炒作是基于前瞻性推測,而數(shù)百年來的統(tǒng)計數(shù)據(jù)卻取得了堅實的成果,其中一些成就重塑了地球上的生活,例如公共衛(wèi)生和農(nóng)業(yè)。盡管如此,統(tǒng)計人員應該盡其所能來提高深度學習的研究質(zhì)量,就像他們致力于改善其他領域的研究一樣。

深度學習的成功源于對機器學習通用任務框架的持續(xù)使用。在這種框架下,人們被賦予了標簽化的訓練和測試數(shù)據(jù),并且試圖通過人們想要的任何設備來改進預測模型,并通過測試集預測誤差來對所提出的模型進行評分。通過反復試驗,逐漸提高了性能。無需理論指導。

統(tǒng)計學家對深度學習研究人員的經(jīng)驗成功和經(jīng)驗態(tài)度的反應不應是對統(tǒng)計理論的布道式宣講。統(tǒng)計研究人員應該參與深度學習人員當前正在做的事情,并提出建設性的可操作建議,以改善當前相關任務和數(shù)據(jù)集的實際性能。

盡管深度學習/公共任務框架范例是成功的,但它也面臨著巨大的挑戰(zhàn),而統(tǒng)計學研究可能會有所幫助,就像統(tǒng)計學研究已經(jīng)能夠在許多其他領域為研究做出貢獻一樣。挑戰(zhàn)包括:

1. 深度學習研究是毀滅性的昂貴?,F(xiàn)在正在使用1800萬個cpu小時并專用于500+gpu數(shù)月撰寫論文。

2. (和1相關)標準算法(例如,隨機梯度下降)收斂速度非常慢。

3. 該方法需要大量數(shù)據(jù),而大多數(shù)科學和工程研究人員永遠不會擁有這些數(shù)據(jù),該領域的趨勢是向更大的數(shù)據(jù)需求擴展。

統(tǒng)計人員可以通過改善以上三個核心問題中的任何一個來為深度學習的進步做出貢獻,所有這些都涉及統(tǒng)計人員的核心專業(yè)知識。實驗設計、隨機線性代數(shù)、新穎的統(tǒng)計訓練算法都在這項工作中占有一席之地。

4. 專業(yè)文化與社區(qū)責任

統(tǒng)計學作為一門獨立學科的建立與19世紀初的科學發(fā)展緊密結(jié)合在一起(例如,達爾文的進化論、農(nóng)業(yè)設計)。進行了基礎數(shù)學工作,以實現(xiàn)對經(jīng)驗上有用的諸如最大似然方法的特性的概括和研究。在最初的發(fā)展之后的幾十年中,該領域與這些特殊的數(shù)學發(fā)展保持一致,并且與實踐的聯(lián)系排在了后排。引用喬治·博克斯(George Box)的1976年費舍爾演講:

一群人可以保持相當?shù)目鞓?,玩弄一個可能曾經(jīng)有意義的問題,并提出永遠不會暴露在危險的實用性測試的解決方案。他們喜歡在會議上互相閱讀論文,而且他們通常很不冒犯。但是,我們必定要遺憾的是,寶貴的人才在歷史上可以被善加利用的時期就被浪費了。

—— George Box(1976)

在過去的幾十年中,我們已經(jīng)開始通過跨學科研究和一般的應用統(tǒng)計來回歸領域根源 (Cleveland,2001),但是變革的步伐并未跟上快速發(fā)展的以數(shù)據(jù)為中心的世界。

為了使該行業(yè)在數(shù)據(jù)科學及其他領域中發(fā)揮領導作用,需要更快地進行文化變革。正如 Breiman (2001) 雄辯地指出:

使用統(tǒng)計建模從數(shù)據(jù)中得出結(jié)論有兩種區(qū)域性。一種假設數(shù)據(jù)是由給定的隨機數(shù)據(jù)模型生成的。另一種使用算法模型,并將數(shù)據(jù)機制視為未知。統(tǒng)計界幾乎毫無例外地一直致力于使用數(shù)據(jù)模型。這種承諾導致了不相關的理論及可疑的結(jié)論,并且使統(tǒng)計學家無法研究大量有趣的當前問題。無論是在理論上還是在實踐上,算法建模都在統(tǒng)計領域之外迅速發(fā)展。它既可以用于大型復雜數(shù)據(jù)集,也可以用作較小數(shù)據(jù)集上數(shù)據(jù)建模的更準確和更有意義的替代方法。如果我們作為一個領域的目標是使用數(shù)據(jù)來解決問題,那么我們需要擺脫對數(shù)據(jù)模型的排他性依賴,而采用一套更加多樣化的工具。

—— Breiman (2001)

問題不在于隨機模型或生成模型本身。如果此類模型通過經(jīng)驗證據(jù)產(chǎn)生實際影響,則應予以贊揚,尤其是如果這些模型在其構造中考慮了領域知識并具有計算上可行的算法。這樣的模型也是有用且至關重要的,特別是對于研究和理解經(jīng)驗上成功的、并且在為穩(wěn)健而在多類生成模型下優(yōu)先研究的算法/方法。但是,在實踐中,通常情況并非如此,如果沒有經(jīng)驗支持,這種方法就非常成問題。

雖然數(shù)學,計算和統(tǒng)計原理對于理解統(tǒng)計和數(shù)據(jù)科學程序的操作特性必不可少,但要想解決現(xiàn)實世界中的問題,就必須沉浸在相關的領域。引用 George Box 在 1976 年的菲舍爾演講中所說的:“需要在理論和實踐之間取得適當?shù)钠胶?,最重要的是,統(tǒng)計學家必須學習如何成為優(yōu)秀的科學家及必須通過經(jīng)驗和榜樣才能形成的人才?!?/span>

我們的專業(yè)人士必須認識到,在新時代,我們的主要職責是開發(fā)統(tǒng)計和數(shù)據(jù)科學中的算法/方法和相關理論,以滿足對科學,工程學和社會產(chǎn)生最大影響的數(shù)據(jù)分析需求。我們需要一種新的文化,在這種文化中,新一代的統(tǒng)計學家和數(shù)據(jù)科學家將受到培訓并受到鼓勵,以擁抱新的現(xiàn)實。為此,我們需要所有利益相關者,包括學術院系,專業(yè)協(xié)會和資助機構,共同努力,實現(xiàn)急劇的文化變革。

4.1 學術院系

學術成就是許多學術院系當前任期和晉升標準的一部分。但是,學術成就的評估傳統(tǒng)上一直側(cè)重于本領域公認的期刊上的出版物數(shù)量,而這種評估的重點過于狹窄,與我們領域的當前轉(zhuǎn)變不符。評價中過分強調(diào)出版物的數(shù)量也不利于其健康。學術成就評估應強調(diào)質(zhì)量以及工作對統(tǒng)計實踐、領域科學和整個社會的影響。除期刊出版物外,我們還應使用更廣泛的指標來評估學術成就,包括對我們的研究體系,基礎設施以及對領域科學和整個社會的貢獻的可衡量的影響。Waller(2018)提供了有關數(shù)據(jù)科學相關研究在學術院系的文獻記錄和評估的建議,很明顯,社區(qū)需要立即采取集體行動。

聘請多元化的教師對于我們職業(yè)的轉(zhuǎn)變至關重要。評估潛在的新員工帶來了巨大的挑戰(zhàn),因為它從根本上涉及對未來影響的預測。傳統(tǒng)上準備好的學生呈現(xiàn)出較低的風險和更確定的軌跡。學術院系需要積極招募和培養(yǎng)從我們重新構想的博士課程中產(chǎn)生的新一代學生。并減少風險規(guī)避。多樣性起著關鍵作用—未來成功的統(tǒng)計教授帶頭人必須反映多樣性的許多方面,包括知識多樣性。這需要協(xié)調(diào)一致的長期努力(在聘用前后),而我們的領域在過去并未做到這一點。

4.2 專業(yè)領導

我們呼吁更多的統(tǒng)計學家成為我們行業(yè)的領導者。統(tǒng)計領域的領導者需要做更多的工作,以將這一領域推廣到廣大的科學界和公共領域。這項工作以及系、校園和我們自己的專業(yè)協(xié)會中的領導角色,應該是我們專業(yè)中高級人員評估標準的關鍵組成部分。

統(tǒng)計學專業(yè)協(xié)會需要成為更有影響力的統(tǒng)計工作的有力推動者,并在統(tǒng)計學家/數(shù)據(jù)科學家,研究人員與其他社會以及私營和公共部門的科學家之間架起橋梁。我們專業(yè)協(xié)會的旗艦期刊需要擴大其范圍,并有意識地從傳統(tǒng)固有的研究領域轉(zhuǎn)向新的數(shù)據(jù)科學研究。統(tǒng)計人員的領導和溝通培訓嚴重不足,我們的組織應該在這方面有所作為。這種培訓還應為統(tǒng)計學家為跨學科研究團隊的領導做好準備。諸如獎項和研究金之類的榮譽應反映出對統(tǒng)計學的廣泛看法,不僅要表彰傳統(tǒng)的學術貢獻,還應表彰領導才能、計算成就以及更廣泛的科學或領域貢獻。為了反映這種轉(zhuǎn)變,社會需要獲得更多的獎項。

全國和國際統(tǒng)計學會在大學和研究生層次的統(tǒng)計學課程的開發(fā)和重新構想中可以發(fā)揮更大的作用。它們自然也可以幫助在學術界、工業(yè)界和公共部門之間架起橋梁。聯(lián)合統(tǒng)計會議是傳統(tǒng)的聚會場所,各行各業(yè)的統(tǒng)計學家都可以聯(lián)系到那里,還有很多工作要做。例如,在數(shù)據(jù)科學領域建立更廣泛,更深入的行業(yè)-學術界合作伙伴關系可以極大地促進數(shù)據(jù)科學時代的統(tǒng)計研究和教育,但是目前這通常發(fā)生在單位級別。專業(yè)協(xié)會可以幫助促進聯(lián)合體一級的努力。

4.3 資助機構

NSF 在傳統(tǒng)研究資金中扮演著不可替代的角色,重點放在創(chuàng)新學科研究上,這為研究界提供了很好的服務。我們建議NSF的統(tǒng)計計劃繼續(xù)促進資助知識多樣性。如報告前面所述,數(shù)據(jù)科學時代的許多研究領域都面臨著重大挑戰(zhàn)和機遇。資金的增加對于以下方面的發(fā)展至關重要:空間主題數(shù)據(jù)分析、可解釋的統(tǒng)計學習模型、個性化和集成推薦系統(tǒng)、時空數(shù)據(jù)分析、機器學習和因果推理的集成、預測的穩(wěn)健性和穩(wěn)定性等/預測和推論、數(shù)據(jù)隱私和公平性、基于代理的模型、約束優(yōu)化、實驗設計以及高效的深度學習算法。

NSF 統(tǒng)計研究和教育的資金主要來自數(shù)學科學部(DMS)。NSF預算的增長跟不上科學和工程界的增長,特別是在通貨膨脹調(diào)整之后。這個問題在統(tǒng)計計劃中最為明顯和嚴重。但是,聯(lián)邦對基礎研究和勞動力的投資對于我們專業(yè)的未來仍然至關重要。統(tǒng)計計劃需要獲得更多的資金,以跟上學科的發(fā)展和進步,而統(tǒng)計研究的資金需要超出一項計劃,因為統(tǒng)計創(chuàng)新在科學的廣泛研究和教育領域中發(fā)揮著越來越重要的作用。例如,統(tǒng)計人員正在擁抱NSF的10大構想,尤其是通過利用21世紀科學與工程(HDR)的數(shù)據(jù)革命。

為了加速統(tǒng)計數(shù)據(jù)的轉(zhuǎn)換并造福社會,NSF和NIH等政府資助機構需要加大投資,以支持將統(tǒng)計作為科學技術發(fā)展的重要組成部分的研究項目。美國國立衛(wèi)生研究院資助的許多項目都涉及統(tǒng)計學家,它們通常扮演著支持(但重要)的角色。NSF的一種成功的資助模式是“數(shù)據(jù)科學原理跨學科研究(TRIPODS)”,其中統(tǒng)計學家和其他研究人員通過集成研究和培訓活動的全面參與有助于發(fā)展數(shù)據(jù)科學的理論基礎。DMS/NIGMS聯(lián)合倡議、旨在支持生物學和數(shù)學科學界的研究(DMS/NIGMS)、DMS/NLM關于生物醫(yī)學研究通用數(shù)據(jù)科學方法的聯(lián)合倡議(DMS/NLM)和威脅檢測算法(ATD)也是此類籌資機制的典范。更多的此類資助機會將鼓勵統(tǒng)計學家和數(shù)據(jù)科學家在一種新文化中發(fā)展研究計劃,這種文化對有影響的工作大加贊賞。正如該報告前面所討論的,具有影響力的研究可能來自統(tǒng)計學家對領域科學的沉浸和充分參與,例如天文學、預測化學、城市規(guī)劃和精密醫(yī)學等。資助包括統(tǒng)計學家和其他領域科學家在內(nèi)的平等研究伙伴的研究團隊,將導致跨領域的創(chuàng)新。資助機構和ASA等全國協(xié)會應共同努力,以確保統(tǒng)計和數(shù)據(jù)科學的研究人員充分了解這些機會,并有機會及時向這些計劃提供反饋。

我們還建議NSF和其他資助機構為初級和中級研究人員提供專門的支持,使其介入領域科學,這可能與學校學術假和其他形式的教師休假關聯(lián)。由NSF資助的研究機構和中心可以促進此類活動,但是需要新的機制來確保此類項目的成果評估著重于潛力和影響。政府資助可以激勵更多的統(tǒng)計學家將投入到新興的數(shù)據(jù)科學研究領域。

5. 博士教育


本部分考慮了社區(qū)在未來10到20年內(nèi)可能采取的步驟,以確保統(tǒng)計學領域的博士教育為下一代領導者做好準備,以確保按照上面概述的方向轉(zhuǎn)變我們的學科。雖然現(xiàn)有博士學位有很多優(yōu)點和益處。我們認為這些計劃需要進行重大修改和重新思考,以確保畢業(yè)生能夠從事數(shù)據(jù)科學,同時保持卓越的統(tǒng)計研究水平。

在本科層次上,針對統(tǒng)計統(tǒng)計學本科課程的新課程指南 和數(shù)據(jù)科學 強調(diào)了統(tǒng)計基礎的重要性,并伴隨著在計算、數(shù)據(jù)技術、領域知識和倫理方面更深入和更堅實的基礎。在這些文件的基礎上,我們在這里專注于博士教育。

首先,博士是一個研究學位,博士課程應側(cè)重于培養(yǎng)學生從事統(tǒng)計學和數(shù)據(jù)科學的研究。最可持續(xù)的培訓模型或增長模型是幫助他們學習如何學習,從而使他們在領域和數(shù)據(jù)挑戰(zhàn)不斷發(fā)展的過程中能夠靈活敏捷地進行智力適應和更新其知識和技能。我們的畢業(yè)生應該能夠通過創(chuàng)建新穎的統(tǒng)計對象(例如模型、方法、可視化對象)或?qū)Υ祟悓ο筮M行分析,為解決以實際數(shù)據(jù)為中心的問題做出貢獻。本節(jié)中的其余討論將服務于此目標。

5.1 課程

我們相信,大多數(shù)大學的標準課程不足以滿足學生的需求。進入學術工作市場和非學術或準學術工作市場(行業(yè)、準學術、政府等)的學生越來越被要求能夠勝任各種主題和技能(例如,數(shù)據(jù)技術)。例如 Nolan and Temple Lang(2014) 全面介紹了許多現(xiàn)代數(shù)據(jù)類型和有效處理這些數(shù)據(jù)類型的計算技術。但是,大多數(shù)學生沒有接受過這些技能的培訓,也沒有接受過迅速采用新技能的更抽象的技能的培訓。

什么應該構成博士學位的基礎統(tǒng)計課程以改變我們的領域?我們認為,雖然概率和推斷是傳統(tǒng)統(tǒng)計的關鍵基礎,但當今統(tǒng)計領域的博士畢業(yè)生需要具備更深厚的計算和數(shù)據(jù)技術、通信、數(shù)據(jù)清理、定量批判性思維、協(xié)作技能、適當?shù)膯栴}制定和跨學科科學的技能。統(tǒng)計培訓需要涵蓋整個“數(shù)據(jù)生命周期”。同時,我們不建議擴展必修課程。如果有的話,對于許多計劃而言,需要提供更廣泛的選修課程,而不是必修課程。

我們認為一定的基本統(tǒng)計、計算和數(shù)學水平是前提。除此之外,我們認為以下領域是“核心”:

  • 關鍵的統(tǒng)計基礎,包括概念和哲學基礎(包括健壯性和穩(wěn)定性考慮)

  • 計算:編程、可重復性/工作流、數(shù)據(jù)技術、基礎設施/數(shù)據(jù)庫/云計算、數(shù)據(jù)管理、“wrangling/munging”

  • 交流:為技術人員和非技術受眾的寫作、演示、可視化、提出和解決問題的實踐以及領導力發(fā)展

  • 以數(shù)據(jù)為中心的批判性思維能力:維持統(tǒng)計分析的各個階段與潛在的科學或商業(yè)問題以及目標受眾之間的聯(lián)系;知道并傳達合理和不合理假定之間的差異;嚴格評估數(shù)據(jù)的來源以及推論、評估和結(jié)論的適當性

  • 數(shù)據(jù)建模和評估:例如,事后分析包括 EDA 和 PQR-S 的驗證:P 代表人群,Q 代表問題,R 代表代表性,S 代表審查

  • 抽樣和實驗設計基礎

  • 因果推斷

  • 度量

  • 倫理:人類主題,隱私/機密,算法偏見

  • 協(xié)作經(jīng)驗/技能(與前面的溝通技巧重疊)

一些課程計劃將通過逐漸進化過程朝著更廣闊的視野發(fā)展。其他的計劃則需要采取更激進的方法。對于本科生水平,Cobb (2015) 考慮了后者的可能性。不需要所有博士學位。統(tǒng)計學中的所有博士課程都沒有必要考慮相同的物質(zhì)基礎。但是,有一份藍圖(或一套藍圖)將有所幫助,并且是 Deborah Nolan 組織的后續(xù)“十字路口的研究生統(tǒng)計學教育”研討會的目標之一。

幾個限制因素使得難以在如此廣泛的領域中提供培訓。首先,大多數(shù)大學都不想犧牲他們認為是基礎的課程和經(jīng)驗。其次,似乎很多院系太小而無法在如此多樣的專業(yè)范圍內(nèi)提供適當?shù)呐嘤?,并且由于學生之間的競爭,各院系之間往往有交流資源的阻礙因素。除了對現(xiàn)有課程進行改造或現(xiàn)代化之外,博士課程還應考慮非傳統(tǒng)的學習機制,如塊狀課程、沉浸式體驗、實驗室輪換和可解決一個或多個這些限制的共享課程技術。但是,這些替代方案在獲取、認證、質(zhì)量標準、可持續(xù)性等方面提出了尚待解決的其他問題,NSF、專業(yè)協(xié)會和其他機構可能可以改善這些問題。許多計劃已經(jīng)為學生提供了“軌道”,我們認為所有計劃都應朝這個方向發(fā)展。在未來的討論中可以考慮核心培訓的后續(xù)輪換的“醫(yī)學院模式”。

由于缺乏對這些學科的深入了解以及對某一領域文化的了解,統(tǒng)計學家可能難以與其他科學領域的研究人員進行有效合作。解決這個問題的一個辦法是為希望成為在科學領域有深度投入的應用統(tǒng)計人員的人設立研究生或博士后獎學金。這將使這些統(tǒng)計人員能夠參加其合作者部門的課程(或從事其他類型的培訓),甚至能夠參加該部門,以更好地了解該學科的文化??梢耘c有關人員舉行年度會議。實際上,愛荷華州立大學已經(jīng)有這樣一個共同專業(yè)博士課程程序。

5.2 誰將是統(tǒng)計學博士計劃的理想申請人

二十年前,本科生在統(tǒng)計學專業(yè)學習的情況極為罕見。成功的博士申請人通常擁有數(shù)學或物理學的本科學位,或者較少的是在其他基于經(jīng)驗的領域,如經(jīng)濟學,如果他們有足夠的數(shù)學背景(通常達到一年的數(shù)學分析水平))。有趣的是,盡管統(tǒng)計學逐漸成為越來越受歡迎的本科專業(yè),但這種結(jié)構似乎變化很小。與科學的其他學科相比,顯然不愿意錄取主修統(tǒng)計學的本科生進入統(tǒng)計學博士計劃,這是不尋常和不幸的。

為了實現(xiàn)本文中概述的轉(zhuǎn)型目標,我們需要招收更多具有計算,寫作,溝通和領導才能背景的本科生。應鼓勵具有較強數(shù)學技能的本科生加入我們的課程,但他們還需要這些額外的職業(yè)成功因素才能獲得有效的博士學位。許多本科生統(tǒng)計和數(shù)據(jù)科學課程已經(jīng)調(diào)整了他們的數(shù)學要求。為打算申請博士課程的本科專業(yè)創(chuàng)建一個獨特的課程可能有助于解決這個問題(這通常通過數(shù)學的輔修專業(yè)或雙專業(yè)進行)。重新制定博士計劃的第一學期課程提供基于數(shù)學準備的多種途徑,可能是使研究生群體多樣化的另一種方法。

擴大統(tǒng)計范圍的一種方法是招收更多種類的學生。上面討論的專用軌道類型可能會適應這種增加的異質(zhì)性。但是,大多數(shù)計劃仍會希望所有學生完成一些核心理論課程,這可能對數(shù)學或計算機背景較弱的學生構成挑戰(zhàn)。我們必須找到一種方法,讓那些在核心領域準備較少而進入計劃的學生適應。

5.3 提供更有效的培訓

可以說,博士計劃在培養(yǎng)高素質(zhì)研究人員方面非常成功,但他們在培養(yǎng)高素質(zhì)教師以滿足對統(tǒng)計和數(shù)據(jù)科學課程日益增長的需求方面通常不太成功。培訓學生如何有效教學很少是研究生課程的一部分。然而,有效的指導對于培訓下一代統(tǒng)計學家以及經(jīng)驗豐富的各個實質(zhì)性領域的研究人員至關重要。提供有用的、引人入勝且相關的指導對于幫助經(jīng)驗研究者理解統(tǒng)計學和數(shù)據(jù)科學對回答科學問題的關鍵價值至關重要。提高教學能力需要清晰的思想交流,應該具有增加研究人員清楚地傳播其研究成果的能力的額外好處。為了滿足把統(tǒng)計轉(zhuǎn)換成以實踐為中心的需求,有效的教師需要具有解決實際數(shù)據(jù)問題的實踐經(jīng)驗,才能在課堂上教授此類實踐技能。即使對于大多數(shù)經(jīng)過理論訓練的統(tǒng)計學家成為教授之后,要獲得這樣的經(jīng)驗還為時不晚,而且實際上是必要的。

在明確培訓博士生的溝通和演講技能(上文討論)和支持教學技能發(fā)展之間,也存在著其他協(xié)同作用。博士交流課程可以保留一些明確的教學重點。但是即使沒有這一點,我們也希望溝通技巧的發(fā)展將對教學能力產(chǎn)生積極的溢出效應。

也將歡迎在大學一級提出解決方案的創(chuàng)造性解決方案,特別是如果將示范方案的制定與材料傳播計劃結(jié)合起來,以便其他機構更容易采用這種努力;參見例如美國統(tǒng)計協(xié)會/美國數(shù)學協(xié)會的統(tǒng)計教師準備指南

5.4 專業(yè)和NSF在研究生教育中的作用

專業(yè)和NSF在理解和指導這些選擇中應該扮演什么角色?收集關于統(tǒng)計課程的主要特點和各大學培訓方法的數(shù)據(jù)的激勵措施和資源將具有很高的效用。更有用的是嘗試了解這些培訓模式與隨后的職業(yè)軌跡或其他感興趣的結(jié)果之間的聯(lián)系。這將需要額外的并且可能需要更多的勞動密集型數(shù)據(jù)收集。此外,創(chuàng)建基礎設施將是至關重要的貢獻,因為它可以確保這不僅是“一次性”的努力,而且可能導致持續(xù)進行的自我評估的努力。

NSF可以支持講習班、訓練營和暑期學校課程,提供課程開發(fā)和教學的最佳實踐培訓。將這些類型的培訓機會與旨在以高級方法培訓學生的培訓機會結(jié)合在一起的想法提供了一種特別有創(chuàng)意和協(xié)同作用的選擇。例如,可以作為暑期學院的一部分提供培訓,該培訓既為學生或講師提供了在方法領域的專業(yè)知識,又提供了培訓和材料以支持他們回去向所在機構的其他人教授所學到的方法。

嚴謹?shù)难芯亢蛯ρ芯可逃牟粩喾此紝⒋_保我們培養(yǎng)下一代統(tǒng)計學家成為數(shù)據(jù)科學時代的領導者。鑒于統(tǒng)計領域的重點是通過對數(shù)據(jù)的分析來了解世界,讓我們感到震驚的是,我們很少嘗試了解自己的專業(yè)以及我們通過數(shù)據(jù)收集和分析有效地培訓學生的能力。但是,這項活動很少有激勵措施。我們應該持續(xù)評估至少某些選擇的影響,而不是一味地投入有關最佳課程和最佳實踐的辯論。為了支持這種自我評估,NSF可以為下列研究創(chuàng)造資助機會:考察課程的批判式選擇、資格考試、課程計劃結(jié)構、培訓機會、教學方法等。這些評估的范圍覆蓋從數(shù)據(jù)收集工作(職業(yè)道路、工作滿意度等)到關于應屆畢業(yè)生感到缺少的技能的定性研究、關于當前培訓實踐狀況的描述性研究,或比較不同培訓策略有效性的隨機實驗。

參考文獻

  1. Bambauer, J., Muralidhar, K. and Sarathy, R. (2014). Fools Gold: An Illustrated Critique of Differential Privacy. Vanderbilt Journal of Entertainmentand Technology Law 16, 701-755.

  2. Breiman, L. (2001). Statistical modeling: the two cultures. Statist. Sci. 16, 199-231. With comments and a rejoinder by the author.

  3. Cassel, C.-M., Sarndal, C.-E. and Wretman, J. H. a. (1977). Foundations of inference in survey sampling. Wiley-Interscience John Wiley & Sons, New York-London-Sydney Wiley Series in Probability and Mathematical Statistics.

  4. Cleveland,W.S.(2001).DataScience: an Action Plan for Expanding the Technical Areas of the Field of Statistics. International Statistical Review 69, 21-26.

  5. Dwork, C., Hardt, M., Pitassi, T., Reingold, O. and Zemei, R. (2012). Fairness through awareness. ITCS12 Proceedings of the 3rd Innovations in Theoretical Computer Science Conference 214-226.

  6. Freedman, D. (1991). Statistical models and shoe leather. Sociological Methodologies 21 291-313.

  7. Lindsay, B. G., Kettenring, J. and Siegmund, D. O. (2004). A report on the future of statistics. Statist. Sci. 19 387-413. With comments.

  8. Lockhart, R., Taylor, J., Tibshirani, R. J. and Tibshirani, R. (2014). A significance test for the lasso. Ann. Statist. 42 413-468.

  9. Jordan, M.I. (2019). Artificial intelligence: The revolution hasn’t happened yet. Harvard Data Science Review, no. 1. https:///10.1162/ 99608f92.f06c6e61

  10. Meng, X.-L. (2018). Statistical paradises and paradoxes in big data (I): Law of large populations, big data paradox, and the 2016 US presidential election. Ann. Appl. Stat. 12 685-726.

  11. Mervis,J.(2019).Can a set of equations keep U.S. census data private? Science January 4.

  12. Neyman, J. (1934). On the two different aspects of the representative method: the method of stratified sampling and the method of purposive sampling. J. Roy. Statist. Soc. 97 558-625.

  13. Nolan, D. and Temple Lang, D. (2014). XML and Web Technologies for Data Sciences with R. Springer.

  14. Sarndal, C.-E., Swensson, B. and Wretman, J. (1992). Model assisted survey sampling. Springer Series in Statistics. Springer-Verlag, New York.

  15. Talagrand, M. (1994). Sharper bounds for Gaussian and empirical processes. Ann. Probab. 22, 28-76.

  16. Taylor, J. and Tibshirani, R. J. (2015). Statistical learning and selective inference. Proc. Natl. Acad. Sci. USA 112 7629-7634.

  17. Tukey, J.W. (1962). The future of data analysis. Annals of Statistics, 33, no. 1, 1-67.

  18. Waller, L. A. (2018). Documenting and evaluating data science contributions in academic promotion in departments of statistics and biostatistics. Amer. Statist. 72(1):11-19.

  19. Wender,B.A.(2017).Refining the Concept of Scientific Inference When Working with Big Data: Proceedings of a Workshop. US National Academy Report.

  20. Yu, B. (2013). Stability. Bernoulli 19, 1484-1500.

統(tǒng)計之都:專業(yè)、人本、正直的中國統(tǒng)計學社區(qū)。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多