小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

學(xué)界丨我這樣預(yù)測了醫(yī)療AI的發(fā)展,或許你也可以(附論文鏈接)

 萬皇之皇 2018-01-14

授權(quán)轉(zhuǎn)載自公眾號數(shù)據(jù)派THU

微信ID:DatapiTHU

2017年是非??犰诺囊荒?。醫(yī)療人工智能發(fā)展迅速,人工智能社區(qū)也表現(xiàn)出相應(yīng)的成長與創(chuàng)新。我曾做過一些預(yù)測,其中大多數(shù)都很模糊。

在技術(shù)方面,學(xué)術(shù)界決定逐步遠離越來越難取得進展的、過時的監(jiān)督學(xué)習(xí),而轉(zhuǎn)向生成模型。2017年初,研究者們深入到語音合成,圖像和視頻生成,超高解析度成像和自動著色等“恐怖谷”問題。到年末的時候,這些任務(wù)都至少完成了一部分。

(譯者注:恐怖谷理論是由日本機器人專家森昌弘提出的關(guān)于人類對機器人和非人類物體的感覺的假設(shè),對于那些模仿人類的機器人,仿真度越高人們越有好感,但是一旦與人類相像超過95%的時候,這種好感度會突然降低,越像人越反感恐懼,直至谷底,稱之為恐怖谷??墒?,當(dāng)機器人的外表和動作和人類的相似度繼續(xù)上升的時候,人類對他們的情感反應(yīng)亦會變回正面,貼近人類與人類之間的移情作用。)

圖像生成

2016年末生成的圖像(https:///

abs/1612.03242),上面有可辨識的鳥類,但是像素相當(dāng)?shù)停⒋嬖谝恍┢婀值腻e誤(例如,生成了太多的眼睛和腿等等)。

2017年末生成的圖像(https:///

abs/1710.10196)仍然存在一些小的偽影,不能完全正確地生成簡單的背景。但總的來說,我不能斷定他們并非真人。

對圖像生成的重視也意味著我們還沒看到模型上的重大突破,使其足以立即應(yīng)用于醫(yī)療領(lǐng)域。生成式對抗網(wǎng)絡(luò)(GAN)也許有助于訓(xùn)練數(shù)據(jù)的積累,同時,這些系統(tǒng)在學(xué)習(xí)數(shù)據(jù)流形邊緣方面的表現(xiàn)優(yōu)于純粹的監(jiān)督學(xué)習(xí)。但迄今為止,我還沒有見到任何它們在醫(yī)療臨床上有說服力的用途。

超高解析度成像技術(shù)(譯者注:超高解析度成像,是一種提高影片解析度的技術(shù)。)被用作為醫(yī)學(xué)影像去噪,降低了(成像過程中所需)輻射劑量。但是,由于超高解析度成像技術(shù)對圖像的修復(fù)是基于總體統(tǒng)計的,我相當(dāng)懷疑它被用于醫(yī)療診斷中是否足夠可靠。

這篇2016年的論文(https:///abs/1609.04802)中的圖像放大后還是清晰的,并且擁有逼真的織物紋理,但是這個模式和原始的模式已經(jīng)完全不同了。這個屬性也限制了這些模型在醫(yī)療領(lǐng)域中的用處,因為不能保證生成的數(shù)據(jù)能夠和真實的數(shù)據(jù)相吻合。

和醫(yī)療領(lǐng)域更關(guān)切的、研究人員們一直在談?wù)摰钠渲幸粋€問題是可解釋性(在我看來,這個問題雖然重要,但是其重要性被夸大了,我將會在之后的博客中談?wù)撨@個話題),另一個最近在討論的問題是實驗設(shè)計和分析的嚴謹性。這兩個主題都是目前醫(yī)療應(yīng)用中的痛點,而后者將需要大量的工作來彌合醫(yī)學(xué)和機器學(xué)習(xí)社區(qū)之間的文化鴻溝。

撇開對應(yīng)用研究的關(guān)注,雖然速度很慢,大多數(shù)人還沒有注意到,但是2017年是AI開始帶來變革的一年。在商業(yè)和消費者層面,人工智能應(yīng)用出現(xiàn)了爆炸性增長,最值得一提的是智能音箱和語音助手。同時,還有更多用于像農(nóng)業(yè)(https:///s/ai-for-good/why-farmers-are-turning-to-ai-to-boost-yields-379744fa25f3)這樣的傳統(tǒng)領(lǐng)域的應(yīng)用。

當(dāng)然,雖然似乎沒人注意到(https:///cars/2017/12/driverless-cars-became-a-reality-in-2017-and-hardly-anyone-noticed/),2017年11月7日是4級自動駕駛功能(譯者注:4級自動駕駛功能是在限定的道路和環(huán)境條件下,車輛可以完成絕大部分駕駛操作。智能駕駛技術(shù)一共分為5級,5級是全環(huán)境下的自動駕駛。)實現(xiàn)(https://www./watch?v=aaOB-ErYq6Y)的日子。這是一個巨大的分水嶺,也是第一個由人工智能引起的大規(guī)模全行業(yè)瓦解的開端。

2017年,我們社區(qū)也開始向內(nèi)審視,使工作更加井然有序。我們不僅看到了算法歧視(譯者注:算法歧視,是指在遭遇兩難選擇時,用算法決定選擇犧牲哪一方的利益;

https://www./s/608986/forget-killer-robotsbias-is-the-real-ai-danger/),同時,無論是好是壞(https:///@cody.marie.wild/fair-and-balanced-thoughts-on-bias-in-probabilistic-modeling-2ffdbd8a880f),我們也看到更多人性上的弱點(https:///@kristianlum/statistics-we-have-a-problem-304638dc5de5)。

在這里我并不想對文化評論太多,主要是因為身為一個澳大利亞人,從地理位置上而言我遠離大部分機器學(xué)習(xí)社區(qū),但有些問題還是需要開誠布公。上一個月我們發(fā)現(xiàn)了一起學(xué)科內(nèi)部的性騷擾事件(譯者注:指的是12月發(fā)生的NIPS大會性騷擾事件),雖然我們還是得等待,看看相關(guān)部門是否會跟進,但它所引起的反響還是相當(dāng)強烈的。他們會努力推進文化變革嗎,還是只說不做呢?

在機器學(xué)習(xí)社區(qū)內(nèi),這并非一起孤立事件(至少醫(yī)療領(lǐng)域有相同的問題(http://www./doi/full/10.1056/NEJMp1715962#t=article)),這要求我們每個人不僅僅要做到“體面”,還要樹立更高的道德標(biāo)準(zhǔn)。討論至今還集中于幾個壞蛋身上,但我希望我們所有人都仔細思考這樣一個事實:各級別的社區(qū)已經(jīng)容忍這些研究者的行為很久了。正如一位澳大利亞最高軍事領(lǐng)導(dǎo)人曾經(jīng)說過的,“你能坦然路過的標(biāo)準(zhǔn)就是你所接受的標(biāo)準(zhǔn)?!?/p>

視頻觀看網(wǎng)址:

https://www./watch?v=QaqpoeVgr8U&feature=youtu.be

不要因為出處而感到失望,這是我所看到的來自于機構(gòu)的關(guān)于騷擾和包容的最強有力的信息之一。觀察、傾聽、付諸實踐。

我們可以做得更好,我希望我們作為社區(qū)的成員,能夠更加積極主動地打擊行業(yè)中各種形式的騷擾和偏見。

所以,這就是2017。緊隨快速概覽之后,讓我們來看看,之前我是如何預(yù)測這一年的。

我的計分卡

去年大約這個時候,我對2017年醫(yī)療人工智能的發(fā)展做了一系列預(yù)測(https://lukeoakdenrayner./2016/12/31/predicting-medical-ai-in-2017/),現(xiàn)在是時候回頭看看這些預(yù)測是如何一步步實現(xiàn)的了。

如果你沒有讀過那篇博客,這里(https://lukeoakdenrayner./2016/12/27/the-three-phases-of-medical-ai-trials/)我將人工智能在醫(yī)療領(lǐng)域的發(fā)展分為3個階段。我并不認為這種分類是看待人工智能研究的理想辦法,但用來分析問題的效果還是不錯的。

第一階段的研究是概念驗證。使用典型的、通常與臨床實踐有很好的相關(guān)性的小型數(shù)據(jù)集。在藥物領(lǐng)域,成功的第一階段試驗只有10%的概率能夠轉(zhuǎn)化成產(chǎn)品,平均花費8年時間才能進入市場。

第二階段的研究更為嚴謹。使用大型的數(shù)據(jù)集,將模型與一些合理的基線進行比較,并在更廣泛的場景中呈現(xiàn)可信的結(jié)果。這些研究耗時且執(zhí)行難度很大。我們在2016年進行了獨立的第二階段試驗,促成了谷歌視網(wǎng)膜病變評估的論文(https:///journals/jama/fullarticle/2588763)的發(fā)表,每兩篇博客我都會提到這件事一次。

第三階段的試驗才是真正的工作。在一個大型隨機對照試驗中,人工智能系統(tǒng)被用作實踐工具。這涉及到第二階段沒有回答的主要問題:我們?nèi)绾卧趯嵺`中使用接近人類水平或超過人類水平的人工智能系統(tǒng)呢?其實如何將超人的人工智能系統(tǒng)安全有效地納入到臨床工作流程中目前仍未清晰,再提一次,我在另一篇博客中描繪了未來的圖景。

第一階段

我曾經(jīng)預(yù)測過,2017年期間,醫(yī)療人工智能的研究(定義為醫(yī)療數(shù)據(jù)的深度學(xué)習(xí))數(shù)量至少增加一倍。這個預(yù)言似乎已經(jīng)實現(xiàn)了。和去年的方法一樣,我使用谷歌學(xué)術(shù)搜索的結(jié)果,估算周期為6個月。雖然這是個非常粗略的數(shù)字(會議月份出現(xiàn)了巨大的異常值,谷歌學(xué)術(shù)搜索也不是真正的權(quán)威來源),但它至少保持了一致性。

2016年:每月5-10個試驗(接近5)

2017年:每月10-20個試驗(大概15個左右)

在文獻方面的另一個重大變化就是大量的期刊社論、綜述文章和關(guān)于深度學(xué)習(xí)的地位陳述方面的文章數(shù)量激增。老實說,幾乎每個月都有實際的研究論文發(fā)表!我在2017年的“其他雜項預(yù)測”(第3條)中提到了這個情況,但它的規(guī)模之大卻讓我大吃一驚。

雖然我們可以調(diào)侃,更多的人是在談?wù)撋疃葘W(xué)習(xí),而不是真正在做深度學(xué)習(xí),但我更愿意用積極的眼光看待這一問題。2017年是醫(yī)生開始認真對待人工智能的一年。各種專家會議、大型和小型期刊、時事通訊、大型圓桌會議、工作小組和治理機構(gòu)都在討論人工智能。雖然仍能聽到很多反對的聲音,但是感覺經(jīng)歷了過去12個月的討論之后,人工智能好像出現(xiàn)了轉(zhuǎn)機,成為了主流醫(yī)學(xué)時代潮流的一部分。

分值

我雖然準(zhǔn)確地預(yù)測到了這一點,但很可能低估了大量對人工智能的非研究性的討論的傳播所造成的影響。

第二階段

我預(yù)測人工智能在2017年,將會有3-5個第二階段的醫(yī)學(xué)試驗,主要來自于既有的集團。

這一年以斯坦福大學(xué)關(guān)于皮膚病的論文(https://www./articles/nature21056)在1月份《自然》雜志的出版這一“大爆炸”為開端。

但是后來很長時間又歸于沉寂,今年大部分時間都沒有再出現(xiàn)大規(guī)模的令人信服的試驗。

但是隨著年末臨近,每個人似乎都在忙于發(fā)表研究成果。這些研究的大多數(shù)成果都有一些不足的地方,或者結(jié)論平淡無奇,或者說法夸張,但是他們都可能有資格作為第二階段的研究。這實際上也是我預(yù)測到的一個問題;我并沒有明確地定義第二階段,只給了幾種可能的解釋。在新的一年里,我將會討論一些方法來更好地評估第二階段的研究質(zhì)量,其實我真正想問的問題是:“是否有一個能夠產(chǎn)生可信的結(jié)果的大型數(shù)據(jù)集”?

最有說服力的研究(https:///journals/jama/article-abstract/2665774)來自于從病理切片中識別乳腺癌淋巴結(jié)轉(zhuǎn)移的大型競賽(https://camelyon16./)。我以前談?wù)撨^這個任務(wù),它很酷也很重要。這篇論文匯集了多個參與者的成果,并與表現(xiàn)良好的人類基線做過比較。我們以后再來討論這項研究,現(xiàn)在只想公平地說,這項工作的重要性可以與谷歌視網(wǎng)膜病變的論文相提并論。

接下來兩個高質(zhì)量的研究分別是“用卷積神經(jīng)網(wǎng)絡(luò)進行心臟病專家級的心律不齊檢測(Cardiologist Level Arrhythmia Detection Using Neural Networks,https:///abs/1707.01836)”;和“肌肉骨骼影像學(xué)醫(yī)師級的水平異常檢測(MURA Dataset: Towards Radiologist-Level Abnormality Detection in Musculoskeletal Radiographs, https:///abs/1712.06957)”,有趣的是,它們都是來自于斯坦福的機器學(xué)習(xí)小組。我認為這兩項研究是第二階段“中等質(zhì)量”的研究,因為雖然能夠讓我們在一定程度上推斷出可信的結(jié)果來,但是直接的臨床影響并不十分清楚。

 如果你忽略一些要求的話,包括檢測腦出血(https:///abs/1710.04934),肺炎(https:///abs/1711.05225),髖部骨折(順便說一下,這是我的團隊做的,https:///abs/1711.06504),各種腦病理學(xué)(https:///abs/1711.09313)和一個骨齡評估的競賽(http://rsnachallenges./

competitions/4#learn_the_details-news)在內(nèi),憑借大型訓(xùn)練集而被分為第二階段的其他的實驗結(jié)果至少都通過了吸氣測試(sniff test)。但是這些研究和臨床實踐之間的直接關(guān)系是相當(dāng)不確定的。

分值

我們看到這個類別中有3到5項研究任務(wù),數(shù)量不是很確切。我們有3個中等質(zhì)量或更高質(zhì)量的第二階段實驗,另外還有6項實驗也可以算作第二階段,但是有一些局限性。

如果我們以谷歌視網(wǎng)膜病變的論文作為衡量標(biāo)準(zhǔn),那么今年就只有1篇論文了。如果我們對第二階段有一個更寬松的定義,可能會有多達8篇。我打算給自己的預(yù)測一個實實在在的B+的成績,但有一個限制條件:任何關(guān)于這個類別的未來預(yù)測都需要更加具體的內(nèi)容。

我還預(yù)測到大多數(shù)研究工作將來自既定的集團,而不是大學(xué)或初創(chuàng)公司,然而在這點上我卻預(yù)測錯了。實際上是大學(xué)和初創(chuàng)公司的混合體,但沒有集團性的突破。

第三階段

2016年,我們沒有第三階段的實驗。

2017年,我預(yù)測不會有第三階段的實驗。

2017年,我們沒有第三階段的實驗。

分值

這個階段我預(yù)測對了,原因很明顯是由于臨床試驗的困難、昂貴和耗時。

其他雜項

我對2017年還做了其他一些預(yù)測,其中有部分被證偽了。

1.AR/VR和3D打印不會有多大效果:是的,是真的。這些的確是很酷的技術(shù),但在我看來沒有明顯的醫(yī)療用途。我看過很多是噱頭的東西。也許3D打印骨骼支架和器官移植將是一個大的應(yīng)用,但是如果要應(yīng)用到臨床上似乎還有很長的路要走。

2.1000美元以下的基因組:取決于你找誰報價。最低報價可到450美元。

但如果我們以genome.gov公布的數(shù)據(jù)為依據(jù)的話(這確實是報價的依據(jù)),我就真的預(yù)測錯了。價格仍然在1000美元左右。

3.生物技術(shù)的發(fā)展將勢如破竹:這不是一個被證偽的預(yù)測命題,實際上從理念上說是正確的?;虔煼ㄒ呀?jīng)獲得美國食品藥物管理局(FDA)的批準(zhǔn)(https://cen./articles/95/web/2017/12/First-gene-therapy-genetic-disease.html),而且在今年年底,我們看到歷經(jīng)幾十年的發(fā)展,這項技術(shù)已經(jīng)趨于成熟,達到真正的分界點。嚴肅期刊近期發(fā)表了許多遺傳疾病的單劑量療法,包括腎上腺腦白質(zhì)營養(yǎng)不良(adrenoleukodystrophy,http://www.nejm.

org/doi/full/10.1056/NEJMoa1700554)、A型血友病(haemophilia A,http://www./

doi/10.1056/NEJMoa1708483)和脊髓性肌萎縮

(spinal muscular atrophy,http://www.nejm.

org/doi/full/10.1056/NEJMoa1706198)。這可能是醫(yī)學(xué)史上最令人興奮的消息,遠比人工智能更令人興奮。安全有效的基因療法將在許多方面成為游戲規(guī)則的改變者,而不僅僅是在罕見的遺傳病條件下。

4.醫(yī)療應(yīng)用程序:今年的大新聞是,大多數(shù)的醫(yī)療應(yīng)用程序,只要不提供實際的醫(yī)療建議或醫(yī)療數(shù)據(jù)分析,就不再需要FDA的審查了。所以節(jié)食記錄、運動監(jiān)測,服藥提醒,諸如此類的應(yīng)用程序都可以直接向公眾銷售,而無需監(jiān)管部門的批準(zhǔn)。這個規(guī)定將在2018年產(chǎn)生很大的影響,但是我對健康應(yīng)用程序了解甚少,所以無法用來評判我的預(yù)測。一般信息類的應(yīng)用程序例如Epocrates和MDCalc的下載量很大,再比如,F(xiàn)itbit及類似這樣的應(yīng)用程序也很流行,但是這些應(yīng)用并沒有讓我感到興奮。因為這些應(yīng)用是不能顯著改善健康狀況的。也許更具有針對性的應(yīng)用或服務(wù),例如糖尿病管理平臺(Livongo,https://www.ncbi.h

.gov/pmc/articles/PMC5527250/)或奧巴馬醫(yī)療(https:///2017/11/how-digital-health-care-can-help-prevent-chronic-diseases-like-diabetes)更有實際效果。我對自己有關(guān)醫(yī)療應(yīng)用程序方面的知識并不自信。如果有人知道很多關(guān)于這方面的知識,歡迎寫信告訴我。

分值

不知道該得多少分,也許再得一個B+?

總分

兩個A,兩個B? 好吧,我認為這個分數(shù)已經(jīng)很好了。

來到這里,我們已經(jīng)簡單回顧了2017年醫(yī)療(和其他)人工智能世界。我認為我的預(yù)測相當(dāng)準(zhǔn)確。技術(shù)如此之新,改變?nèi)绱酥徛虼丝深A(yù)測性會更高。我預(yù)測明年將是更具爆發(fā)性的一年,而且可能將更加難以進行預(yù)測。

順便提一句,如果有時間的話,我認為這種年度總結(jié)和預(yù)測既有趣又很值得一做。我做了這件事后,加深了對這個行業(yè)的理解,提高了對未來一年的研究重點的認識,研究什么可能有用而研究什么可能沒多大用。

同樣的知名人士Miles Brundage 也做了預(yù)測,預(yù)測的內(nèi)容主要圍繞著強化學(xué)習(xí)(RL)和自然語言處理(NLP)技術(shù)方面,我急切的等待他跟進2017嚴謹?shù)念A(yù)測(http://www./blog-posts/my-ai-forecasts-past-present-and-future-main-post)。

幾周內(nèi)寫一篇關(guān)于我對2017的預(yù)測表現(xiàn)如何(還有一段時間來證明我是正確/錯誤) 的博客會有問題, 但我認為評價我的預(yù)測的布萊爾分數(shù)(Brier score)將會是 ~. 45 +/-1... 取決于你如何解決某些問題。

— Miles Brundage (@Miles_Brundage) 2017年12月18日

我去除了所有的統(tǒng)計學(xué),他用布萊爾分數(shù)評價,而我用模糊的“氛圍”評價。

無論如何,感謝您閱讀我在2017年寫的文章,我期待著您來年閱讀我對2018年的預(yù)測。

原文鏈接:

https://lukeoakdenrayner./2017/12/27/2017-in-review-progress-problems-and-predictions/

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多