小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

AI可以如何抗擊新冠?WHO論文告訴你這三大場(chǎng)景大有可為

 板橋胡同37號(hào) 2020-03-24

選自arXiv

作者:Joseph Bullock等

機(jī)器之心編譯

機(jī)器之心編輯部

隨著新冠疫情的持續(xù)發(fā)展,全世界的研究者都在致力于疫情的緩解,其研究重點(diǎn)包括:追蹤病毒傳播、促進(jìn)病毒檢測(cè)、開發(fā)疫苗、尋找新的治療方法、了解疫情的社會(huì)經(jīng)濟(jì)影響等。在這篇綜述文章中,來自杜倫大學(xué)、蒙特利爾大學(xué)、WHO等機(jī)構(gòu)的研究者探討了 AI 相關(guān)技術(shù)在疫情中發(fā)揮的作用,總結(jié)出了 AI 在醫(yī)療、分子、社會(huì)三個(gè)層面的應(yīng)用。


具體來說,分子層面包括藥物挖掘等相關(guān)研究;醫(yī)療層面包括個(gè)體病人的診斷和治療;社會(huì)層面包括流行病學(xué)和信息醫(yī)學(xué)研究等。此外,論文還綜述了當(dāng)前可用的開源數(shù)據(jù)集和其他資源。

這篇綜述的目的并非評(píng)估文中所述技術(shù)的重要性,也不做推薦之用,而是向讀者展示當(dāng)前 AI 技術(shù)在抗擊疫情方面的應(yīng)用范。


論文鏈接:https://drive.google.com/file/d/1vDcb6HeS-hufNgqH0dDhIEGjuJpnnkzT/view

醫(yī)療層面:從診斷到結(jié)果預(yù)測(cè)

迄今為止,AI 在應(yīng)對(duì) COVID-19 上的應(yīng)用大多集中在醫(yī)學(xué)成像的診斷上。在近期多篇文獻(xiàn)中,除了使用患者醫(yī)學(xué)數(shù)據(jù)預(yù)測(cè)疾病進(jìn)展的方法、用于病情監(jiān)測(cè)的無創(chuàng)檢測(cè)方法,還有 AI 協(xié)助計(jì)算機(jī)進(jìn)行 CT 診斷的案例。

醫(yī)學(xué)影像診斷

RT-PCR 測(cè)試是診斷 COVID-19 的關(guān)鍵方法,但這種方法仍存在樣本采集、分析時(shí)間等局限性,所以人們?cè)絹碓疥P(guān)注使用醫(yī)學(xué)成像技術(shù)進(jìn)行 COVID-19 診斷。COVID-19 具有特殊的放射學(xué)特征和圖像模式,這些特征均可通過 CT 掃描的方式觀察到,但對(duì)于放射學(xué)科的醫(yī)務(wù)人員來說,識(shí)別這些圖像也頗為費(fèi)時(shí),因此在 CT 掃描診斷過程中使用機(jī)器學(xué)習(xí)方法是一種理想的選擇。

多項(xiàng)研究已經(jīng)將診斷定為二元分類問題,即「健康」與「新冠病毒陽性」。
 
Wang 等人使用改進(jìn)過的 Inception 神經(jīng)網(wǎng)絡(luò)架構(gòu),對(duì)醫(yī)生確定過的區(qū)域進(jìn)行訓(xùn)練,從而對(duì)健康患者和新冠患者進(jìn)行二元分類?;?259 位患者的約 1000 個(gè)圖像切片的數(shù)據(jù)集,研究者訓(xùn)練出了能夠識(shí)別疑似 COVID- 19 的模型,然后將結(jié)果提供給醫(yī)生作進(jìn)一步診斷。
Chen 等人也發(fā)現(xiàn),在經(jīng)由專業(yè)醫(yī)生標(biāo)記過的 6000 多張 CT 圖像切片數(shù)據(jù)上訓(xùn)練 UNet++神經(jīng)網(wǎng)絡(luò),其性能可接近專業(yè)醫(yī)生的診斷水平。這一模型之后在武漢大學(xué)人民醫(yī)院進(jìn)行部署,用以協(xié)助醫(yī)生加快對(duì)病例的分析及診斷,目前這一模型也已開源。

其他機(jī)器學(xué)習(xí)方法將診斷歸結(jié)為 3 種分類任務(wù):健康、COVID-19 患者及其他類型肺炎患者。

在 Xu 和 Song 的研究中,經(jīng)典的 ResNet 架構(gòu)可用于特征提取。Xu 等人添加了幾個(gè)用于分類的全連接層,Song 等人則添加了特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network)和注意力模塊,使網(wǎng)絡(luò)更加復(fù)雜,但在圖像細(xì)粒度方面表現(xiàn)更好。

這兩項(xiàng)研究均表明,即使在診斷過程中可能存在多個(gè)疑似結(jié)果(包括非 COVID-19 的肺炎類型),這種方法也能夠準(zhǔn)確地區(qū)分開來。

此外,還有一些研究采用了融合型方法:將現(xiàn)有的軟件與特定機(jī)器學(xué)習(xí)方法相結(jié)合,以實(shí)現(xiàn)更高的準(zhǔn)確性。

在 Gozes 等人的研究中,商業(yè)醫(yī)學(xué)影像程序可用來進(jìn)行原始圖像的處理,然后與一個(gè) ML Pipeline 結(jié)合使用。這種兩步式方法包含在肺異常醫(yī)學(xué)影像數(shù)據(jù)上訓(xùn)練過的 U-Net 架構(gòu),以及在 ImagetNet 上訓(xùn)練過的 Resnet-50,其中圖像分類已微調(diào)為「Coronavirus」和「健康」。

Shan 等人的研究中,采用了「human- in-the-loop」的方法減少機(jī)器學(xué)習(xí)架構(gòu)所需的標(biāo)記時(shí)間。研究者使用少量人工標(biāo)記的數(shù)據(jù)來訓(xùn)練基于 V-Net 架構(gòu)的初始模型。

該模型對(duì)新的 CT 掃描影像進(jìn)行分割,之后經(jīng)由專業(yè)醫(yī)生校正,在迭代過程中不斷反饋到模型中。這種方法使得基于深度學(xué)習(xí)技術(shù)的系統(tǒng)可用于自動(dòng)分割和感染區(qū)域統(tǒng)計(jì),以及評(píng)估患者 COVID-19 病情的嚴(yán)重程度。

研究表明,該模型的性能逐步提升,經(jīng)過 200 個(gè)帶注釋的示例數(shù)據(jù)訓(xùn)練之后,將新圖像分析所需的人工時(shí)間從開始的 30 分鐘以上減少到 5 分鐘以上。這個(gè)方法將機(jī)器學(xué)習(xí)的優(yōu)勢(shì)與人類的專業(yè)知識(shí)相結(jié)合,是一個(gè)前途廣闊的研究方向。

疾病跟蹤的非侵入式測(cè)量

另外一種不需要特殊醫(yī)療成像設(shè)備的原創(chuàng)性方法是,通過 Kinect 深度相機(jī)來識(shí)別病人的呼吸模式。

該方法基于最近對(duì) COVID-19 患者癥狀的臨床發(fā)現(xiàn),即 COVID-19 患者的呼吸模式不同于其他流感或普通感冒,其較明顯地表現(xiàn)出呼吸急促癥狀。

基于以上臨床信息,研究者開發(fā)出一種具有注意力機(jī)制的雙向 GRU 神經(jīng)網(wǎng)絡(luò),并使用它來識(shí)別反常的呼吸模式。

研究者使用 20 名參與者的真實(shí)數(shù)據(jù)以及基于真實(shí)記錄產(chǎn)生的大量仿真數(shù)據(jù)來訓(xùn)練該模型。雖然這些反常的呼吸模式并不一定與真實(shí)的 COVID-19 診斷相關(guān),但對(duì)這些呼吸急促癥狀的預(yù)測(cè)可作為首要診斷特征,為大范圍監(jiān)控潛在患者提供幫助。

另外一些方案是使用手機(jī)來檢測(cè) COVID-19,有使用嵌入式傳感器來識(shí)別 COVID-19 癥狀的,也有通過回答在手機(jī)調(diào)查問卷中的一些關(guān)鍵問題來排查高風(fēng)險(xiǎn)病人的。雖然以上方法都是在移動(dòng)技術(shù)方面的重要嘗試,但目前的研究并不足以評(píng)估這些方法的可行性與性能表現(xiàn)。

患者預(yù)測(cè)

Yan 等人提出一種基于患者臨床數(shù)據(jù)與血樣檢測(cè)中特征的預(yù)測(cè)方法,該方法能夠幫助臨床醫(yī)生盡早地識(shí)別出高風(fēng)險(xiǎn)患者,希望以此提高患者的預(yù)后以及減少重癥患者的死亡率。

與此研究相類似的方法有,基于 XGBoost 算法的預(yù)測(cè)模型,其用于預(yù)測(cè)死亡風(fēng)險(xiǎn)和識(shí)別能夠在醫(yī)院中進(jìn)行檢測(cè)的關(guān)鍵測(cè)量特征?;?375 名患者的數(shù)據(jù),作者從 300 多個(gè)輸入特征中篩選出三個(gè)關(guān)鍵臨床指標(biāo),為預(yù)測(cè)患者死亡率提供了一種臨床啟發(fā)式的依據(jù)。該方法的一大優(yōu)勢(shì)是其具有良好的可解釋性,因?yàn)楹Y選出的這三個(gè)指標(biāo)與 COVID-19 病理學(xué)進(jìn)展中的幾個(gè)最重要因素相關(guān),即細(xì)胞損傷、細(xì)胞免疫與發(fā)炎。

一個(gè)與此互補(bǔ)的研究是,在半自動(dòng)標(biāo)記的 CT 影像上訓(xùn)練一個(gè) U-Net 變種,該方法旨在預(yù)測(cè) COVID-19 患者是否需要長(zhǎng)時(shí)間住院觀察。這意味著一旦完成初期診斷,我們?nèi)匀豢墒褂脵C(jī)器學(xué)習(xí)的方法來預(yù)測(cè)患者病情的嚴(yán)重程度以及是否需要長(zhǎng)期住院。

分子層面:從蛋白質(zhì)到藥物挖掘

蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)

蛋白質(zhì)具有的 3D 結(jié)構(gòu)由它們的基因序列決定,并且該結(jié)構(gòu)會(huì)影響蛋白質(zhì)的功能與作用。一般而言,蛋白質(zhì)結(jié)構(gòu)通過 X 光晶體衍射圖譜法等實(shí)驗(yàn)研究法來確定,但這些方法花費(fèi)昂貴、耗費(fèi)時(shí)間。

最近,計(jì)算模型已經(jīng)被用來進(jìn)行蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè),主要有兩種方式:一種是模板建模,它的原理是利用相似蛋白作為模板序列進(jìn)而預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu);另一種是無模板建模,它主要預(yù)測(cè)那些無已知相似結(jié)構(gòu)的蛋白質(zhì)的結(jié)構(gòu)。

2018 年底,谷歌 DeepMind 重磅推出 AlphaFold,它能夠利用基因序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。給定一種新的蛋白質(zhì),AlphaFold 利用神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)氨基酸對(duì)之間的距離,以及連接它們的化學(xué)鍵之間的角度。根據(jù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的兩種物理屬性,DeepMind 還訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)以預(yù)測(cè)蛋白質(zhì)成對(duì)殘基(residues)之間距離的獨(dú)立分布,這些概率能組合成估計(jì)蛋白質(zhì)結(jié)構(gòu)準(zhǔn)確率的評(píng)分。目前,AlphaFold 可以預(yù)測(cè)與 SARS-Cov-2 相關(guān)的 6 種蛋白質(zhì)的結(jié)構(gòu),分別為 SARS-Cov-2 膜蛋白、蛋白 3a、Nsp2、Nsp4、Nsp6 和 papain-like 蛋白酶。

改進(jìn)病毒 DNA 測(cè)試

當(dāng)前,機(jī)器學(xué)習(xí)和新型基因組技術(shù)也用來提升 PT-PCR 的測(cè)試效果。Metsky 等人利用 CRISPR(一種通過割裂特定基因遺傳代碼鏈并利用酶來編輯基因組的工具)來進(jìn)行檢驗(yàn)分析設(shè)計(jì),用以檢測(cè)包括 SARS-CoV-2 在內(nèi)的 67 種呼吸道病毒。此外,對(duì)于那些被預(yù)測(cè)為敏感性和特異性并且涵蓋多種基因組的檢測(cè)分析,有些 ML 模型可以加速它們的設(shè)計(jì)。

老藥新用

發(fā)現(xiàn)當(dāng)前藥物可以用來治療 COVID-19 的一種方法是生物醫(yī)學(xué)知識(shí)圖譜。生物醫(yī)學(xué)知識(shí)圖譜網(wǎng)絡(luò)可以捕捉蛋白質(zhì)與藥物等不同實(shí)體之間的聯(lián)系,從而可以進(jìn)一步了解它們彼此之間的關(guān)聯(lián)。

Richardson 等人利用生物醫(yī)學(xué)知識(shí)圖譜識(shí)別出了巴瑞替尼,這是一種通常用于治療關(guān)節(jié)炎的藥物,但由于它能夠抑制 AP2 相關(guān)的蛋白激酶 1(AAK1),使得病毒很難進(jìn)入宿主細(xì)胞,所以該藥物可能適用于 COVID-19 的治療。

Ge 等人也提出一種類似方法來構(gòu)建關(guān)聯(lián)人體蛋白、病毒蛋白和藥物的知識(shí)圖譜,它所使用的數(shù)據(jù)集捕捉了這些實(shí)體之間的關(guān)系。這種知識(shí)圖譜用來預(yù)測(cè)可能有效的候選藥物。作者已經(jīng)識(shí)別出了多聚腺苷酸聚合酶抑制劑 CVL218,目前正處在臨床試驗(yàn)階段。

其他一些研究也利用創(chuàng)建的模型來預(yù)測(cè)蛋白配體的復(fù)合物親和性,以解決老藥新用的難題。Hu 等人使用多任務(wù)神經(jīng)網(wǎng)絡(luò)對(duì)親和性進(jìn)行廣義預(yù)測(cè)。作者已經(jīng)識(shí)別出了一系列 SARS-Cov-2 相關(guān)的蛋白質(zhì),如 RNA 依賴的核糖核酸聚合酶、3C-like 蛋白酶、解旋酶以及包膜蛋白等等,從而借助于 4895 種藥物的數(shù)據(jù)集展開靶向治療。他們推薦了 10 種可能有效果的藥物以及這些藥物的靶蛋白和復(fù)合物親和性評(píng)分。為了提升模型的可解釋性,他們還對(duì)每個(gè)靶蛋白可能出現(xiàn)結(jié)合的精確位置進(jìn)行預(yù)測(cè)。

同樣地,Beck 等人利用他們提出的 Molecule Transformer-Drug Target Interaction(MT-DTI)復(fù)合物親和性模型,識(shí)別出美國食品及藥物管理局(FDA)批準(zhǔn)抗病毒藥物中可能對(duì) 6 種冠狀病毒蛋白質(zhì)(分別為 3C-like 蛋白酶、RNA 依賴的核糖核酸聚合酶、解旋酶、3』-to-5』核酸外切酶、endoRNAse 和 2』-O-ribose 甲基轉(zhuǎn)移酶)有效的藥物。MT-DTI 模型以 SMILES 數(shù)據(jù)和氨基酸序列的形式輸入串?dāng)?shù)據(jù),并運(yùn)用一種借鑒 BERT 算法的文本建模方法。此外,該模型識(shí)別的藥物可能對(duì)上述蛋白具有靶向效果。

最后,Zhang 等人利用密集全連接神經(jīng)網(wǎng)絡(luò),它在 PDBBind 數(shù)據(jù)集上被訓(xùn)練用于預(yù)測(cè)復(fù)合物親和性,從而識(shí)別 3C-like 蛋白酶的潛在抑制劑。他們利用 SARS 病毒變體創(chuàng)建了靶蛋白同源(模板)模型,并探索現(xiàn)有復(fù)合物(如 ChemDiv 和 TargetMol)和三肽的數(shù)據(jù)集,從而找出對(duì)蛋白質(zhì)具有靶向效果的治療手段。

藥物發(fā)現(xiàn)

一些研究者試圖尋找新的化合物,用來治療新冠肺炎。Zhavoronkov et al. (2020a) 等就使用了一個(gè)專有管道,尋找類 3C 的水解酶抑制劑。他們的模型使用了三種輸入:蛋白質(zhì)晶體結(jié)構(gòu)、類晶體的例子,以及蛋白質(zhì)模型本身。對(duì)于每個(gè)輸入類型,研究者擬合了 28 種不同的模型,包括生成自編碼器和生成對(duì)抗網(wǎng)絡(luò)。研究者使用強(qiáng)化學(xué)習(xí)探索潛在的候選藥物,其中有一個(gè)獎(jiǎng)勵(lì)函數(shù)和一些標(biāo)準(zhǔn)——藥物相似性、新穎性、和多樣性相聯(lián)系。同時(shí),他們確認(rèn)識(shí)別出的候選化合物和已有的化合物不同,說明它們確實(shí)找到了不同的藥物。

Tang et al. (2020) 也使用了強(qiáng)化學(xué)習(xí)來發(fā)現(xiàn)藥物。研究者整理了 284 種已知的分子——能夠抑制 SARS 類病毒。他們將這些蛋白質(zhì)打碎成 316 個(gè)片段,然后使用高級(jí)深度 Q-learning 來組合,進(jìn)行藥物設(shè)計(jì)。這種強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)有三個(gè)評(píng)價(jià)角度:藥物相似性分?jǐn)?shù)、加入的預(yù)定義「傾向使用的」片段和出現(xiàn)的已知藥效集團(tuán)(和化合物的功效有關(guān)的特定結(jié)構(gòu))。

結(jié)果,有 4922 個(gè)結(jié)果通過啟發(fā)式搜索被過濾。最終有排名最前的 47 個(gè)化合物在分子模擬中進(jìn)行評(píng)估。研究者會(huì)選擇最可能有效的化合物,并進(jìn)行生產(chǎn)和測(cè)試。

社會(huì)層面:流行病學(xué)和信息病學(xué)

流行病學(xué)

流行病學(xué)研究覆蓋領(lǐng)域極其廣泛,其流行的規(guī)模和相關(guān)性,以及數(shù)據(jù)的實(shí)時(shí)更新等多方面因素導(dǎo)致了研究工作必須進(jìn)行多種類建模。但此次團(tuán)隊(duì)將專注于用機(jī)器學(xué)習(xí)去完成流行病學(xué)建模的案例。

鑒于流行病感染速度迅速,所以短期實(shí)時(shí)預(yù)測(cè)是作為提供信息的重要來源之一,同時(shí)模型必須兼?zhèn)潇`活性,以適應(yīng)各種不斷變化的協(xié)議或是程序。

Hu et al. (2020b)?收集了 WHO 以及其他預(yù)測(cè)參與者于 2020 年 1 月 11 日至 2 月 27 日期間收集的數(shù)據(jù),用以開發(fā)創(chuàng)建一個(gè)新的關(guān)于中國國內(nèi)累積或是新增確診病例的數(shù)據(jù)集。這些信息主要用于訓(xùn)練調(diào)整后的自動(dòng)編碼器(MAE),以便實(shí)時(shí)預(yù)測(cè)新病例,并估計(jì)流行病的嚴(yán)重程度以及持續(xù)時(shí)間。

類似的,Al-qaness et al. (2020) 模型可以使用歷史數(shù)據(jù)并提前十天預(yù)測(cè)確診病例的總?cè)藬?shù)。而作者的模型是基于 neuro-fuzzy inference system (ANFIS) (Jang, 1993),flower pollination algorithm (FPA) (Yang, 2012) 以及 salp swarm algorithm (SSA)(Mirjalili et al., 2017) 進(jìn)而最優(yōu)化模型里的參數(shù)。

而 Mizumoto et al. (2020) 通過 ML 的方法利用從鉆石公主號(hào)游輪上所收集的感染數(shù)據(jù)來了解無癥狀病例的發(fā)生率。作者利用這些數(shù)據(jù)通過貝葉斯分析對(duì)時(shí)間序列進(jìn)行建模,并使用了 Hamiltonian Monte Carlo (HMC) 以及 No-U-Turn- Sampler (Homan & Gelman, 2014) 進(jìn)行調(diào)整模型參數(shù),從而預(yù)估無癥狀感染者的可能性。盡管在這種封閉式環(huán)境中進(jìn)行分析是非常重要的,但是否值得對(duì)外適用于更廣泛的人群還有待觀察。

信息學(xué)

當(dāng)下社交媒體以及在線平臺(tái)已成為疫情相關(guān)信息的主要傳播渠道,而團(tuán)隊(duì)更看重的是「信息流行病」,如錯(cuò)誤信息的信息或是謠言會(huì)越傳越廣。

Cinelli et al. (2020)?分析了與 COVID- 19 相關(guān)社交媒體的內(nèi)容,作者從 Twitter, Instagram, YouTube, Reddit, 以及 Gab 中收集的 800 萬條于 2020 年 1 月 1 日至 2 月 14 日間使用 COVID- 19 關(guān)鍵字的評(píng)論或帖子。作者預(yù)估了對(duì) COVID- 19 話題的參與度,并橫向比較了各平臺(tái)間話題的發(fā)展進(jìn)度?;?dòng)參與度是通過使用累積的貼子數(shù)以及 45 天內(nèi)對(duì)帖子的反饋來反應(yīng)的(如評(píng)論,點(diǎn)贊等)。作者采用 phenomenological (Fisman et al., 2013) 以及經(jīng)典 SIR 模型來表示信息傳播或復(fù)制的數(shù)量。

類似的,Mejova & Kalimeri (2020)? 研究對(duì)象是使用帶有病毒相關(guān)內(nèi)容的 Facebook 廣告,通過使用「冠狀病毒」以及「COVID- 19」等關(guān)鍵字去搜索所有廣告,其范圍覆蓋了 34 個(gè)國家及地區(qū),并收集了 923 余條結(jié)果。大部分位于美國和歐盟,而其中 5% 的廣告是具有較強(qiáng)的誤導(dǎo)信息。

此外,也有研究者著手于新冠病毒特定新聞內(nèi)容的整理,并進(jìn)行了人工和自動(dòng)的真實(shí)性驗(yàn)證和相關(guān)性分析。Pandey et al. (2020)?開發(fā)了一個(gè)評(píng)估每日新聞?lì)^條和 WHO 建議之間相似度的渠道。如果相似度高于某個(gè)閾值,則這篇新文章就會(huì)在用戶的時(shí)間線上出現(xiàn),同時(shí)附有 WHO 的相關(guān)建議。其中相似度的閾值由人工審核確定,依據(jù)用戶反饋不斷更新。針對(duì)相互矛盾的信息,這種方法可以幫助大眾識(shí)別準(zhǔn)確可信賴的新聞報(bào)道,也能促使重要的指導(dǎo)性文章產(chǎn)生更廣泛的影像,推動(dòng)官方的關(guān)注與采納建議。

數(shù)據(jù)集和其他資源 

利用 AI 抗擊新冠病毒離不開各種開源數(shù)據(jù)集和其他資源,本文重點(diǎn)介紹了當(dāng)前可用的案例數(shù)據(jù)、文本數(shù)據(jù)和生物醫(yī)學(xué)數(shù)據(jù)。

案例數(shù)據(jù)

案例數(shù)據(jù)是指病例的數(shù)量和地域分布,這種數(shù)據(jù)對(duì)于追蹤 COVID19 疫情的蔓延具有重要作用。這份綜述列舉的案例數(shù)據(jù)包括:

  • WHO COVID-2019 現(xiàn)狀報(bào)告:https://www./emergencies/diseases/novel-coronavirus-2019/situation-reports

  • 約翰·霍普金斯 CSSE:https://github.com/CSSEGISandData/COVID-19

  • nCoV2019 GitHub 項(xiàng)目:https://github.com/beoutbreakprepared/nCoV2019

  • 人道主義社會(huì)交換項(xiàng)目:https://data./event/covid-19

  • 專為醫(yī)學(xué)專家開發(fā)的項(xiàng)目:https://github.com/CodeForPhilly/chime

  • 意大利封鎖后的移動(dòng)變化數(shù)據(jù):https://covid19mm./in-progress/2020/03/13/first-report-assessment.html


文本數(shù)據(jù)

NLP 方法在這次疫情研究中發(fā)揮了重要作用,利用該技術(shù)解讀的大量文本信息可以幫助我們了解當(dāng)前有哪些信息是已知的(如病毒傳播、環(huán)境穩(wěn)定性、風(fēng)險(xiǎn)因素等)。這部分的數(shù)據(jù)包括:

  • WHO 全球新冠病毒研究文獻(xiàn)數(shù)據(jù)庫:https://www./emergencies/diseases/novel-coronavirus-2019/global-research-on-novel-coronavirus-2019-ncov

  • 當(dāng)前最大的新冠相關(guān)文獻(xiàn)開源數(shù)據(jù)集 CORD-19:https://pages./coronavirus-research

  • Kaggle 開源數(shù)據(jù)集挑戰(zhàn)賽:https://www./allen-institute-for-ai/CORD-19-research-challenge

  • 其他開源數(shù)據(jù)集:https://www.ncbi.nlm./research/coronavirus/;https://covid-19./

  • 社交媒體數(shù)據(jù)集:https://github.com/echen102/COVID-19-TweetIDs;https://www./smid80/coronavirus-covid19-tweets


生物醫(yī)學(xué)數(shù)據(jù)

目前,用于診斷的開源數(shù)據(jù)集和模型還不是很多。上文中提到的一些 CT 掃描方法可以找到,但用于訓(xùn)練系統(tǒng)的方法并沒有系統(tǒng)地開源。目前,這一方向的努力包括:

  • Covid Chest X-Ray Dataset:https://github.com/ieee8023/covid-chestxray-dataset

  • Data Against Covid-19:https://www./


在基因組測(cè)序和藥物挖掘方面,有幾個(gè)數(shù)據(jù)集是基于之前存在的計(jì)劃或?qū)iT為 COVID-19 從零開始創(chuàng)建的。這方面值得關(guān)注的項(xiàng)目包括:

  • GISAID Initiative:https://www./epiflu-applications/next-hcov-19-app/

  • RCSB 蛋白質(zhì)數(shù)據(jù)庫:http://www./news?year=2020&article=5e3c4bcba5007a04a313edcc

  • 藥物挖掘信息共享網(wǎng)站:https://ghddi-ailab./Targeting2019-nCoV/

  • 跟蹤新冠病毒遺傳多樣性的 Nextstrain:https:///

  • 蛋白質(zhì)折疊游戲 Foldit:https:///


在文章的最后,研究者呼吁社區(qū)展開更多的跨學(xué)科合作和數(shù)據(jù)共享,通過國際社區(qū)的力量共同對(duì)抗疫情。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多