|
在過去的幾十年里,體外受精(In Vitro Fertilization, IVF)技術已經(jīng)成為解決不孕癥問題的重要手段。IVF的成功率在很大程度上取決于胚胎的選擇和移植過程,而如何從多個可用胚胎中選擇出最有可能成功著床并發(fā)育的胚胎,是胚胎學家面臨的主要挑戰(zhàn)之一。傳統(tǒng)上,胚胎選擇主要依賴于形態(tài)學評估(morphological assessment),即通過顯微鏡觀察胚胎的外觀特征,如細胞數(shù)量、對稱性、碎片程度等,這種方法盡管廣泛應用,但具有一定的主觀性,并且不同胚胎學家之間可能存在評估不一致的問題。 近年來,隨著人工智能(Artificial Intelligence, AI)的迅速發(fā)展,尤其是深度學習(Deep Learning)技術的興起,IVF領域也開始探索將AI應用于胚胎選擇過程。深度學習算法能夠分析大量的胚胎圖像數(shù)據(jù),自動識別出與成功妊娠相關的特征,減少人為因素的干擾,從而提高胚胎選擇的客觀性和效率。例如,智能數(shù)據(jù)分析評分(iDAScore)就是一種基于深度學習的評分系統(tǒng),它不僅考慮了胚胎的空間(形態(tài)學)特征,還分析了胚胎在培養(yǎng)過程中的時間序列(形態(tài)動力學)信息,以預測胚胎的著床潛力。 然而,盡管深度學習在其他醫(yī)療影像分析領域已經(jīng)展示了強大的潛力,其在IVF中的實際臨床效益仍需通過嚴格的隨機對照試驗(Randomized Controlled Trial, RCT)來驗證。8月9日Nature Medicine的研究報道“Deep learning versus manual morphology-based embryo selection in IVF: a randomized, double-blind noninferiority trial”,正是在這一背景下展開,旨在評估深度學習算法是否能夠在胚胎選擇過程中達到或超過傳統(tǒng)形態(tài)學評估的效果,同時探索其在提高操作效率、減少評估時間等方面的潛在優(yōu)勢。 在該研究中,盡管深度學習算法(iDAScore)在評估效率和操作一致性方面表現(xiàn)出顯著優(yōu)勢,平均評估時間減少了近10倍,但其在提高臨床妊娠率方面未能展示出非劣效性(non-inferiority)的顯著優(yōu)勢。具體而言,深度學習組的臨床妊娠率為46.5%,而對照組的臨床妊娠率為48.2%,兩者之間的風險差異為-1.7個百分點,95%CI為-7.7至4.3個百分點,P值為0.62,這表明使用深度學習算法選擇胚胎的臨床妊娠率與傳統(tǒng)形態(tài)學評估方法相當,但未能顯著優(yōu)于后者。 此外,研究還發(fā)現(xiàn),深度學習算法雖然在效率上具有優(yōu)勢,但在不同的子群體中,其表現(xiàn)存在差異。例如,在新鮮胚胎移植(fresh embryo transfer)的情況下,深度學習算法的妊娠率略高于對照組,而在冷凍胚胎移植(frozen embryo transfer)中,深度學習算法的效果則相對較差。這提示,深度學習算法在不同臨床情境中的適用性可能存在差異,需要進一步研究以優(yōu)化其算法和應用條件。 總的來說,盡管深度學習在胚胎評估中的應用展示了提高操作效率的潛力,但其在臨床妊娠率方面尚未表現(xiàn)出足夠的優(yōu)勢,無法取代當前的標準形態(tài)學評估方法。這一結果強調(diào)了在IVF領域引入新技術時,必須進行嚴謹?shù)呐R床驗證,以確保其能夠在不降低治療效果的前提下,真正為患者帶來益處。未來的研究還需繼續(xù)探索如何優(yōu)化AI算法,使其更好地服務于臨床實踐。
近年來,人工智能(Artificial Intelligence, AI)技術在醫(yī)學領域的應用呈現(xiàn)出爆炸式增長,尤其是在醫(yī)學影像分析、診斷輔助系統(tǒng)等方面,AI展現(xiàn)了前所未有的潛力。然而,盡管AI在許多領域已經(jīng)取得了顯著進展,其在體外受精(In Vitro Fertilization, IVF)中的應用仍然面臨諸多挑戰(zhàn)。該研究探討一項針對深度學習(Deep Learning)算法在IVF胚胎選擇中的研究,并結合實際數(shù)據(jù),分析這種新技術在輔助生殖領域的前景和局限。 體外受精技術自20世紀70年代末問世以來,已經(jīng)幫助數(shù)百萬家庭實現(xiàn)了生育夢想。然而,IVF的成功率在很大程度上取決于胚胎的選擇和移植過程。胚胎選擇的核心問題在于如何從多個可用胚胎中篩選出最有可能成功著床并發(fā)育的胚胎。傳統(tǒng)上,胚胎學家主要通過顯微鏡下的形態(tài)學評估(morphological assessment)來選擇胚胎。這種方法雖然已經(jīng)得到廣泛應用,但存在一定的主觀性,且不同胚胎學家之間的評估結果可能會有所不同。 隨著時間推移,時差培養(yǎng)箱的出現(xiàn)使得胚胎評估變得更加客觀,其能夠連續(xù)拍攝胚胎在培養(yǎng)過程中的圖像,使胚胎學家能夠全面地觀察胚胎的發(fā)育過程。然而,即便如此,胚胎選擇仍然依賴于人工評估,這不僅耗時費力,而且容易受到人為因素的影響。 深度學習的引入 為了提高胚胎選擇的客觀性和效率,研究人員開始探索將深度學習(Deep Learning)技術應用于IVF中。深度學習是一種通過模擬人腦神經(jīng)網(wǎng)絡來處理和分析大量數(shù)據(jù)的AI技術。具體來說,深度學習算法可以自動分析胚胎的圖像數(shù)據(jù),識別與成功妊娠相關的特征,從而減少人為評估的主觀性。 該研究采用了一個名為智能數(shù)據(jù)分析評分(iDAScore)的深度學習算法,它結合了胚胎的空間(形態(tài)學)和時間(形態(tài)動力學)特征,以預測胚胎著床成功的概率。研究的目的是驗證iDAScore是否能夠在IVF胚胎選擇過程中達到或超過傳統(tǒng)形態(tài)學評估的效果,同時探討其在操作效率和評估一致性方面的潛在優(yōu)勢。 研究采用了隨機、雙盲、平行組的非劣效性(randomized, double-blind, parallel-group non-inferiority)試驗設計,旨在評估深度學習算法(iDAScore)與傳統(tǒng)形態(tài)學評估方法在IVF胚胎選擇中的有效性。研究在澳大利亞和歐洲的14家IVF診所進行,時間跨度從2020年1月到2022年9月,共納入了1751名符合條件的女性,其中1066名參與者最終被納入試驗,分別隨機分配到實驗組和對照組,每組533人。 納入標準包括年齡在42歲以下、在胚胎培養(yǎng)第5天至少有兩個達到早期囊胚(Blastocyst)階段的女性。研究排除了使用捐卵、計劃進行胚胎植入前遺傳學檢測(Preimplantation Genetic Testing, PGT)、使用其他實驗室干預措施(如形態(tài)選擇的精子注射(ICSI))或已經(jīng)參與過該研究的女性。
試驗中參與者的分配、干預過程以及最終納入分析的患者數(shù)量(Credit: Nature medicine) 隨機分配:共有1066名參與者被隨機分配到兩組:實驗組(iDAScore組)和對照組(形態(tài)學評估組),每組533人。 中斷干預:流程圖顯示了每組中因各種原因導致干預中斷的參與者數(shù)量。例如,在實驗組中有33人因協(xié)議違規(guī)或其他原因中斷了干預,而在對照組中有31人中斷了干預。 分析人群:在實驗組中,最終有500名參與者被納入按協(xié)議分析(per-protocol analysis),而對照組中則有502名參與者被納入分析。這意味著總共有64名參與者因各種原因被排除在最終分析之外。 參與者在胚胎培養(yǎng)的第5天接受隨機分組,隨后實驗組的胚胎通過iDAScore評分,系統(tǒng)根據(jù)評分自動選擇得分最高的胚胎進行移植。iDAScore算法基于超過115,000個胚胎的數(shù)據(jù)進行訓練,包括14,644個已知結局的移植胚胎。該算法通過分析時差培養(yǎng)箱中的胚胎圖像,評估胚胎的形態(tài)學和形態(tài)動力學特征,最終給出每個胚胎的評分。對照組則按照標準的形態(tài)學評估方法,由經(jīng)驗豐富的胚胎學家通過顯微鏡觀察胚胎的外觀特征并選擇最佳胚胎進行移植。 在評估時間方面,研究還設計了一個子研究,比較兩種評估方法在不同實驗室中對同一批胚胎的評估所需時間。計時從打開患者文件到選擇胚胎的整個過程,分別統(tǒng)計實驗組和對照組的時間差異。 主要結果 該研究的主要結果是兩組的臨床妊娠率(clinical pregnancy rate)。實驗組的臨床妊娠率為46.5%(533名患者中的248例成功妊娠),而對照組的臨床妊娠率為48.2%(533名患者中的257例成功妊娠)。兩組之間的風險差異為-1.7個百分點,95%CI為-7.7至4.3個百分點,P值為0.62。這表明,盡管iDAScore算法能夠自動選擇胚胎并顯著減少評估時間,但在臨床妊娠率上未能達到非劣效性標準(設定的非劣效性邊界為5%)。
非劣效性分析和各中心風險比(Credit: Nature medicine) 非劣效性分析:圖a顯示了深度學習算法(iDAScore)與傳統(tǒng)形態(tài)學評估方法在臨床妊娠率上的風險差異及其95%CI。這部分圖表包括意向治療分析(intention-to-treat analysis, ITT)和按協(xié)議分析(per-protocol analysis, PP)的結果。在圖中,紅色圓點表示風險差異的平均值,藍色誤差線表示95%CI。風險差異為負值表明深度學習算法的臨床妊娠率低于傳統(tǒng)方法。圖中還標出了非劣效性的預設邊界(-5%),若95%CI的下限超過這一邊界,則表示研究未能證明非劣效性。 各中心的風險比:圖b展示了參與試驗的各個中心的風險比(Risk Ratio, RR),即各中心深度學習算法與傳統(tǒng)評估方法在臨床妊娠率上的相對表現(xiàn)。紅色圓點表示每個中心的風險比,藍色誤差線表示95%CI。風險比大于1表示深度學習算法在該中心的效果優(yōu)于傳統(tǒng)評估方法,小于1則相反。圖中顯示了不同中心之間的廣泛變化,部分中心的結果顯示深度學習算法表現(xiàn)較好,而其他中心則未能顯示出明顯優(yōu)勢或表現(xiàn)較差。 次要結果 研究還分析了次要結果,包括hCG陽性率、人絨毛膜促性腺激素(hCG)的陽性率、持續(xù)妊娠率(ongoing pregnancy rate)和活產(chǎn)率(live birth rate)。這些次要結果在實驗組和對照組之間也沒有顯著差異。例如,實驗組的活產(chǎn)率為39.8%(533名患者中的212例活產(chǎn)),對照組為43.5%(533名患者中的232例活產(chǎn)),兩者的風險差異為-3.9%,95%CI為-9.9至2.2%,P值為0.24。 時間效率 在胚胎評估時間方面,實驗組表現(xiàn)出了明顯的效率優(yōu)勢。使用iDAScore算法進行胚胎評估的平均時間為21.3秒,而對照組采用傳統(tǒng)形態(tài)學評估方法的平均時間為208.3秒。兩者之間的時間差異顯著(P<0.001),無論胚胎的數(shù)量多少,這一結果在不同的實驗室均表現(xiàn)出一致性。
iDAScore組和對照組在第5天評估的時間使用情況(Credit: Nature medicine) 總體評估時間:實驗組(iDAScore組)和對照組(傳統(tǒng)形態(tài)學評估組)在第5天進行胚胎評估時所需的平均時間。整體來看,iDAScore組的評估時間明顯短于對照組。iDAScore組的平均評估時間為21.3秒(±18.1秒),對照組的平均評估時間為208.3秒(±144.7秒)。 不同胚胎數(shù)量下的評估時間:進一步細分了評估時間,根據(jù)參與者在第5天所擁有的胚胎數(shù)量進行分類,顯示了在不同胚胎數(shù)量的情況下兩組的評估時間差異:擁有2-5個胚胎的情況下,iDAScore組的平均評估時間仍遠低于對照組。擁有6-9個胚胎時,iDAScore組的評估時間同樣顯著短于對照組。當擁有10個或更多胚胎時,iDAScore組的評估時間也顯著少于對照組。 子群體分析 在子群體分析中,研究發(fā)現(xiàn),深度學習算法在新鮮胚胎移植(fresh embryo transfer)的情況下表現(xiàn)較好,實驗組的臨床妊娠率為48.1%,而對照組為44.5%;但在冷凍胚胎移植(frozen embryo transfer)的情況下,實驗組的妊娠率為49.5%,而對照組則高達61.3%。這表明iDAScore算法在不同的臨床情境中表現(xiàn)可能存在差異,尤其在冷凍胚胎移植中表現(xiàn)相對較差。 敏感性分析和安全性 研究還進行了預先指定的敏感性分析,考慮了包括女性年齡、以往刺激周期數(shù)、卵子數(shù)量和受精方式等因素。敏感性分析的結果并未顯著改變主要分析的結論。此外,在安全性方面,研究沒有記錄到任何與醫(yī)療設備相關的嚴重不良事件,這表明iDAScore算法在實際應用中是安全的。 雖然該研究的結果表明,深度學習在提高臨床妊娠率方面未能取得預期的突破,但這并不意味著AI在IVF中的應用前景黯淡。相反,隨著AI技術的不斷進步和算法的不斷優(yōu)化,未來AI在IVF中的應用可能會更加廣泛和深入。 首先,AI可以通過結合更多的臨床數(shù)據(jù),如患者的年齡、激素水平、胚胎的基因信息等,進一步提升胚胎選擇的精準性。未來的研究可以嘗試將這些多維度的數(shù)據(jù)整合到AI模型中,以更全面地預測胚胎的發(fā)育潛力。 其次,AI技術在提高IVF實驗室的工作效率方面仍有巨大潛力。除了胚胎選擇,AI還可以應用于胚胎培養(yǎng)、數(shù)據(jù)管理、實驗室操作優(yōu)化等多個環(huán)節(jié)。例如,AI可以幫助實驗室自動記錄胚胎發(fā)育的全過程,并生成詳盡的報告,供醫(yī)生參考。這不僅可以減輕實驗室人員的工作負擔,還可以提高實驗室操作的規(guī)范性和標準化。 此外,隨著AI技術的不斷發(fā)展,未來AI可能會在IVF之外的其他輔助生殖技術中發(fā)揮更大的作用。例如,在卵子和精子的選擇、基因篩查、甚至人工子宮的開發(fā)等方面,AI都可能帶來革命性的改變。 綜上,該研究驗證了深度學習算法在IVF胚胎選擇中的應用效果。雖然研究結果顯示,深度學習在提高臨床妊娠率方面未能顯著優(yōu)于傳統(tǒng)形態(tài)學評估方法,但其在操作效率和評估一致性方面展現(xiàn)了巨大潛力。隨著AI技術的不斷進步,我們有理由相信,未來AI將在IVF及其他輔助生殖技術中發(fā)揮越來越重要的作用,為無數(shù)家庭帶來希望。 未來的研究還需繼續(xù)探索如何優(yōu)化AI算法,使其更好地服務于臨床實踐,同時注重與傳統(tǒng)方法的結合,以確保患者能夠獲得最佳的治療效果。這不僅是技術進步的需求,也是對廣大患者的福祉負責的體現(xiàn)。我們期待在不久的將來,AI能夠幫助更多的家庭實現(xiàn)生育夢想,推動輔助生殖技術邁向新的高峰 |
|
|
來自: 子孫滿堂康復師 > 《不孕不育醫(yī)院》