小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

【科研自動(dòng)化???】假論文能否杜絕?答案在四百年前就有了

 造就Talk 2020-07-21

一個(gè)為追求真理而研讀科學(xué)著述的人,他的義務(wù)就是與自己讀到的所有東西為敵……并從各個(gè)方面加以質(zhì)疑。他還應(yīng)該在批判審查這些東西時(shí),對(duì)自己持懷疑態(tài)度,這樣,他才有可能避免落入偏見或?qū)捜莸南葳濉?/span>

——伊本·艾爾-海什木(Ibn al-Haytham,公元965-1040年)

你知道嗎?科學(xué)正陷于一場(chǎng)數(shù)據(jù)危機(jī)之中。

去年,單是生物醫(yī)學(xué)領(lǐng)域發(fā)表的新論文就超過了120萬篇,這使得同行評(píng)審的生物醫(yī)學(xué)論文總數(shù)突破了2,600萬篇。然而,科學(xué)家每年平均只能閱讀大約250篇論文。與此同時(shí),科學(xué)文獻(xiàn)的質(zhì)量一直在下降。一些最新的研究發(fā)現(xiàn),絕大多數(shù)生物醫(yī)學(xué)論文都是不可重復(fù)的,也就是說第三方無法加以驗(yàn)證。

論文數(shù)量太多而質(zhì)量太差,這種雙重挑戰(zhàn)的根源在于,人腦的神經(jīng)能力是有限的。隨著人類積累的知識(shí)不斷增多,科學(xué)家借以推導(dǎo)假說的知識(shí)在總體知識(shí)中所占的比例越來越小。

其結(jié)果是,他們提出錯(cuò)誤問題的頻率越來越高,或者,他們?cè)絹碓蕉嗟匕l(fā)現(xiàn),自己提出的問題已經(jīng)被解答過了。而且,人類的創(chuàng)造力似乎越來越依賴于過往經(jīng)歷的隨機(jī)性——也就是特殊的生活事件讓研究人員注意到了被其他人忽視的東西。雖然運(yùn)氣一直是科學(xué)發(fā)現(xiàn)中的一個(gè)因素,但它目前起到的作用已經(jīng)遠(yuǎn)遠(yuǎn)超出了應(yīng)有的水平。

要解決當(dāng)前的危機(jī),一種很有前景的策略是,把機(jī)器和人工智能整合到科研過程中。與人腦相比,機(jī)器的記憶力和計(jì)算力更強(qiáng)。

如果科研過程能夠?qū)崿F(xiàn)自動(dòng)化,我們獲得科學(xué)發(fā)現(xiàn)的速度也許會(huì)大為提高。它甚至可能開啟另一場(chǎng)科學(xué)革命。而這個(gè)意義重大的可能性能否實(shí)現(xiàn),則要取決于一個(gè)同樣重要的問題:科學(xué)發(fā)現(xiàn)真的能實(shí)現(xiàn)自動(dòng)化嗎?

我認(rèn)為是可以的,只需一種我們已經(jīng)熟知了數(shù)百年的方法。這個(gè)問題的答案可以在弗朗西斯·培根的著作中找到,這位17世紀(jì)的英國哲學(xué)家,同時(shí)也是現(xiàn)代科學(xué)的重要始祖。

人類首次對(duì)科學(xué)方法做出論述,可以追溯到好幾百年前的穆斯林思想家,比如伊本·艾爾-海什木,他同時(shí)強(qiáng)調(diào)了經(jīng)驗(yàn)論和實(shí)驗(yàn)法的重要性。不過,培根才是第一位正式確立科學(xué)方法,并使其成為一個(gè)研究課題的人。

在1620年出版的著作《新工具》中,培根提出了一種用于科學(xué)發(fā)現(xiàn)的模型,它的另一個(gè)名字你或許更加熟悉:培根歸納法。培根反對(duì)把三段論邏輯(傳送門 | 亞里士多德是如何發(fā)明計(jì)算機(jī)的)用于科學(xué)的演繹推理,他認(rèn)為這種邏輯是不可靠的。

他提出了另一種方法,主張系統(tǒng)地收集某種特定現(xiàn)象的相關(guān)觀察結(jié)果,列成表格,并利用歸納邏輯進(jìn)行客觀分析,以此得出可推而廣之的概念。在他看來,只有脫離了不完整的(因此是錯(cuò)誤的)公理的束縛,才有可能發(fā)現(xiàn)真理。

培根歸納法試圖消除觀察和概念化過程中的邏輯偏差,辦法就是通過劃定演繹推理的每一個(gè)步驟,并對(duì)每一步分別進(jìn)行優(yōu)化。培根的想法是,利用觀察者組成的社群收集關(guān)于自然的巨量信息,然后整理成可用歸納邏輯進(jìn)行分析的集中式記錄。

他在《新工具》中寫道:“經(jīng)驗(yàn)主義者就像螞蟻,它們只會(huì)積累和使用;理性主義者如同蜘蛛,它們只憑自己的材料織網(wǎng)。蜜蜂的方法是最好的,它們走的是一條中間道路,采集現(xiàn)有的材料并加以利用。”

培根歸納法如今已經(jīng)很少被用到。事實(shí)證明,這種方法太費(fèi)力,而且成本過高;其技術(shù)應(yīng)用不甚明朗。不過當(dāng)時(shí),一種科學(xué)方法的正式確立已然標(biāo)志著革命性的進(jìn)步。在那之前,科學(xué)是形而上學(xué)的,是屬于少數(shù)學(xué)者的特權(quán),他們大多出身貴族。

而通過挑戰(zhàn)古希臘先哲的權(quán)威并劃定科學(xué)發(fā)現(xiàn)的步驟,培根創(chuàng)造了一幅藍(lán)圖,憑借這幅藍(lán)圖,任何人都有機(jī)會(huì)成為科學(xué)家,無論其出身背景如何。

培根還揭示了一個(gè)被隱藏的重要事實(shí):科學(xué)發(fā)現(xiàn)的過程本質(zhì)上是算法式的。它是有限數(shù)量的步驟經(jīng)過重復(fù),直至得出有意義結(jié)果的過程。培根在描述自己的方法時(shí),明確使用了“機(jī)器”一詞。

他的科學(xué)算法包括三個(gè)主要步驟:

第一步,收集關(guān)于現(xiàn)象的觀察結(jié)果,并整合成一個(gè)知識(shí)總庫;

第二步,利用新的觀察結(jié)果,提出新的假設(shè);

第三步,通過精心設(shè)計(jì)的實(shí)驗(yàn)來驗(yàn)證假設(shè)。

而如果科學(xué)是算法式的,那它必定具有實(shí)現(xiàn)自動(dòng)化的可能性。過去數(shù)十年中,信息和計(jì)算機(jī)科學(xué)家一直不曾涉足這個(gè)充滿未來主義的夢(mèng)幻,這主要是因?yàn)?,科學(xué)發(fā)現(xiàn)的三個(gè)主要步驟位于不同的層面。

觀察是感知性的,提出假設(shè)是思想性的,實(shí)驗(yàn)則是機(jī)械性的。科研過程的自動(dòng)化需要將機(jī)器有效地整合到每一步中,并保證這三步之間的銜接順暢無礙。而至今,還沒有人知道如何做到這一點(diǎn)。

我們近來的大多數(shù)重要進(jìn)展都是在實(shí)驗(yàn)層面取得的。例如,制藥業(yè)使用自動(dòng)化的高通量篩選平臺(tái)進(jìn)行藥物設(shè)計(jì),這一做法已成為常態(tài)。一些初創(chuàng)公司,比如美國加州的Transcriptic和Emerald Cloud Lab正在開發(fā)系統(tǒng),旨在讓生物醫(yī)學(xué)研究人員的幾乎所有體力任務(wù)都實(shí)現(xiàn)自動(dòng)化??茖W(xué)家現(xiàn)在可以在線提交實(shí)驗(yàn)方案,將其轉(zhuǎn)換成代碼,并饋入機(jī)器人平臺(tái),在那里進(jìn)行一系列生物實(shí)驗(yàn)。

這些解決方案對(duì)那些需要大量實(shí)驗(yàn)的學(xué)科最有幫助,比如分子生物學(xué)和化學(xué)工程學(xué)。不過,類似的方法也可以應(yīng)用到其他數(shù)據(jù)密集型領(lǐng)域,甚至擴(kuò)展至理論學(xué)科。

芝加哥大學(xué)教授唐·斯旺森(Don Swanson)

相比之下,假設(shè)提出層面的自動(dòng)化水平就沒有那么先進(jìn)了。不過,唐·斯旺森(Don Swanson)上世紀(jì)80年代的一項(xiàng)研究幫助我們向前邁出了重要一步。他證明了,在科學(xué)文獻(xiàn)中,不相關(guān)的想法之間存在著隱藏的聯(lián)系;利用一種簡(jiǎn)單的演繹邏輯框架,他可以把來自不同領(lǐng)域、引用上毫無重疊的論文聯(lián)系在一起。

通過這種方式,斯旺森得以對(duì)食用魚油與雷諾氏病之間的聯(lián)系提出新的假設(shè),而不用開展任何實(shí)驗(yàn),也無需熟知任一領(lǐng)域。近年來出現(xiàn)的其他方法則依賴于數(shù)學(xué)建模和圖形理論。

研究人員把大型數(shù)據(jù)集整合在一起,知識(shí)在其中被投射成網(wǎng)絡(luò),網(wǎng)絡(luò)的節(jié)點(diǎn)就是概念,而網(wǎng)絡(luò)的連線則代表了概念之間的聯(lián)系。通過發(fā)掘節(jié)點(diǎn)之間未被發(fā)現(xiàn)的連線,我們就能得到新的假設(shè)。

在科研過程自動(dòng)化的問題上,最具挑戰(zhàn)性的一步是,如何大規(guī)模收集可靠的科學(xué)觀察結(jié)果。在觀察層面上,目前還沒有一個(gè)集中式的數(shù)據(jù)庫將人類所有的科學(xué)知識(shí)囊括在內(nèi)。自然語言處理已經(jīng)發(fā)展到不僅可以自動(dòng)從科學(xué)論文中提取聯(lián)系,而且還能理解上下文關(guān)系。

然而,主要的學(xué)術(shù)出版商都對(duì)這樣的文本挖掘做出了嚴(yán)格限制。更重要的是,論文的文本可能因?yàn)榭茖W(xué)家的解讀(或誤讀)而發(fā)生偏差,并且可能包含難以提取和量化的復(fù)雜概念和方法論。

盡管如此,計(jì)算技術(shù)和網(wǎng)絡(luò)數(shù)據(jù)庫的最新進(jìn)展使得培根歸納法有史以來第一次變得切實(shí)可行。即便在科學(xué)發(fā)現(xiàn)能夠?qū)崿F(xiàn)自動(dòng)化之前,在當(dāng)下,純粹還原論接近其效用邊際之時(shí),推行培根歸納法也是有價(jià)值的。

在大數(shù)據(jù)時(shí)代,人腦已無法足夠有效地重構(gòu)高度復(fù)雜的自然現(xiàn)象。一種現(xiàn)代化的培根歸納法可以改變我們對(duì)世界的理解。它通過數(shù)據(jù)挖掘來整合還原論思想,然后通過歸納式計(jì)算模型對(duì)這些信息進(jìn)行分析。

憑借此種方法,我們可以提出更有可能得到證實(shí)的新假設(shè),同時(shí)也使驗(yàn)證過程更加便捷,從而填補(bǔ)人類知識(shí)的空白。此外,它還起到了一種警示作用,這正是當(dāng)今科學(xué)界迫切需要的,它提醒著我們勿忘科學(xué)的真諦:追尋真理,挑戰(zhàn)權(quán)威,崇尚自由。

本文作者是哈佛醫(yī)學(xué)院分子癌癥生物學(xué)家Ahmed Alkhateeb。他的研究工作聚焦于開發(fā)分析平臺(tái),以提升生物醫(yī)學(xué)的研究效率。

翻譯:何無魚

來源:aeon

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多