小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

世界上只有75個人能流利閱讀的文字,AI竟然學(xué)會了!“世界第一文明”有望從沉睡中喚醒

 太陽霞光 2023-01-16 發(fā)布于陜西

楔形文字是人類最古老的文字之一,揭開它的神秘面紗,一直是研究人員孜孜以求的目標(biāo)。如今,人工智能正在幫助破譯美索不達(dá)米亞人刻寫在陶泥板上的楔形文字,這些古老的泥板文書將為我們揭開人類歷史早期一些不可思議的故事。

文章圖片1

保存在大英博物館中的楔形文字泥碑。(圖/New Scientist)

英國倫敦大英博物館,一扇緊閉的大門后面,是一座美輪美奐的收藏閣,高高的拱形天花板彰顯著它的高大華美。在這個遠(yuǎn)離塵世喧囂的幽靜房間里,歐文·芬克爾打開一個抽屜,取出一塊陶泥制成的泥碑,上面已有了裂紋,還留有灼燒過的痕跡。它不是一塊平常的泥碑——上面以世界上最古老的書寫文字楔形文字記載了古人對未來的預(yù)言。

芬克爾是大英博物館古代美索不達(dá)米亞語言文化文獻(xiàn)的助理保管員,也是世界上僅有幾位能夠流利閱讀這種久已失傳的文字的人之一。他打開另一個抽屜,取出另一塊泥碑,上面刻寫的是巴比倫人對馬爾杜克神的祈禱文。巴比倫是美索不達(dá)米亞地區(qū)的一座古城,后成為巴比倫帝國的中心,馬爾杜克是古代巴比倫人信奉的主神,巴比倫的守護(hù)神。

芬克爾的身后,一位攝影師正對著泥碑上凹陷的蝕刻文字精心拍攝。他們的工作正在揭開一場破譯古代文字偉大變革的序幕。這場革命將利用當(dāng)今人工智能強(qiáng)大無匹的計(jì)算能力,喚醒沉睡5000年的古代人類歷史,揭開世界第一文明埋藏已久的秘密。

盡管早在165年前,就已有人破譯了這種古代文字的符號,但大多數(shù)楔形文字符號文獻(xiàn)資料從未被翻譯成現(xiàn)代語言。因?yàn)檫@是一項(xiàng)非常復(fù)雜的工作,僅依靠芬克爾等少數(shù)精通楔形文字的專家來完成,顯然是一項(xiàng)難以完成的龐大工程。

如今,隨著人工智能的發(fā)展,計(jì)算機(jī)算法正在接受閱讀和翻譯楔形文字的訓(xùn)練,將大量泥碑留下的支離破碎的內(nèi)容重新組合,并預(yù)測其中缺失的部分,為了解古代美索不達(dá)米亞人的歷史提供一幅完整的圖景,同時也為追溯圣經(jīng)故事的起源、探索人類早期文明的歷史打開一扇新的窗口。

楔形文字的起源與演變

楔形文字的故事可追溯到6000年前的美索不達(dá)米亞地區(qū),那里是位于底格里斯河和幼發(fā)拉底河之間的一片肥沃地區(qū),位于如今的伊拉克境內(nèi)。這一時期的人類社會正在經(jīng)歷重大變革,從小規(guī)模的農(nóng)業(yè)聚居地逐漸發(fā)展成龐大的城市中心。蘇美爾人在這里建立了最早一批城邦,烏魯克城是其中最具代表性意義的重要城邦之一,城中寺廟林立,溝系縱橫,到公元前3000年時,城中人口已達(dá)5萬。城市成為周邊地區(qū)的行政管理中樞,管理復(fù)雜勞務(wù)系統(tǒng)的官僚體制也開始形成。

蘇美爾語完全不同于如今我們所知曉的任何語言,并且早已消逝在歷史的長河中。但蘇美爾人留下的大量楔形文字泥板文書,讓我們能有機(jī)會對當(dāng)時美蘇爾人的社會生活一探究竟。美索不達(dá)米亞地區(qū)是楔形文字的發(fā)源地,當(dāng)時的人們將蘆葦?shù)哪┒藟喝肷形醋冇驳臐褴浱漳喟迳?,寫下一個個被稱為楔形文字的古老符號。

雖然人們通常將楔形文字形成的文化遺產(chǎn)與詩歌和文學(xué)聯(lián)想在一起,但最早的楔形文字的使用完全是出于行政管理的需要,比如作為奴隸轉(zhuǎn)讓交割手續(xù)的憑證,或接收牲畜的簽收收條等。最典型的一個例子是保存在大英博物館內(nèi)的一塊刻寫了啤酒配額記錄的泥板文書,畫一個瓶子代表一瓶啤酒,在人頭上畫圈代表數(shù)量,這是最初的象形符號文字,后來逐漸演變發(fā)展為更為抽象的文字形式。

楔形文字從簡單的記事工具演變?yōu)橐环N語言表達(dá)形式,經(jīng)歷了相當(dāng)漫長的時期。最早的王室銘文出現(xiàn)于公元前2700年左右,最早的文學(xué)文本出現(xiàn)于更晚的一百多年后。最早的文學(xué)作品作者是生活在4300年前的一位公主、女祭司和詩人恩赫杜安娜。她寫下了許多贊美詩和神話故事,其中最有名的是吉爾伽美什史詩,關(guān)于一位國王追求永生的故事。

美索不達(dá)米亞古代文明的影響一直延伸并滲透到現(xiàn)代人類的生活中,圣經(jīng)中的一些故事與蘇美爾人的文化傳統(tǒng)甚有淵源,蘇美爾人還是如今仍用于鐘表中的六十進(jìn)制計(jì)數(shù)系統(tǒng)的發(fā)明者。

破譯楔形文字困難重重

楔形文字本身并不是一種語言,而是一種書寫符號系統(tǒng),好比英語中用的字母,同樣也用于法文和德文中一樣。蘇美爾人從世界上消失之后,他們的楔形文字書寫方式流傳了下來,成為許多其他語言的書寫符號,如阿卡德語、赫梯語、古埃爾西亞語等。在使用了3000年之后,這些書寫符號與語言,以及描述了歷代王國興衰的記錄,一起消失在了歷史的長河中。

我們?nèi)缃衲軌蛄私膺@段遙遠(yuǎn)的歷史,要?dú)w功于用來書寫楔形文字的陶泥板。這是當(dāng)時的一種廉價材料,隨處可見,并且可以耐久保存?!胺浅P疫\(yùn)的是,除非被扔進(jìn)河里,或被完全碾碎,這種上面寫有文字的泥碑都能得以保存下來?!狈铱藸栒f。

世界各地發(fā)現(xiàn)的泥碑?dāng)?shù)量已有成千上萬,是我們探索早期人類文明的珍貴文化遺產(chǎn),其中包括地球上最早帝國的編年史,蘇美爾人創(chuàng)作的贊美詩、來往信件、購物清單,甚至還有客戶的投訴信?!坝腥苏f,人類歷史的前半部都記錄在了這些楔形文字泥碑上?!钡聡侥岷诖髮W(xué)的恩里克·杰梅內(nèi)茲說道。

這些泥碑中隱藏著的遠(yuǎn)古時代的秘密不斷被破譯。2017年,學(xué)者發(fā)現(xiàn),一塊被稱為“普林頓322”的3700年前的泥板文書是世界上最早出現(xiàn)的三角學(xué)知識。它因曾被一名叫普林頓的人收藏而得名,“322”是普林頓的收藏編號,但其最初來源不詳。碑文顯示,生活在美索不達(dá)米亞中部和南部講阿卡德語的巴比倫人,是最早研究三角學(xué)的人。

2021年,對1894年在伊拉克出土的一塊泥碑的新的分析研究發(fā)現(xiàn),早在畢達(dá)哥拉斯(古希臘哲學(xué)家、數(shù)學(xué)家)出生幾個世紀(jì)之前,巴比倫人就已開始對三角學(xué)進(jìn)行計(jì)算和研究。遺憾的是,如今世界上只有75個人能夠流利閱讀楔形文字,大多數(shù)泥板文書只能束之高閣,在博物館里靜靜蒙塵,鮮為人知。

文章圖片3

楔形文字太復(fù)雜,太難讀懂,長期以來一直困擾著人們?!氨闹形淖值暮x往往模棱兩可,而一個詞語可能會有不止一種書寫方式?!苯苊穬?nèi)茲說。還有一個難題是,很多楔形文字泥碑并不完整,不是破裂缺角,就是碎成多個小塊,通常邊緣部分還有磨損,導(dǎo)致一段記事不是沒有開頭,就是沒有結(jié)尾,或是中間部分缺失。

亞述帝國國王阿什巴尼帕爾的藏書室是世界上現(xiàn)存最古老的皇家圖書館,收藏了來自美索不達(dá)米亞各地的大量書寫文獻(xiàn),3萬塊泥碑記載了各種文獻(xiàn)資料,包括宗教儀式、醫(yī)學(xué)百科全書、天文觀測,以及王室開拓疆域的功績等。

可惜的是,公元前612年,在城市被攻陷洗劫中,這座古老的皇家圖書館被焚為廢墟。大英博物館保存的大火中幸存下來的一些殘碑上面,焦黑的灼燒痕跡仍然歷歷在目。

要想還原歷史,就要將這些碎片像做拼圖游戲一樣拼合起來,沒有任何參考依據(jù),難度很大。而且記載有楔形文字的泥碑分散在世界各處,收集起來也很困難。例如,吉爾伽美什史詩的開頭部分保存在一塊很小的陶泥碑文書殘片上,光是找到并確認(rèn)這塊泥碑,就花了一百多年時間。如今,有了人工智能來幫助做這項(xiàng)工作,一切都將有所不同。

AI訓(xùn)練“復(fù)原”巴比倫文學(xué)

“殘片數(shù)據(jù)庫”是杰梅內(nèi)茲于2018年設(shè)立的“電子巴比倫文學(xué)項(xiàng)目”的一部分。該項(xiàng)目利用人工智能找出哪些殘片同屬于某一塊泥碑,然后將它們重新組合起來,以還原阿什巴尼帕爾的皇家圖書館殘存的泥版文書和其他泥碑的內(nèi)容。杰梅內(nèi)茲正在用開發(fā)出來的算法對楔形文字的不同變體,以及多種副本之間的微小差別進(jìn)行比較研究。

經(jīng)過訓(xùn)練的人工智能可以對碑文進(jìn)行翻譯。研究人員根據(jù)文本符號的音譯,對人工智能進(jìn)行深度學(xué)習(xí)訓(xùn)練。楔形文字符號的發(fā)音依據(jù)的是拉丁字母的發(fā)音方式,就像漢字的普通話發(fā)音用的是拼音一樣。經(jīng)過學(xué)習(xí)訓(xùn)練的人工智能可以預(yù)測哪些楔形符號可能出現(xiàn)在缺失的殘片中,還可以在數(shù)字化的龐大殘片數(shù)據(jù)庫中搜索特定的楔形文字符號。

2019年,人工智能幫助在多個殘片中找到了吉爾伽美什史詩中的缺失部分,還發(fā)現(xiàn)了一種新的古代文學(xué)體裁,其特點(diǎn)是滑稽、夸張和模仿,比如一堆會開玩笑的驢糞,主要是用來幫助小學(xué)生學(xué)習(xí)讀寫技能的。

杰梅內(nèi)茲與伊拉克巴格達(dá)大學(xué)伊爾克分校的安瑪·法迪爾一起,通過人工智能的幫助,發(fā)現(xiàn)了另一種以前不為人知的文學(xué)體裁——城市贊美詩。比如,巴比倫城贊美詩對寺廟僧侶的日常進(jìn)行了細(xì)致的描繪。

2021年,在世界上首次使用人工智能完全自主識別楔形文字片段的過程中,研究人員發(fā)現(xiàn)了名詩《正義的受難者》中缺失的片段。

其他一些研究人員關(guān)注的重點(diǎn)是反映普通行政工作的楔形文字文本。研究發(fā)現(xiàn),大量內(nèi)容短小的收據(jù)文本出自不同的機(jī)構(gòu),如寺廟或當(dāng)?shù)亟y(tǒng)治者的官邸,或是個人(如商人)之間進(jìn)行交易的書面文本。這些豐富的信息是美索不達(dá)米亞古老文明的重要組成部分之一。

蘇美爾泥碑文本中通常包含個人姓名和日期,根據(jù)這些線索,可以追溯了解某人在當(dāng)時社會中承擔(dān)的角色。例如,形成于公元前2300年左右,被稱為“Mama-ummi檔案”的80塊泥碑文本描述了一位名叫Mama ummi的女主管,她負(fù)責(zé)一個由180名織工組成的團(tuán)隊(duì)。這份資料表明,當(dāng)時的女性有很多的工作機(jī)會,這一點(diǎn)非常出人意料。

面對浩如煙海的楔形文字行政信息,加拿大多倫多大學(xué)的希瑟·貝克于2017年建立了完美的楔形文字機(jī)器翻譯和自動分析系統(tǒng)。在不久前的測試中,他們先用45500個音譯短語對不同的人工智能算法進(jìn)行訓(xùn)練,每個短語由多達(dá)19個單詞組成,然后對人工智能將蘇美爾語單詞翻譯成英語的能力進(jìn)行了測試。2021年公布的結(jié)果表明,某種特定人工智能算法的翻譯準(zhǔn)確性可達(dá)95%。該系統(tǒng)還能從文本中提取關(guān)鍵詞信息,對人員、地點(diǎn)和神祗等類別進(jìn)行識別。

2021年,以色列耶路撒冷希伯來大學(xué)計(jì)算機(jī)科學(xué)家加布里埃爾·斯坦諾夫斯基和他的同事還找到了一種預(yù)測殘片缺失文字的方法,類似于在手機(jī)上輸入文字時的自動預(yù)測。

研究人員嘗試給深度學(xué)習(xí)人工智能饋入上萬塊阿卡德語書寫的楔形文字泥碑的音譯單詞信息,發(fā)現(xiàn)人工智能根據(jù)上下文填補(bǔ)缺失部分內(nèi)容的準(zhǔn)確率能達(dá)到80%。

人工智能的另一項(xiàng)潛在應(yīng)用是確定泥版文書的年代,即以已知年代為線索,訓(xùn)練人工智能算法預(yù)測其他文件中缺失年代信息的能力。

但是,從符號音譯來解讀楔形文字是一回事,要解讀楔形文字本身又是另一回事。楔形文字不僅隨著時間的推移在演變,其拼寫也在變化,不同時期的楔形文字還被用于不同的語言。最棘手的是,符號之間沒有間隙,要推斷出哪組楔形符號構(gòu)成某個單詞非常困難。拉丁字母包含26個字母,但楔形書寫符號多達(dá)900多個,而且它們看起來非常相似。

為克服這重重困難,研究人員正在開發(fā)類似于文本識別的人工智能計(jì)算機(jī)系統(tǒng),向破譯楔形文字的目標(biāo)邁進(jìn)。研究人員訓(xùn)練了一種叫做“Deepscribe”的機(jī)器學(xué)習(xí)系統(tǒng),用來解讀波斯波利斯衛(wèi)城檔案的數(shù)千塊楔形文字文本,這是在大約公元前500年前修筑的一道防御工事墻中發(fā)現(xiàn)的埃蘭語行政管理文書。研究團(tuán)隊(duì)成員、美國芝加哥大學(xué)的蘇珊娜·保盧斯指出,“計(jì)算機(jī)能夠識別單詞的起始符號和終結(jié)符號的邊界,然后用方框圍住,這是一項(xiàng)巨大的成就。對于那些沒有分隔的一連串符號,人們通常沒有辦法知道一個單詞的起始位置和終結(jié)位置。”

未來有望實(shí)現(xiàn)AI即時翻譯

在人工智能的幫助下,未來將有望實(shí)現(xiàn)將符號識別系統(tǒng)和現(xiàn)代語言翻譯系統(tǒng)一體化的目標(biāo)。這將意味著也許有一天,我們就可以用手機(jī)拍下博物館里一塊泥碑文書的照片,并即時讀出上面的內(nèi)容。

要實(shí)現(xiàn)這一宏大目標(biāo),需要一個龐大的數(shù)字化文本數(shù)據(jù)庫來支持人工智能算法的訓(xùn)練和學(xué)習(xí)。目前世界各大博物館中約50萬件楔形文字文本中,只有一半經(jīng)過了音譯翻譯或文本翻譯,經(jīng)數(shù)字化處理的文本只有大約10萬件。“楔形文字?jǐn)?shù)字圖書館計(jì)劃”和“電子巴比倫文學(xué)項(xiàng)目”的進(jìn)展正在改變目前這一現(xiàn)狀。

以色列阿里爾大學(xué)的薩伊·戈?duì)柖”硎荆骸靶ㄐ挝淖治谋緮?shù)字化可為學(xué)者帶來大量新信息和新聯(lián)系。一旦能夠?qū)⑦@些信息放在一個龐大的聯(lián)通網(wǎng)絡(luò)中,下一個重大突破的契機(jī)就會到來。我們就可以對那個時代古人的生活有一個全面的了解?!?/p>文章圖片4

人工智能對楔形文字泥碑進(jìn)行掃描翻譯示意圖。(圖/New Scientist)

開始階段需要大量辛苦的工作,首先要獲得各地博物館和私人藏品中所有楔形文字泥碑文書的高清圖像。目前,作為“電子巴比倫文學(xué)項(xiàng)目”的組成部分之一,大英博物館收藏的阿什巴尼帕爾圖書館4萬件楔形文字泥碑殘片的拍攝工作正在進(jìn)行之中。

在一間特殊的拍攝工作室內(nèi),攝影師阿爾伯托·吉亞尼斯給每件楔形文字泥碑拍攝六張圖像——正面、背面、頂部、底部和兩個側(cè)面。吉亞尼斯說,文本并不總在邊緣處結(jié)束,有時甚至區(qū)分前后和上下都很難。

然后,計(jì)算機(jī)軟件會將這六張圖像的內(nèi)容拼接組合起來,再由杰梅內(nèi)茲這樣的楔形文字專家進(jìn)行辨認(rèn)和翻譯。據(jù)預(yù)計(jì),2023年將完成所有楔形文字藏品的拍攝工作,并向大眾公開。以往深藏于大英博物館內(nèi)的楔形文字藏品不是普通大眾都有機(jī)會觀賞到的,但經(jīng)過數(shù)字化處理的藏品,可以讓人們舒服地坐在自己家中,欣賞蘇美爾阿什巴尼帕爾圖書館的泥碑文獻(xiàn)和其他早已失傳的楔形文字文本。

回望歷史,數(shù)千年前的人類給我們留下了卷帙浩繁的楔形文字文書,以及承載其中的文化思想;展望未來,這些獨(dú)具遠(yuǎn)古文化特色的泥碑文本,在人工智能的強(qiáng)大計(jì)算能力下,重新組合和解碼,以現(xiàn)代科技的數(shù)字化形式,重現(xiàn)古代人類文明曾經(jīng)的輝煌。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多