|
在偵探劇中,我們常常會看到這樣的場景:從某個視頻截圖或者圖片中,精明的偵探可以捕捉到各種細(xì)節(jié),然后快速判斷出圖片的拍攝地點?,F(xiàn)在,計算機也能做到了,而且,它比人類做的更好。 根據(jù) MIT Technology Review 的報道,Google 的計算機視覺專家 Tobias Weyand 與同事對深度學(xué)習(xí)機器進(jìn)行了訓(xùn)練,使其可以識別出任何圖片的位置。在這方面,機器的識別能力明顯超過了人類,而且,它甚至能夠?qū)κ覂?nèi)拍攝的圖片、缺乏線索的圖片(食物、寵物)進(jìn)行位置確認(rèn)。 他們的方法是這樣的。首先,根據(jù)不同區(qū)域的圖片數(shù)量,他們把全球分為 2.6 萬個不同尺寸的方格。由于大城市的圖片多,分配的方格就比較多,而偏遠(yuǎn)的地區(qū)則較少。海洋、極地等都被忽略了,因為圖片太少了。 然后,他們收集網(wǎng)絡(luò)上有地理標(biāo)記的圖片,建了個數(shù)據(jù)庫,確定每張圖片歸屬于那個方格。這個數(shù)據(jù)庫很龐大,包括 1.26 億張圖片以及位置數(shù)據(jù)。他們使用了 9100 萬張圖片,對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,然后使用剩余的 3400 萬張圖片進(jìn)行測試。最后,他們開始用不同方法測試這個圖片識別網(wǎng)絡(luò)——稱作 PlaNet——看看它的效果如何。 在測試中,他們讓 PlaNet 與 10 位經(jīng)常旅行的人進(jìn)行了一場比賽。結(jié)果,PlaNet 的表現(xiàn)超過了人類。在識別位置時,人類可以觀察植物、建筑風(fēng)格等線索,而機器只能依賴像素,那么,它是如何超過人類的呢。“我們認(rèn)為,PlaNet 的優(yōu)勢在于,它訪問的地點遠(yuǎn)遠(yuǎn)超過了人類,因此,它能夠識別一些微妙的細(xì)節(jié),即使經(jīng)常旅行的人也難以做到這一點。” Weyand 說。 圖片來自 extremetech |
|
|