|
機(jī)器視覺一直是人工智能熱潮中最大的成功案例之一,它可以實現(xiàn)從自動醫(yī)療掃描到自動駕駛汽車的所有功能。但是,盡管所有視覺算法的準(zhǔn)確性都有了很大的提高,但這些系統(tǒng)仍然可能被人類可以輕松識別的圖像所迷惑。 看看下面的2張圖片,都沒有特別令人困惑的地方吧?您會看到錘子,烤箱手套,盡管中間圖片很難辨認(rèn),但可以很快地看出來是從上方看去的椅子。同時,最先進(jìn)的機(jī)器視覺算法可能只會識別這些對象中的一兩個。對于應(yīng)該駕駛我們的汽車的系統(tǒng)來說,這是一個巨大的降級。 這些圖像屬于名為ObjectNet的數(shù)據(jù)集一部分,該數(shù)據(jù)集來自MIT的科學(xué)家,以測試AI視覺的局限性。研究科學(xué)家鮑里斯·卡茨(Boris Katz)告訴《 MIT新聞》:“我們創(chuàng)建了這個數(shù)據(jù)集來告訴人們對象識別問題仍然是一個難題。我們需要更好,更智能的算法。” 更好的數(shù)據(jù)可以構(gòu)建更好的算法,而ObjectNet將在這方面提供幫助。它包含5萬張從奇怪角度或在令人驚訝的環(huán)境中觀看的物體圖像(比如沙發(fā)上倒著的茶壺或浴室里靠在椅背上的餐椅)。ObjectNet可以用來測試和評估不同算法的能力。 這類圖像很難被計算機(jī)處理,因為它們沒有出現(xiàn)在訓(xùn)練數(shù)據(jù)中,并且因為這些系統(tǒng)對現(xiàn)實世界中的對象工作方式了解有限。 AI系統(tǒng)無法輕松地從它們以前看過的項目中推斷出來,以想象它們在不同角度,在不同燈光下的形象。改善AI視覺系統(tǒng)的性能也不是沒有可能。這只需要時間,精力和訓(xùn)練。
|
|
|