聲音在物體定位中會(huì)起到非常重要的作用,人們甚至可以利用自身對(duì)聲音的感知來(lái)定位視線范圍內(nèi)的物體。在本文中,來(lái)自 MIT 計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室、MIT-IBM 沃森人工智能實(shí)驗(yàn)室團(tuán)隊(duì)的研究者提出了一套利用無(wú)標(biāo)記的視聽(tīng)數(shù)據(jù)來(lái)自監(jiān)督學(xué)習(xí)的算法,僅依靠立體音頻和攝像機(jī)元數(shù)據(jù)就可以在視覺(jué)參考坐標(biāo)系中定位移動(dòng)的車輛。