|
重磅干貨,第一時間送達 摘要 復雜場景下目標物體抓取檢測的可靠性是一項具有挑戰(zhàn)性的任務,是實際應用中迫切需要解決的關鍵問題。目前,抓點檢測的定位主要來自于對整個圖像的特征空間進行搜索。但是圖像中混雜的背景信息降低了抓取檢測的準確性。本文提出了一種機器人抓取檢測算法MASK-GD,為這一問題提供了一種可行的解決方案。掩碼是一種只包含目標對象像素的分割圖像。抓取檢測的MASK- GD只使用了MASK特征,而不是場景中整個圖像的特征。它有兩個階段:第一個階段是提供目標對象的掩碼作為輸入圖像,第二個階段是基于掩碼特征的抓取檢測器。實驗結果表明,在Cornell數(shù)據(jù)集和Jacquard數(shù)據(jù)集上,MASK-GD的抓取檢測性能與目前最先進的抓取檢測算法相當。同時,MASK-GD在復雜場景中表現(xiàn)得更好。
框架結構 作者的抓取檢測模型的完整結構是基于目標分割的。模型的輸入是一個RGB圖像,模型分為兩個階段:目標分割階段和抓取檢測階段。在第一階段,只保留目標區(qū)域的像素。在第二階段,檢測只包含目標的圖像。 作者的方法采用兩階段網(wǎng)絡結構 第一階段是實例分割階段,對輸入圖像進行分割,以可靠地將目標對象與背景信息區(qū)分開來。第二階段是抓取檢測階段,只包含目標圖像進行抓取檢測。 在第一階段,受U-Net++[17]網(wǎng)絡的啟發(fā),作者使用編碼器、解碼器和skip連接結構對輸入圖像進行分割。編碼器采用VGG16[16]網(wǎng)絡作為骨干,提取輸入圖像特征,進行四次下采樣操作。下采樣過程可以顯著提高模型對輸入圖像的一些擾動的魯棒性,增加模型的靈敏度域,降低計算成本和過擬合風險。解碼器通過四個上采樣操作將特征映射恢復到初始大小,并通過一個跳過連接將每個下采樣生成的特征映射連接起來。利用上采樣和跳層連接,減少了下采樣導致的信息丟失,顯著提高了模型對不同大小對象的分割性能。 最后將分割后的RGB圖像輸入到第二階段抓取檢測器中,抓取檢測器對圖像中的目標進行抓取檢測。實驗驗證表明,該方法能有效提高抓取精度,抓取結果優(yōu)于[3]提出的ROI-GD方法。該方法可以成功地應用于多目標場景,而在單目標場景中仍然可以獲得最先進的結果。 實驗結果 Cornell Grasp數(shù)據(jù)集的圖像和(b)去除背景信息的Cornell Grasp數(shù)據(jù)集的圖像。 對于用于測試模型的數(shù)據(jù),作者不做任何數(shù)據(jù)增強。此外,測試圖像是一個一個的輸入模型,而不是分批處理。在Cornell Grasp數(shù)據(jù)集上的實驗結果如表1所示。作者的模型在圖像分割和目標分割方面分別達到96.4%和96.5%的精度。與基線相比,作者的方法在輸入RGB圖像時精度分別提高1.5%和0.6%,在輸入RGD圖像時精度分別提高0.4%和0.4%。作者的方法消除了明顯影響抓取檢測性能的圖像背景元素,并增加了與輸入圖像的對比度。另一方面,用深度信息代替RGB圖像中的藍色通道像素值,由于物體與背景的深度值存在差異,也在一定程度上增加了對比度。因此,在精度提升方面,相對于基線,RGD格式的輸入比RGB格式的輸入要小。
提出了一種新的機器人抓取檢測方法Mask-GD。該方法通過目標分割消除了背景信息對抓取檢測的干擾,實現(xiàn)了目標檢測代替場景。作者分別在Cornell數(shù)據(jù)集和Jacquard數(shù)據(jù)集上驗證了作者提出的方法,并使用標準性能度量和方法將它們與最先進的系統(tǒng)進行比較,以證明作者的方法的有效性。實驗結果表明,該方法的性能優(yōu)于現(xiàn)有系統(tǒng)。 論文鏈接:https:///pdf/2101.08183.pdf 每日堅持論文分享不易,如果喜歡我們的內(nèi)容,希望可以推薦或者轉(zhuǎn)發(fā)給周圍的同學。 - END - ![]() #投 稿 通 道# 讓你的論文被更多人看到 如何才能讓更多的優(yōu)質(zhì)內(nèi)容以更短路徑到達讀者群體,縮短讀者尋找優(yōu)質(zhì)內(nèi)容的成本呢?答案就是:你不認識的人。 總有一些你不認識的人,知道你想知道的東西。深度學習愛好者 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發(fā)出更多的可能性。 深度學習愛好者 鼓勵高校實驗室或個人,在我們的平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。 ?? 來稿標準: · 稿件確系個人原創(chuàng)作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向) · 如果文章并非首發(fā),請在投稿時提醒并附上所有已發(fā)布鏈接 · 深度學習愛好者 默認每篇文章都是首發(fā),均會添加“原創(chuàng)”標志 |
|
|