深圳先進(jìn)院聯(lián)合團(tuán)隊(duì)獲CVPR 2019視頻復(fù)原大賽冠軍

發(fā)布時(shí)間：2019-07-03 來(lái)源:深圳先進(jìn)院

　　近日，計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)最負(fù)盛名的學(xué)術(shù)會(huì)議——IEEE國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議（CVPR 2019）在美國(guó)加州舉行，會(huì)上頒發(fā)了Workshop NTIRE 2019 視頻復(fù)原比賽相關(guān)獎(jiǎng)項(xiàng)。由中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院、商湯科技、香港中文大學(xué)、南洋理工大學(xué)組成的聯(lián)合團(tuán)隊(duì)研發(fā)的EDVR算法，包攬了該比賽四個(gè)賽道的全部冠軍。

　　此次視頻復(fù)原比賽包含兩個(gè)視頻去模糊和兩個(gè)視頻超分辨率賽道，比賽結(jié)果顯示，共有14支隊(duì)伍進(jìn)入最終的排名，該聯(lián)合團(tuán)隊(duì)的算法大幅超越各個(gè)賽道的第二名，且在大部分?jǐn)?shù)據(jù)集上精度指標(biāo)都是最高的。目前，該算法論文 EDVR: Video Restoration with Enhanced Deformable Convolutional Networks 已發(fā)布于arXiv，同時(shí)團(tuán)隊(duì)已將代碼開(kāi)源，深圳先進(jìn)院數(shù)字所多媒體集成技術(shù)研究中心副研究員董超為論文作者之一。

　　在該論文中，作者介紹了這種新型算法，通過(guò)一種新的網(wǎng)絡(luò)模塊 PCD 對(duì)齊模塊，使用 Deformable 卷積進(jìn)行視頻的對(duì)齊，可實(shí)現(xiàn)整個(gè)過(guò)程端到端的訓(xùn)練；而在挖掘時(shí)域（視頻前后幀）和空域（同一幀內(nèi)部）的信息融合時(shí)，作者又提出了一種時(shí)空注意力模型，來(lái)進(jìn)行更好的信息融合。該算法未來(lái)有望應(yīng)用在視頻直播、高清電視、手機(jī)拍攝、視頻監(jiān)控等領(lǐng)域。

　　在同期舉辦的圖像復(fù)原大賽中，聯(lián)合團(tuán)隊(duì)論文同樣獲得冠軍。利用深度學(xué)習(xí)解決圖像超分辨率問(wèn)題，需要用到大量的訓(xùn)練數(shù)據(jù)，一般情況下，至少200個(gè)以上的圖像對(duì)才能保證圖像的超分辨率效果。而此次比賽僅提供60個(gè)圖像對(duì)作為訓(xùn)練數(shù)據(jù)，大大限制了超分辨率的效果。團(tuán)隊(duì)的論文首次分析并解決了超分辨率網(wǎng)絡(luò)中的過(guò)擬合問(wèn)題，即便使用少量的圖像數(shù)據(jù)，也可以獲得出色的結(jié)果。

　　這支在國(guó)際頂級(jí)計(jì)算機(jī)視覺(jué)大賽中脫穎而出的隊(duì)伍，專注于底層計(jì)算機(jī)視覺(jué)，包括圖像和視頻的超分辨率、去噪與增強(qiáng)等技術(shù)。2014年該團(tuán)隊(duì)首次利用深度學(xué)習(xí)實(shí)現(xiàn)圖像超分辨率，引起了深度學(xué)習(xí)在底層視覺(jué)領(lǐng)域應(yīng)用的熱潮。2017年，團(tuán)隊(duì)獲得CVPR 2017圖像超分辨率的亞軍；2018年，團(tuán)隊(duì)分別獲得CVPR18和ECCV18兩屆圖像超分辨率比賽單一賽道的冠軍?！　?/p>

深圳先進(jìn)院數(shù)字所多媒體集成技術(shù)研究中心團(tuán)隊(duì)

附件下載：

上一篇：深圳先進(jìn)院合成生物學(xué)方向在國(guó)家重大項(xiàng)目計(jì)劃中獲重要突破

下一篇：深圳先進(jìn)院召開(kāi)“不忘初心、牢記使命”主題教育報(bào)告會(huì)