深圳先進技術(shù)研究院

深圳先進院獲廣東省技術(shù)發(fā)明一等獎

發(fā)布時間:2020-03-26 來源:深圳先進技術(shù)研究院

  325日,全省科技創(chuàng)新大會在廣州召開,大會頒發(fā)了2019年度廣東省科學技術(shù)獎。其中,技術(shù)發(fā)明獎一等獎共9項,由中國科學院深圳先進技術(shù)研究院(簡稱“深圳先進院)聯(lián)合深圳市商湯科技有限公司、南京大學研發(fā)完成的“視頻的深度表征與識別技術(shù)及應用”項目為其中之一。 

  近年來,隨著信息通信技術(shù)的發(fā)展,視頻數(shù)據(jù)呈現(xiàn)爆炸式增長。現(xiàn)有技術(shù)雖然能夠較好地采集、存儲和傳輸視頻,但大規(guī)模視頻識別仍面臨內(nèi)容復雜、識別精度和計算效率等巨大挑戰(zhàn)。解決這些挑戰(zhàn)的核心是構(gòu)建讓AI既能看得懂,又能“認得準,同時還能“算得快的能力,即實現(xiàn)對復雜多變內(nèi)容的理解、海量對象的高精度識別及快速處理。 

  項目第一完成人深圳先進院數(shù)字所所長喬宇研究員帶領(lǐng)團隊,經(jīng)過多年研究開發(fā)和應用驗證,提出了視頻長短時表征與識別等一系列創(chuàng)新性方法,突破了軌跡卷積、中心損失等核心技術(shù),顯著提升了復雜視頻行為分類、大規(guī)模人像識別、物體檢測、場景分類等重要視覺任務的性能。 

  該技術(shù)在多個著名視覺數(shù)據(jù)庫的驗證下取得了同期國際領(lǐng)先的識別率,并在ImageNet、ActivityNet等重要視覺國際競賽多次取得第一或名列前茅。在計算機視覺重要國際期刊和會議如PAMI、IJCV、CVPR、ICCV等發(fā)表一系列創(chuàng)新論文,根據(jù)谷歌學術(shù)統(tǒng)計論文累計被引超過8000次,獲國內(nèi)外授權(quán)發(fā)明專利10余項。 

  目前,項目研發(fā)的技術(shù)已廣泛應用于智慧城市、機器人及互聯(lián)網(wǎng)多媒體等多個領(lǐng)域,提高了城市的管理效率和能力,創(chuàng)造了顯著的經(jīng)濟和社會效益。

時序分割網(wǎng)絡(luò),可在顯存限制條件下,實現(xiàn)全視頻到端到端優(yōu)化訓練


附件下載: