視覺(jué)“聚焦”——了解視頻圖像顯著性檢測(cè)

導(dǎo)語(yǔ)：

人類(lèi)視覺(jué)系統(tǒng)（HVS）的研究發(fā)現(xiàn)，人們?cè)谟^(guān)察視頻圖像時(shí)，習(xí)慣把大部分注意力集中在視覺(jué)聚焦點(diǎn)周?chē)男》秶鷧^(qū)域內(nèi)，并賦予這個(gè)區(qū)域很高的分辨率，而聚焦點(diǎn)外的范圍則以較低分辨率呈現(xiàn)，這種預(yù)測(cè)視覺(jué)關(guān)注區(qū)域的過(guò)程就叫顯著性檢測(cè)。北航國(guó)際交叉科學(xué)研究院、電子信息工程學(xué)院徐邁副教授的研究團(tuán)隊(duì)開(kāi)展了視頻和圖像顯著性檢測(cè)模型的研究，成果現(xiàn)已發(fā)表至《IEEE Transactions on Image Processing》、《International Conference on Computer Vision (ICCV)》、《Computer Vision and Pattern Recognition (CVPR)》等國(guó)際重要期刊與會(huì)議上，并在多媒體通信領(lǐng)域內(nèi)引起廣泛好評(píng)。

研究背景：通信道路的“擁堵”

科研是為創(chuàng)造更好的未來(lái)，其靈感也源于現(xiàn)實(shí)生活的不足。通過(guò)智能終端欣賞視頻資源，已經(jīng)成為人們?nèi)粘Ｉ钪斜夭豢缮俚沫h(huán)節(jié)。用戶(hù)對(duì)獲取更高清視頻需求在日益增長(zhǎng)，使得通信行業(yè)的熱點(diǎn)，聚焦在了如何實(shí)現(xiàn)海量高清音像視頻數(shù)據(jù)更高效地傳輸。

視頻通信領(lǐng)域的瓶頸在于隨著超高清視頻與全景視頻的發(fā)展，網(wǎng)絡(luò)需要傳輸?shù)臄?shù)據(jù)量在不斷膨脹，但是傳輸數(shù)據(jù)的帶寬卻是有限的。正如空間有限的公路上行駛的車(chē)越來(lái)越多，容易引發(fā)道路擁堵。當(dāng)下，有限帶寬下的視頻高效傳輸，已成為通信行業(yè)亟待解決的問(wèn)題。

靈感來(lái)源：前沿?zé)狳c(diǎn)的融合

徐邁老師及其課題組的研究興趣為視頻通信與圖像處理，他們?cè)谘芯繅嚎s編碼的過(guò)程中受人工智能和機(jī)器學(xué)習(xí)的啟發(fā)，通過(guò)研究人類(lèi)觀(guān)看視頻的用戶(hù)體驗(yàn)，為視頻壓縮提供了新的解決思路。人類(lèi)視網(wǎng)膜相當(dāng)于以?xún)|為單位像素級(jí)別的高清相機(jī)，人在觀(guān)察視頻圖像時(shí)有一種聚焦“Attention（關(guān)注點(diǎn)）” 的機(jī)能，能夠發(fā)揮“刪繁就簡(jiǎn)”的功能能力，對(duì)于呈現(xiàn)給視覺(jué)的場(chǎng)景，只有我們關(guān)注的地方會(huì)很清楚，而周?chē)鷦t會(huì)出現(xiàn)相對(duì)模糊的情況。

受到啟發(fā)的徐邁老師及其課題組大膽提出假設(shè)：如果為計(jì)算機(jī)賦予人的視覺(jué)機(jī)能，壓縮視頻數(shù)據(jù)時(shí)在人們視覺(jué)關(guān)注度高的區(qū)域分配更多的編碼資源，使得視頻壓縮后仍能夠達(dá)成人們視覺(jué)體驗(yàn)上高質(zhì)量的效果，同時(shí)在周?chē)?jié)省編碼資源。借鑒“Perceptual Video Coding（感知視頻編碼）”的“感知”技術(shù)，徐老師推動(dòng)這一新的研究方向：建立人在視頻圖像中的關(guān)注區(qū)域預(yù)測(cè)模型，以預(yù)測(cè)視頻圖片場(chǎng)景中的視覺(jué)關(guān)注集中域。

研究拓展：年輕團(tuán)隊(duì)的合作

為了探索出人類(lèi)視覺(jué)關(guān)注區(qū)域的模型，徐邁老師帶領(lǐng)團(tuán)隊(duì)展開(kāi)研究。團(tuán)隊(duì)中最小的成員為一名大三年級(jí)的本科生，徐老師說(shuō)：“學(xué)生的興趣與個(gè)人能力，才是開(kāi)展科學(xué)研究的關(guān)鍵因素”。因此在徐邁老師的團(tuán)隊(duì)中，學(xué)生年齡呈現(xiàn)年輕化的特點(diǎn)。

研究團(tuán)隊(duì)通力合作，從數(shù)據(jù)出發(fā)，利用機(jī)器學(xué)習(xí)方法挖掘人體視覺(jué)認(rèn)知規(guī)律。團(tuán)隊(duì)邀請(qǐng)多位被試者走進(jìn)實(shí)驗(yàn)室，記錄被試者觀(guān)看視頻時(shí)關(guān)注區(qū)域的結(jié)果數(shù)據(jù)，以實(shí)際采集到的數(shù)據(jù)為驅(qū)動(dòng)，運(yùn)用支持向量機(jī)和深度學(xué)習(xí)方法建立機(jī)器學(xué)習(xí)模型，實(shí)現(xiàn)視頻關(guān)注區(qū)域的預(yù)測(cè)。

徐邁老師團(tuán)隊(duì)視頻顯著性檢測(cè)的研究成果，不但能應(yīng)用于視頻圖像壓縮，還能夠應(yīng)用于多種領(lǐng)域，如對(duì)網(wǎng)頁(yè)和展示排版設(shè)計(jì)領(lǐng)域提供指導(dǎo)，通過(guò)合理安放圖標(biāo)、文字，調(diào)整配圖、配色，可以達(dá)到最大程度吸引視覺(jué)注意力的目標(biāo)。而徐邁老師團(tuán)隊(duì)的下一步研究重點(diǎn)，將嘗試拓展至具有“交互性、沉浸式”特點(diǎn)的全景視頻新鮮領(lǐng)域。團(tuán)隊(duì)也將商討與其他科研團(tuán)隊(duì)的合作方案，實(shí)現(xiàn)多學(xué)科之間相互交叉研究。

策劃/文案：秦煜瑤、張金星

外文編輯：劉昕睿

設(shè)計(jì)：秦煜瑤技術(shù)：曹嘉輝

鳴謝：國(guó)際交叉科學(xué)研究院、電子信息工程學(xué)院徐邁副教授

編審：門(mén)戶(hù)網(wǎng)站總編總監(jiān)工作室

投稿：[email protected]

上一條：最長(zhǎng)的夜

下一條：十二月晨興——2017年12月晨興音樂(lè)廳演出節(jié)目單

菲律宾百家乐-豪博娱乐城-揭秘博彩网首存送彩金

2017年

視覺(jué)“聚焦”——了解視頻圖像顯著性檢測(cè)