菲律宾百家乐-豪博娱乐城-揭秘博彩网首存送彩金

2017年

視覺(jué)“聚焦”——了解視頻圖像顯著性檢測(cè)

導(dǎo)語(yǔ):    

   人類(lèi)視覺(jué)系統(tǒng)(HVS)的研究發(fā)現(xiàn),人們?cè)谟^(guān)察視頻圖像時(shí),習(xí)慣把大部分注意力集中在視覺(jué)聚焦點(diǎn)周?chē)男》秶鷧^(qū)域內(nèi),并賦予這個(gè)區(qū)域很高的分辨率,而聚焦點(diǎn)外的范圍則以較低分辨率呈現(xiàn),這種預(yù)測(cè)視覺(jué)關(guān)注區(qū)域的過(guò)程就叫顯著性檢測(cè)。北航國(guó)際交叉科學(xué)研究院、電子信息工程學(xué)院徐邁副教授的研究團(tuán)隊(duì)開(kāi)展了視頻和圖像顯著性檢測(cè)模型的研究,成果現(xiàn)已發(fā)表至《IEEE Transactions on Image Processing》、《International Conference on Computer Vision (ICCV)》、《Computer Vision and Pattern Recognition (CVPR)》等國(guó)際重要期刊與會(huì)議上,并在多媒體通信領(lǐng)域內(nèi)引起廣泛好評(píng)。    

 

研究背景:通信道路的“擁堵”

科研是為創(chuàng)造更好的未來(lái),其靈感也源于現(xiàn)實(shí)生活的不足。通過(guò)智能終端欣賞視頻資源,已經(jīng)成為人們?nèi)粘I钪斜夭豢缮俚沫h(huán)節(jié)。用戶(hù)對(duì)獲取更高清視頻需求在日益增長(zhǎng),使得通信行業(yè)的熱點(diǎn),聚焦在了如何實(shí)現(xiàn)海量高清音像視頻數(shù)據(jù)更高效地傳輸。    

視頻通信領(lǐng)域的瓶頸在于隨著超高清視頻與全景視頻的發(fā)展,網(wǎng)絡(luò)需要傳輸?shù)臄?shù)據(jù)量在不斷膨脹,但是傳輸數(shù)據(jù)的帶寬卻是有限的。正如空間有限的公路上行駛的車(chē)越來(lái)越多,容易引發(fā)道路擁堵。當(dāng)下,有限帶寬下的視頻高效傳輸,已成為通信行業(yè)亟待解決的問(wèn)題。    

靈感來(lái)源:前沿?zé)狳c(diǎn)的融合

徐邁老師及其課題組的研究興趣為視頻通信與圖像處理,他們?cè)谘芯繅嚎s編碼的過(guò)程中受人工智能和機(jī)器學(xué)習(xí)的啟發(fā),通過(guò)研究人類(lèi)觀(guān)看視頻的用戶(hù)體驗(yàn),為視頻壓縮提供了新的解決思路。人類(lèi)視網(wǎng)膜相當(dāng)于以?xún)|為單位像素級(jí)別的高清相機(jī),人在觀(guān)察視頻圖像時(shí)有一種聚焦“Attention(關(guān)注點(diǎn))” 的機(jī)能,能夠發(fā)揮“刪繁就簡(jiǎn)”的功能能力,對(duì)于呈現(xiàn)給視覺(jué)的場(chǎng)景,只有我們關(guān)注的地方會(huì)很清楚,而周?chē)鷦t會(huì)出現(xiàn)相對(duì)模糊的情況。    

受到啟發(fā)的徐邁老師及其課題組大膽提出假設(shè):如果為計(jì)算機(jī)賦予人的視覺(jué)機(jī)能,壓縮視頻數(shù)據(jù)時(shí)在人們視覺(jué)關(guān)注度高的區(qū)域分配更多的編碼資源,使得視頻壓縮后仍能夠達(dá)成人們視覺(jué)體驗(yàn)上高質(zhì)量的效果,同時(shí)在周?chē)?jié)省編碼資源。借鑒“Perceptual Video Coding(感知視頻編碼)”的“感知”技術(shù),徐老師推動(dòng)這一新的研究方向:建立人在視頻圖像中的關(guān)注區(qū)域預(yù)測(cè)模型,以預(yù)測(cè)視頻圖片場(chǎng)景中的視覺(jué)關(guān)注集中域。    

研究拓展:年輕團(tuán)隊(duì)的合作

為了探索出人類(lèi)視覺(jué)關(guān)注區(qū)域的模型,徐邁老師帶領(lǐng)團(tuán)隊(duì)展開(kāi)研究。團(tuán)隊(duì)中最小的成員為一名大三年級(jí)的本科生,徐老師說(shuō):“學(xué)生的興趣與個(gè)人能力,才是開(kāi)展科學(xué)研究的關(guān)鍵因素”。因此在徐邁老師的團(tuán)隊(duì)中,學(xué)生年齡呈現(xiàn)年輕化的特點(diǎn)。    

研究團(tuán)隊(duì)通力合作,從數(shù)據(jù)出發(fā),利用機(jī)器學(xué)習(xí)方法挖掘人體視覺(jué)認(rèn)知規(guī)律。團(tuán)隊(duì)邀請(qǐng)多位被試者走進(jìn)實(shí)驗(yàn)室,記錄被試者觀(guān)看視頻時(shí)關(guān)注區(qū)域的結(jié)果數(shù)據(jù),以實(shí)際采集到的數(shù)據(jù)為驅(qū)動(dòng),運(yùn)用支持向量機(jī)和深度學(xué)習(xí)方法建立機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)視頻關(guān)注區(qū)域的預(yù)測(cè)。    

徐邁老師團(tuán)隊(duì)視頻顯著性檢測(cè)的研究成果,不但能應(yīng)用于視頻圖像壓縮,還能夠應(yīng)用于多種領(lǐng)域,如對(duì)網(wǎng)頁(yè)和展示排版設(shè)計(jì)領(lǐng)域提供指導(dǎo),通過(guò)合理安放圖標(biāo)、文字,調(diào)整配圖、配色,可以達(dá)到最大程度吸引視覺(jué)注意力的目標(biāo)。而徐邁老師團(tuán)隊(duì)的下一步研究重點(diǎn),將嘗試拓展至具有“交互性、沉浸式”特點(diǎn)的全景視頻新鮮領(lǐng)域。團(tuán)隊(duì)也將商討與其他科研團(tuán)隊(duì)的合作方案,實(shí)現(xiàn)多學(xué)科之間相互交叉研究。    

 

策劃/文案:秦煜瑤、張金星

外文編輯:劉昕睿

設(shè)計(jì):秦煜瑤 技術(shù):曹嘉輝

鳴謝:國(guó)際交叉科學(xué)研究院、電子信息工程學(xué)院徐邁副教授

編審:門(mén)戶(hù)網(wǎng)站總編總監(jiān)工作室

投稿:[email protected]

 

上一條:最長(zhǎng)的夜

下一條:十二月晨興——2017年12月晨興音樂(lè)廳演出節(jié)目單