人妻少妇乱子伦精品_日韩人妻潮喷视频网站_日本最新最全无码不卡免费_日韩AV无码中文

當(dāng)前位置: 首頁 > 社會新聞 >

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無

時間:2020-04-17 17:57來源:網(wǎng)絡(luò)整理 瀏覽:
魚羊 發(fā)自 凹非寺量子位 報道 | 公眾號 QbitAI在陽臺上給小姐姐拍個視頻:再把她P到噴泉廣場:需要幾步?現(xiàn)在,無需綠幕,AI 就能搞

魚羊 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI

在陽臺上給小姐姐拍個視頻:

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

再把她P到噴泉廣場:

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

需要幾步?

現(xiàn)在,無需綠幕,AI 就能搞定這件事。

就像這樣,隨便用手機(jī)給小姐姐拍張照片,再在同一地點拍張不帶人像的背景圖。

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

深度神經(jīng)網(wǎng)絡(luò)就能自動分析出 alpha 遮罩和前景色,把小姐姐的發(fā)絲都摳得根根分明。

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

視頻也是如此。

讓憋著笑的同事在實驗室白板前表演一段廣播體操,再給背景板單獨來一張,就可以無中生有把同事“轉(zhuǎn)移”到大廳里,引來路人圍觀了。

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

這是來自華盛頓大學(xué)的一項最新研究,無需綠幕,無需手動創(chuàng)建 Trimap,一個具有對抗性損失的深度神經(jīng)網(wǎng)絡(luò),就能準(zhǔn)確預(yù)測遮罩,給照片視頻摳圖。

論文已經(jīng)中了 CVPR 2020,代碼即將開源。

深度摳圖網(wǎng)絡(luò) + 鑒別器網(wǎng)絡(luò)

那么,這樣的摳圖特技是如何煉成的?

研究人員表示,是具有對抗性損失的深度網(wǎng)絡(luò) + 判斷合成質(zhì)量的鑒別器。

深度摳圖網(wǎng)絡(luò)

研究人員先在 Adobe Matting 數(shù)據(jù)集中的非透明對象子集上對深度神經(jīng)網(wǎng)絡(luò) G 進(jìn)行了監(jiān)督訓(xùn)練。

輸入是帶人像的照片 I 和照片中的背景 B’,以及人像軟分割 S 和 運動先驗 M(僅對視頻而言)。

需要注意的是,在真實環(huán)境中,B’ 是通過在真實背景的前景區(qū)域隨機(jī)加入噪聲而生成的。

依據(jù)輸入,網(wǎng)絡(luò)會預(yù)測出 alpha 遮罩 α 和前景圖像 F。

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

研究人員提出用背景切換塊(Context Switching block,CS block)來取代基于殘差塊的編碼器-解碼器。

有什么不同?

舉個例子,當(dāng)人的一部分與背景相匹配的時候,網(wǎng)絡(luò)會將更多精力放在該區(qū)域的細(xì)分線索上。

G 網(wǎng)絡(luò)有四個不同的編碼器,分別適用于 I,B’,S 和 M 四種輸入。每個編碼器分別生成256個通道的特征圖。

通過 1×1 卷積,BatchNorm 和 ReLU,I 中的圖像特征分別與 B’,S 和 M 結(jié)合,每一對組合都會生成 64 通道特征。

最后,將這 3 個 64 通道特征與原始的 256 通道圖像特征組合在一起,生成編碼后的特征,并傳遞到由殘差塊和編碼器組成的其余網(wǎng)絡(luò)。

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

在未標(biāo)記真實數(shù)據(jù)上的對抗訓(xùn)練

CS block 和數(shù)據(jù)增強(qiáng)的結(jié)合,可以有效彌合真實圖像與 Adobe數(shù)據(jù)集創(chuàng)建的合成圖像之間的差距,但真實圖像中仍然有存在一些難點:

將手指、手臂、頭發(fā)周圍的背景痕跡復(fù)制到遮罩中;分割失?。磺熬吧闹匾糠峙c背景顏色接近;人像照片和背景照片之間沒有對準(zhǔn)。

為了應(yīng)對這些問題,研究人員還提出了一種自監(jiān)督方案,從未標(biāo)記的真實數(shù)據(jù)(真實圖像 + 背景)中學(xué)習(xí)。

用深度摳圖網(wǎng)絡(luò) G 的單獨副本 GReal 組成對抗網(wǎng)絡(luò),對抗網(wǎng)絡(luò)會生成類似于 GAdobe 輸出的遮罩,而鑒別器網(wǎng)絡(luò) D 會判別結(jié)果的真假。

研究人員使用真實輸入(手機(jī)拍攝)聯(lián)合訓(xùn)練 GReal 和 D,并用 GAdobe 來提供監(jiān)督。

與SOTA方法的對比

研究人員將新方法與以下幾種 SOTA 方法進(jìn)行了定性比較:

基于 Trimap 的 Context Aware Matting (CAM)和 Index Matting(IM);自動遮罩算法 Late Fusion Matting(LFM);沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

沒有綠幕,AI也能完美視頻摳圖,發(fā)絲畢現(xiàn),毫無違和感 | CVPR

不難看出,效果改進(jìn)著實明顯。

你覺得怎么樣?不妨mark一下,坐等開源。

畢竟有些大膽的想法,可能已經(jīng)在醞釀了,是吧?

傳送門

項目地址:http://grail.cs.washington.edu/projects/background-matting/

— 完 —

量子位 QbitAI · 頭條號簽約

關(guān)注我們,第一時間獲知前沿科技動態(tài)

推薦內(nèi)容