CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

投稿用戶 ? 2024年5月1日下午1:20 ? 科研百科 ? 閱讀 49

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年，機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容，覆蓋全球各大高校與企業(yè)的頂級實驗室，有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享，歡迎投稿或者聯(lián)系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。

來自香港科技大學(xué)，清華大學(xué)的研究者提出了「GenN2N」，一個統(tǒng)一的生成式 NeRF-to-NeRF 轉(zhuǎn)換框架，適用于各種 NeRF 轉(zhuǎn)換任務(wù)，例如文字驅(qū)動的 NeRF 編輯、著色、超分辨率、修復(fù)等，性能均表現(xiàn)極其出色！

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

論文地址：https://arxiv.org/abs/2404.02788
論文主頁：https://xiangyueliu.github.io/GenN2N/
Github 地址：https://github.com/Lxiangyue/GenN2N
論文標(biāo)題：GenN2N: Generative NeRF2NeRF Translation

近年來，神經(jīng)輻射場（NeRF）因其緊湊、高質(zhì)量、多功能性在三維重建、三維生成和新視角合成領(lǐng)域引起了廣泛關(guān)注。然而，一旦創(chuàng)建了 NeRF 場景，這些方法通常缺乏對生成幾何和外觀的進(jìn)一步控制。因此，NeRF 編輯（NeRF Editing）最近成為了一個值得關(guān)注的研究重點。

目前的 NeRF 編輯方法通常是針對特定任務(wù)的，例如 NeRF 的文本驅(qū)動編輯、超分辨率、修復(fù)和著色。這些方法需要大量的特定任務(wù)領(lǐng)域知識。而在 2D 圖像編輯領(lǐng)域，開發(fā)通用的圖像到圖像（Image-to-image）轉(zhuǎn)換方法成為一種趨勢，例如利用 2D 生成模型 Stable Difussion 支持多功能的圖像編輯。因此，我們提出了利用基礎(chǔ)的 2D 生成模型進(jìn)行通用的 NeRF 編輯。

隨之而來的挑戰(zhàn)是 NeRF 和 2D 圖像之間的表示差距，尤其是圖像編輯器通常會為不同視角生成多種不一致的編輯。最近的一種基于文本的 NeRF 編輯方法 Instruct-NeRF2NeRF 對此進(jìn)行了探究。其采用 “渲染 – 編輯 – 聚合” 的流程，通過逐步渲染多視角圖像、編輯這些圖像，將編輯圖像聚合到 NeRF 中逐步更新 NeRF 場景。然而這種編輯方法，針對特定的編輯需求，經(jīng)過大量的優(yōu)化，只能生成一種特定編輯的結(jié)果，如果用戶不滿意則需要反復(fù)迭代嘗試。

因此，我們提出了「GenN2N」，一種適用于多種 NeRF 編輯任務(wù)的 NeRF-to-NeRF 通用框架，其核心在于用生成的方式來刻畫編輯過程多解性，使其可以借助生成式編輯輕松產(chǎn)生大量符合要求的編輯結(jié)果供用戶挑選。

在 GenN2N 的核心部分，1）引入了 3D VAE-GAN 的生成式框架，使用 VAE 表征整個編輯空間，來學(xué)習(xí)與一組輸入的 2D 編輯圖像對應(yīng)的所有可能的 3D NeRF 編輯分布，并用 GAN 為編輯 NeRF 的不同視圖提供合理的監(jiān)督，確保編輯結(jié)果的真實性，2）使用對比學(xué)習(xí)解耦編輯內(nèi)容和視角，確保不同視角間的編輯內(nèi)容一致性，3）在推理時，用戶簡單地從條件生成模型中隨機(jī)地采樣出多個編輯碼，就可以生成與編輯目標(biāo)對應(yīng)的各種 3D 編輯結(jié)果。

相比于各種 NeRF 編輯任務(wù)的 SOTA 方法（ICCV2023 Oral 等），GenN2N 在編輯質(zhì)量、多樣性、效率等方面均優(yōu)于已有方法。

方法介紹

我們首先進(jìn)行 2D 圖像編輯，然后將這些 2D 編輯提升到 3D NeRF 來實現(xiàn)生成式的 NeRF-to-NeRF 的轉(zhuǎn)換。

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

A. 隱式蒸餾（Latent Distill）

我們用 Latent Distill Module 作為 VAE 的 encoder，為每張編輯圖像學(xué)習(xí)一個隱式的編輯碼，在 NeRF-to-NeRF 轉(zhuǎn)換中通過此編輯碼控制生成的內(nèi)容。所有編輯碼在 KL loss 的約束下服從一個良好的正態(tài)分布，以便更好地采樣。為了解耦編輯內(nèi)容和視角，我們精心設(shè)計了對比學(xué)習(xí)，鼓勵相同編輯風(fēng)格視角不同的圖片的編輯碼相近，不同編輯風(fēng)格但視角相同的圖片的編輯碼互相遠(yuǎn)離。

B.NeRF-to-NeRF 的轉(zhuǎn)換（Translated NeRF）

我們用 NeRF-to-NeRF Translation 作為 VAE 的 decoder，其以編輯碼作為輸入，將原始的 NeRF 修改為一個轉(zhuǎn)換 NeRF。我們在原 NeRF 網(wǎng)絡(luò)隱藏層之間添加了殘差層，這些殘差層以編輯碼作為輸入來調(diào)制隱藏層神經(jīng)元，使得轉(zhuǎn)換 NeRF 既能夠保留原本 NeRF 的信息，又可以根據(jù)編輯碼來控制轉(zhuǎn)換 3D 內(nèi)容。同時，NeRF-to-NeRF Translation 也作為生成器參與生成對抗訓(xùn)練。通過生成而非優(yōu)化的方式，使得我們可以一次性得到多種轉(zhuǎn)換結(jié)果，顯著提升了 NeRF 轉(zhuǎn)換效率和結(jié)果多樣性。

C. 條件判別器（Conditional Discriminator）

轉(zhuǎn)換 NeRF 的渲染圖片構(gòu)成了需要判別的生成空間，這些圖片的編輯風(fēng)格、渲染視角各異，導(dǎo)致生成空間非常復(fù)雜。因此我們提供一個 condition 作為判別器的額外信息。具體而言，判別器在鑒別生成器的渲染圖片（負(fù)樣本）或訓(xùn)練數(shù)據(jù)中的編輯圖片（正樣本）時，我們都從訓(xùn)練數(shù)據(jù)中再挑選一張相同視角的編輯圖片作為條件，這使得判別器在鑒別正負(fù)樣本時不會受到視角因素的干擾。

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

D. 推理（Inference）

在 GenN2N 優(yōu)化后，用戶可以從正態(tài)分布中隨機(jī)采樣出編輯碼，輸入轉(zhuǎn)換 NeRF 即可生成出編輯后的高質(zhì)量、多視角一致性的 3D NeRF 場景。

實驗

我們在多種 NeRF-to-NeRF 任務(wù)上進(jìn)行了大量的實驗，包括 NeRF 文本驅(qū)動編輯、著色、超分辨率、修復(fù)等。實驗結(jié)果展示了 GenN2N 卓越的編輯質(zhì)量、多視角一致性、生成的多樣性和編輯效率。

A. 基于文本的 NeRF 編輯

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

B.NeRF 著色

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

C.NeRF 超分辨率

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

D.NeRF 修復(fù)

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

對比實驗

我們的方法與各種特定 NeRF 任務(wù)的 SOTA 方法進(jìn)行了定性和定量對比（包括文本驅(qū)動編輯、著色、超分辨率和修復(fù)等）。結(jié)果表明，GenN2N 作為一個通用框架，其表現(xiàn)與特定任務(wù) SOTA 相當(dāng)或者更好，同時編輯結(jié)果具有更強(qiáng)的多樣性（如下是 GenN2N 與 Instruct-NeRF2NeRF 在基于文本的 NeRF 編輯任務(wù)上的對比）。

A. 基于文本的 NeRF 編輯

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

了解更多實驗、方法內(nèi)容，請參考論文主頁。

團(tuán)隊介紹

該論文來自香港科技大學(xué)譚平團(tuán)隊、清華大學(xué) 3DVICI Lab、上海人工智能實驗室和上海期智研究院，論文的作者為香港科技大學(xué)學(xué)生劉襄閱，清華大學(xué)學(xué)生薛晗，香港科技大學(xué)學(xué)生羅堃銘，指導(dǎo)老師為清華大學(xué)弋力老師和香港科技大學(xué)譚平老師。

版權(quán)聲明：本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)，該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容，請發(fā)送郵件至舉報，一經(jīng)查實，本站將立刻刪除。

贊 (0)

投稿用戶

10 個實用的 Vue.js 工具和庫（vue.js ui庫）

上一篇 2024年5月1日下午1:15

5款免費(fèi)可用的3D建模AI工具！一鍵出片神器集合（5款免費(fèi)可用的3d建模ai工具!一鍵出片神器集合）

下一篇 2024年5月1日下午1:26

央企紀(jì)檢監(jiān)察機(jī)構(gòu)推動內(nèi)控體系建設(shè)扎牢制度籠子將紀(jì)律監(jiān)督融入企業(yè)治理

中央紀(jì)委國家監(jiān)委網(wǎng)站楊文佳篩查可疑交易2萬余條，翻閱百余份合同和2000余張憑證……在提升監(jiān)督效能行動中，中國中化控股有限責(zé)任公司紀(jì)檢監(jiān)察組工作人員對企業(yè)日常交易信息進(jìn)行大數(shù)據(jù)…

投稿用戶
科研百科 2024年1月22日
1090
項目及任務(wù)(課題)負(fù)責(zé)人的科研水平及主要成果

標(biāo)題：XXX項目及任務(wù)(課題)負(fù)責(zé)人的科研水平及主要成果近年來，隨著科技的不斷發(fā)展，科研項目及任務(wù)(課題)負(fù)責(zé)人的科研水平也不斷提高。XXX項目及任務(wù)(課題)負(fù)責(zé)人，名叫XXX，…

投稿用戶
科研百科 2024年12月4日
10
課題沒有結(jié)題算研究成果嗎(大學(xué)科研項目未結(jié)題有什么影響嘛)

大學(xué)科研項目未結(jié)題的影響大學(xué)科研項目未結(jié)題可能會產(chǎn)生多種不良影響。首先，未結(jié)題項目可能會影響教師的聲譽(yù)。如果項目未結(jié)題，教師可能會受到學(xué)生和同行的質(zhì)疑和批評。這些質(zhì)疑和批評可能會…

投稿用戶
科研百科 2024年8月7日
20
用什么看天氣？18 款值得你嘗試的天氣 App（看天氣的app哪個好）

無論是在 iOS 還是在 Android 上，如果你搜索天氣應(yīng)用，都會有上千款天氣應(yīng)用等著你去下載，作為很多人手機(jī)上必不可少的應(yīng)用，天氣應(yīng)用絕對是同質(zhì)化最嚴(yán)重的，它們存在的意義就是…

投稿用戶
科研百科 2024年7月26日
170
論黨建工作的重要性（論黨建工作的重要性和必要性）

黨的建設(shè)是我們抓好各項工作的根本。長期以來，我們的工作不僅僅是經(jīng)濟(jì)工作，不單純是幾項硬性中心任務(wù)，黨建工作抓好了，基層黨組織的核心作用就能更好發(fā)揮，隊伍的凝聚力和向心力就更加明顯，…

投稿用戶
科研百科 2023年7月20日
4390
搶單系統(tǒng)開發(fā)，搶單app快速搭建（搶單功能如何實現(xiàn)原理）

搶單系統(tǒng)，它是一個是什么樣的系統(tǒng)呢？搶單系統(tǒng)火起來的緣由是什么？如今搶單系統(tǒng)已然遍布生活當(dāng)中，可是大家知道搶單系統(tǒng)的內(nèi)容嗎？下面小編說說自己最新了解到的搶單系統(tǒng)是如何的。搶單評論…

投稿用戶
科研百科 2024年9月14日
30
黨風(fēng)廉政黨課講稿農(nóng)發(fā)行

黨風(fēng)廉政黨課講稿農(nóng)發(fā)行尊敬的各位老師、親愛的同學(xué)們：大家好！今天，我很榮幸能夠在這里和大家分享一些關(guān)于黨風(fēng)廉政的內(nèi)容。農(nóng)發(fā)行是中國農(nóng)業(yè)發(fā)展銀行的一個重要組成部分，作為農(nóng)業(yè)發(fā)展…

投稿用戶
科研百科 2024年10月18日
110
山東文化科技重點實驗室申報條件（山東文化科技重點實驗室申報條件是什么）

申報領(lǐng)域文化領(lǐng)域新舊動能轉(zhuǎn)換鄉(xiāng)村振興戰(zhàn)略文化創(chuàng)意產(chǎn)業(yè)創(chuàng)新發(fā)展公共文化科技服務(wù)文化產(chǎn)品創(chuàng)作生產(chǎn)與演藝科技新興文化業(yè)態(tài)培育發(fā)展文化遺產(chǎn)保護(hù)傳承文化市場科技監(jiān)管對外文化交流合作文化科技關(guān)…

投稿用戶
科研百科 2024年4月19日
560
河南省衛(wèi)生系列副高級職稱評審普通外科病歷要求手術(shù)病歷嗎？

河南省衛(wèi)生系列副高級職稱評審普通外科病歷要求手術(shù)病歷嗎？在評審普通外科病歷時，河南省衛(wèi)生系列副高級職稱評審委員會通常要求患者提供完整的手術(shù)病歷。手術(shù)病歷是醫(yī)生記錄手術(shù)過程和結(jié)果的…

投稿用戶
科研百科 2024年10月29日
40
大學(xué)生科研項目申請表范本社會類

大學(xué)生科研項目申請表范本社會類隨著高等教育的不斷進(jìn)步和社會對大學(xué)生科研能力的需求，大學(xué)生科研項目已經(jīng)成為許多大學(xué)生追求學(xué)術(shù)成就和展示自己才華的重要途徑。一份好的科研項目申請表可以…

投稿用戶
科研百科 2024年8月10日
20

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

相關(guān)推薦