国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
寫在前面&筆者的個人理解
背景介紹
問題定義
上下文和術(shù)語
顯式輻射場的3D高斯
學(xué)習(xí)得到的3D高斯用於新視角合成
3D Gaussian Splatting的優(yōu)化
參數(shù)優(yōu)化
密度控制
應(yīng)用領(lǐng)域和任務(wù)
SLAM
動態(tài)場景建模
AIGC
自動駕駛
效能比較
定位效能
#靜態(tài)場景渲染效能
動態(tài)場景渲染效能
#駕駛場景渲染效能
#數(shù)位人體表現(xiàn)
未來研究方向
結(jié)論
首頁 科技週邊 人工智慧 為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF?

為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF?

Jan 17, 2024 pm 02:57 PM
3d 自動駕駛

寫在前面&筆者的個人理解

三維 Gaussian splatting(3DGS)是近年來在顯式輻射場和電腦圖形學(xué)領(lǐng)域出現(xiàn)的一種變革性技術(shù)。這種創(chuàng)新方法的特點是使用了數(shù)百萬個3D高斯,這與神經(jīng)輻射場(NeRF)方法有很大的不同,後者主要使用隱式的基於座標的模型將空間座標映射到像素值。 3D GS憑藉其明確的場景表示和可微分的渲染演算法,不僅保證了即時渲染能力,而且引入了前所未有的控制和場景編輯水平。這將3D GS定位為下一代3D重建和表示的潛在遊戲規(guī)則改變者。為此我們首次系統(tǒng)性地概述了3D GS領(lǐng)域的最新發(fā)展和關(guān)鍵貢獻。首先詳細探討了3D GS出現(xiàn)的基本原理和公式,為理解其意義奠定了基礎(chǔ)。進而深度討論3D GS的實用性。透過促進即時效能,3D GS開啟了大量應(yīng)用,從虛擬實境到互動式媒體等等。此外,還對領(lǐng)先的3D GS模型進行了比較分析,並在各種基準任務(wù)中進行了評估,以突出其性能和實用性。該綜述的結(jié)論是確定了當前的挑戰(zhàn),並提出了該領(lǐng)域未來研究的潛在途徑。透過這項調(diào)查,我們旨在為新來者和經(jīng)驗豐富的研究人員提供寶貴的資源,促進在適用和明確的輻射場表示方面的進一步探索和進步。

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

為了幫助讀者跟上3D GS的快速發(fā)展,我們提供了第一個關(guān)於3D GS的調(diào)查綜述。我們有系統(tǒng)且及時地收集了有關(guān)該主題的最重要的最新文獻,主要來自arxiv。本文的目標是對3D GS的初步發(fā)展、理論基礎(chǔ)和新興應(yīng)用進行全面且最新的分析,突顯其在該領(lǐng)域的革命性潛力。 考慮到3D GS的新生但快速發(fā)展的性質(zhì),本次調(diào)查還旨在確定和討論該領(lǐng)域的當前挑戰(zhàn)和未來前景。我們提供了對3D GS可能促進的正在進行的研究方向和潛在進展的見解。希望透過這篇綜述,不僅提供學(xué)術(shù)知識,還能促進這一領(lǐng)域的進一步研究和創(chuàng)新。 本文的架構(gòu)如下所示:(圖2) 請注意,所有內(nèi)容都是基於最新的文獻和研究成果,旨在為讀者提供關(guān)於3D GS的全面和及時的資訊。

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

背景介紹

本節(jié)介紹了輻射場的簡要公式,它是場景渲染中一個關(guān)鍵的概念。輻射場可以透過兩種主要類型來表示:隱式的,如NeRF,使用神經(jīng)網(wǎng)路進行直接但計算要求高的渲染;和顯式的,如網(wǎng)格,採用離散結(jié)構(gòu)來更快地訪問,但內(nèi)存使用率更高。接下來,我們將進一步探討與相關(guān)領(lǐng)域如場景重建和渲染的連結(jié)。

問題定義

輻射場:輻射場是三維空間中光分佈的表示,它捕捉光如何與環(huán)境中的表面和材料相互作用。從數(shù)學(xué)上講,輻射場可以描述為函數(shù),其中將空間中的一個點和由球面座標指定的方向映射到非負輻射值。輻射場可以透過隱式或明確表示法進行封裝,每種表示都有特定的場景表示和渲染優(yōu)勢。

隱含輻射場:隱式輻射場表示場景中的光分佈,而不明確定義場景的幾何體。在深度學(xué)習(xí)時代,它經(jīng)常使用神經(jīng)網(wǎng)路來學(xué)習(xí)連續(xù)的體積場景表示。最突出的例子是NeRF。在NeRF中,MLP網(wǎng)路用於將一組空間座標和觀看方向?qū)?yīng)到顏色和密度值。任何點的輻射度都不是明確儲存的,而是透過查詢神經(jīng)網(wǎng)路即時計算的。因此,函數(shù)可以寫成:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

這種格式可對複雜場景進行緊湊的、可微分的表示,儘管渲染過程中的計算負載較高,原因是體積光線行進。

明確輻射場:相反,顯式輻射場直接表示離散空間結(jié)構(gòu)中的光分佈,例如體素網(wǎng)格或點集。此結(jié)構(gòu)中的每個元素儲存其在空間中的相應(yīng)位置的輻射資訊。這種方法允許更直接且通常更快地存取輻射數(shù)據(jù),但代價是更高的記憶體使用率和潛在的更低解析度。顯性輻射場表示的一般形式可以寫成:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

#

其中DataStructure可以是網(wǎng)格或點雲(yún),是基於觀看方向修改輻射的函數(shù)。

兩全其美的3D Gaussian Splatting:3D GS表示從隱式輻射場到顯式輻射場的轉(zhuǎn)變。它透過利用3D高斯作為靈活高效的表示,利用了這兩種方法的優(yōu)勢。這些高斯係數(shù)經(jīng)過最佳化,可以準確地表示場景,結(jié)合了基於神經(jīng)網(wǎng)路的最佳化和明確結(jié)構(gòu)化資料儲存的優(yōu)點。這種混合方法旨在透過更快的訓(xùn)練和即時效能實現(xiàn)高品質(zhì)渲染,特別是對於複雜的場景和高解析度輸出。 3D高斯表示公式化為:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

上下文和術(shù)語

許多技術(shù)和研究學(xué)科與3D GS有著密切的關(guān)係,下文將對其進行簡要描述。

場景重建與渲染:粗略地說,場景重建涉及從圖像或其他資料的集合中創(chuàng)建場景的3D模型。渲染是一個更具體的術(shù)語,專注於將電腦可讀資訊(例如,場景中的3D物件)轉(zhuǎn)換為基於像素的影像。早期的技術(shù)是基於光場生成逼真的影像。 structure-from-motion(SfM)和多視圖立體(MVS)演算法透過從影像序列估計3D結(jié)構(gòu)進一步推進了這一領(lǐng)域。這些歷史方法為更複雜的場景重建和渲染技術(shù)奠定了基礎(chǔ)。

神經(jīng)渲染與輻射場:神經(jīng)渲染將深度學(xué)習(xí)與傳統(tǒng)圖形技術(shù)結(jié)合,以建立照片級真實感影像。早期的嘗試使用卷積神經(jīng)網(wǎng)路(CNNs)來估計混合權(quán)重或紋理空間解決方案。輻射場表示一個函數(shù),該函數(shù)描述了透過空間中每個點在每個方向上傳播的光量。 NeRFs使用神經(jīng)網(wǎng)路對輻射場進行建模,從而實現(xiàn)詳細逼真的場景渲染。

體積表示和Ray-Marching:體積表示不僅將目標和場景建模為曲面,還將其建模為填充了材質(zhì)或空白空間的體積。這種方法可以更準確地渲染霧、煙或半透明材料等現(xiàn)象。 Ray-Marching是一種與體積表示一起使用的技術(shù),透過增量追蹤穿過體積的光的路徑來渲染影像。 NeRF分享了體積射線行進的相同精神,並引入了重要性取樣和位置編碼來提高合成影像的品質(zhì)。在提供高品質(zhì)結(jié)果的同時,體積射線行進在計算上是昂貴的,這促使人們尋找更有效的方法,如3D GS。

基於點的渲染:基於點的渲染是一種使用點而不是傳統(tǒng)多邊形來視覺化3D場景的技術(shù)。這種方法對於渲染複雜、非結(jié)構(gòu)化或稀疏的幾何資料特別有效。點可以用額外的屬性來增強,如可學(xué)習(xí)的神經(jīng)描述符,並有效地渲染,但這種方法可能會遇到諸如渲染中的漏洞或混疊效應(yīng)等問題。 3D GS透過使用各向異性高斯來擴展這一概念,以實現(xiàn)場景的更連續(xù)和更有凝聚力的表示。

顯式輻射場的3D高斯

3D GS在不依賴神經(jīng)組件的情況下,在即時、高解析度影像渲染方面取得了突破。

學(xué)習(xí)得到的3D高斯用於新視角合成

考慮一個由(數(shù)百萬)優(yōu)化的3D高斯表示的場景。目標是根據(jù)指定的相機姿勢產(chǎn)生影像?;叵胍幌?,NeRF是透過計算要求很高的體積射線行進來完成這項任務(wù)的,對每個像素的3D空間點進行採樣。這種模式難以實現(xiàn)高解析度影像合成,無法實現(xiàn)即時渲染速度。與此形成鮮明對比的是,3D GS首先將這些3D高斯投影到基於像素的影像平面上,這個過程稱為「splatting」(圖3a)。然後,3D GS對這些高斯進行排序,並計算每個像素的值。如圖所示,NeRF和3D GS的渲染可以被視為彼此的逆過程。在接下來的內(nèi)容中,我們從3D高斯的定義開始,這是3D GS中場景表示的最小元素。接下來描述如何將這些3D高斯用於可微分渲染。最後介紹了3D GS中使用的加速技術(shù),這是快速渲染的關(guān)鍵。

三維高斯的性質(zhì):三維高斯的特徵是其中心(位置)μ、不透明度α、三維協(xié)方差矩陣∑和顏色c。對於與視圖相關(guān)的外觀,c由球面諧波表示。所有屬性都是可學(xué)習(xí)的,並透過反向傳播進行最佳化。

Frustum Culling:給定指定的相機位姿,此步驟將決定哪些3D高斯位於相機的平截頭體之外。透過這樣做,給定視圖之外的3D高斯將不會參與後續(xù)計算,從而節(jié)省計算資源。

Splatting:**在這個步驟中,3D高斯(橢球)被投影到2D影像空間(橢球)中用於渲染。給定觀看變換W和3D協(xié)方差矩陣∑,投影的2D協(xié)方差矩陣∑′使用以下公式計算:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

其中J是投影變換的仿射近似的Jacobian矩陣。

按像素渲染:在深入研究3D GS的最終版本之前,我們首先詳細介紹了其更簡單的形式,以深入了解其工作機制。3D GS利用多種技術(shù)來促進并行計算。給定像素x的位置,其到所有重疊高斯的距離,即這些高斯的深度,可以通過觀看變換W來計算,形成高斯N的排序列表。然后,采用阿爾法合成來計算該像素的最終顏色:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

其中是學(xué)習(xí)的顏色,最終不透明度是學(xué)習(xí)的不透明度和高斯值的乘積:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

其中x′和μ是投影空間中的坐標??紤]到生成所需的排序列表很難并行化,因此與NeRF相比,所描述的渲染過程可能會更慢,這是一個合理的擔憂。事實上,這種擔憂是有道理的;當使用這種簡單的逐像素方法時,渲染速度可能會受到顯著影響。為了實現(xiàn)實時渲染,3DGS做出了一些讓步來適應(yīng)并行計算。

Tiles (Patches):為了避免為每個像素推導(dǎo)高斯系數(shù)的成本計算,3D GS將精度從像素級轉(zhuǎn)移到patch級細節(jié)。具體來說,3D GS最初將圖像劃分為多個不重疊的塊,在原始論文中稱為“tiles”。圖3b提供了tiles的圖示。每個瓦片包括16×16個像素。3D GS進一步確定哪些tiles與這些投影的高斯圖相交。假設(shè)投影的高斯可能覆蓋多個tiles,邏輯方法包括復(fù)制高斯,為每個副本分配相關(guān)tiles的標識符(即tile ID)。

并行渲染:在復(fù)制之后,3D GS將各個tile ID與從每個高斯的視圖變換獲得的深度值相組合。這生成字節(jié)的未排序列表,其中高位表示tile ID,低位表示深度。通過這樣做,排序后的列表可以直接用于渲染(即alpha合成)。圖3c和圖3d提供了這些概念的視覺演示。值得強調(diào)的是,渲染每個tile和像素都是獨立發(fā)生的,這使得這個過程非常適合并行計算。另一個好處是,每個tile的像素都可以訪問公共共享內(nèi)存,并保持統(tǒng)一的讀取序列,從而能夠以更高的效率并行執(zhí)行alpha合成。在原始論文的官方實現(xiàn)中,該框架將tile和像素的處理分別視為類似于CUDA編程架構(gòu)中的塊和線程。

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

簡而言之,3D GS在前向處理階段引入了幾種近似,以提高計算效率,同時保持高標準的圖像合成質(zhì)量。

3D Gaussian Splatting的優(yōu)化

3D GS的核心是一個優(yōu)化過程,旨在構(gòu)建大量的3D高斯集合,準確捕捉場景的本質(zhì),從而促進自由視點渲染。一方面,3D高斯的特性應(yīng)該通過可微分渲染來優(yōu)化,以適應(yīng)給定場景的紋理。另一方面,能夠很好地表示給定場景的3D高斯數(shù)是預(yù)先未知的。一個很有前途的途徑是讓神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)3D高斯密度。我們將介紹如何優(yōu)化每個高斯的性質(zhì)以及如何控制高斯的密度。這兩個過程在優(yōu)化工作流程中是交錯的。由于在優(yōu)化過程中有許多手動設(shè)置的超參數(shù),為了清晰起見,我們省略了大多數(shù)超參數(shù)的符號。

參數(shù)優(yōu)化

損失函數(shù):一旦圖像的合成完成,就將損失計算為渲染圖像和GT的差:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

3D-GS的損失函數(shù)與NeRFs的損失函數(shù)略有不同。由于耗時的ray-marching,NeRF通常在像素級而不是圖像級進行計算。

參數(shù)更新:3D高斯的大多數(shù)特性可以直接通過反向傳播進行優(yōu)化。需要注意的是,直接優(yōu)化協(xié)方差矩陣∑會導(dǎo)致非正半定矩陣,這不符合通常與協(xié)方差矩陣相關(guān)的物理解釋。為了避免這個問題,3D GS選擇優(yōu)化四元數(shù)q和3D矢量s。q和s分別表示旋轉(zhuǎn)和縮放。這種方法允許協(xié)方差矩陣∑被重構(gòu)如下:

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

密度控制

初始化:3D GS從SfM或隨機初始化的稀疏點的初始集合開始。然後,採用點加密和修剪來控制三維高斯的密度。

點密集化:在點密集化階段,3D GS自適應(yīng)地增加高斯密度,以更好地捕捉場景的細節(jié)。這個過程特別關(guān)注幾何特徵缺失的區(qū)域或高斯分佈過於分散的區(qū)域。密集化在一定次數(shù)的迭代之後執(zhí)行,目標是表現(xiàn)出大的視圖空間位置梯度(即,高於特定閾值)的高斯。它涉及在重建不足的區(qū)域克隆小高斯,或在重建過度的區(qū)域分裂大高斯。對於克隆,將建立高斯的副本,並將其移向位置梯度。對於分裂,用兩個較小的高斯代替一個較大的高斯,將它們的規(guī)??s小一個特定的因子。此步驟尋求高斯在3D空間中的最佳分佈和表示,從而提高重建的整體品質(zhì)。

點修剪:點修剪階段涉及移除多餘或影響較小的高斯,在某種程度上可以被視為一個正規(guī)化過程。這一步驟是透過消除幾乎透明的高斯(α低於指定閾值)和在世界空間或視圖空間中過大的高斯來執(zhí)行的。此外,為了防止輸入相機附近高斯密度的不合理增加,在一定次數(shù)的迭代後,將高斯的阿爾法值設(shè)為接近零。這允許控制必要的高斯密度的增加,同時能夠淘汰多餘的高斯。這個過程不僅有助於節(jié)省計算資源,還確保模型中的高斯對場景的表示保持精確和有效。

應(yīng)用領(lǐng)域和任務(wù)

3D GS的變革潛力遠遠超出了其理論和計算的進步。本節(jié)深入探討3D GS正在產(chǎn)生重大影響的各種開創(chuàng)性應(yīng)用領(lǐng)域,如機器人、場景重建和表示、人工智慧生成的內(nèi)容、自動駕駛,甚至其他科學(xué)學(xué)科。 3D GS的應(yīng)用展現(xiàn)了其多功能性和革命性的潛力。在這裡,我們概述了一些最著名的應(yīng)用領(lǐng)域,深入了解3D GS如何在每個領(lǐng)域中形成新的前沿。

SLAM

SLAM是機器人和自主系統(tǒng)的核心運算問題。它涉及機器人或設(shè)備在未知環(huán)境中理解其位置的挑戰(zhàn),同時建立圖環(huán)境佈局。 SLAM在各種應(yīng)用中至關(guān)重要,包括自動駕駛汽車、擴增實境和機器人導(dǎo)航。 SLAM的核心是創(chuàng)建未知環(huán)境的地圖,並即時確定裝置在該地圖上的位置。因此,SLAM對運算密集型場景表示技術(shù)提出了巨大的挑戰(zhàn),同時也是3D GS的良好試驗臺。

3D GS作為一種創(chuàng)新的場景表示方法進入SLAM領(lǐng)域。傳統(tǒng)的SLAM系統(tǒng)通常使用點/曲面雲(yún)或體素網(wǎng)格來表示環(huán)境。相較之下,3D GS利用各向異性高斯來更好地表示環(huán)境。這種表示法提供了幾個好處:1)效率:自適應(yīng)地控制3D高斯的密度,以便緊湊地表示空間數(shù)據(jù),減少計算負載。 2) 準確性:各向異性高斯可以進行更詳細、更準確的環(huán)境建模,尤其適用於複雜或動態(tài)變化的場景。 3) 適應(yīng)性:3D GS可以適應(yīng)各種規(guī)模和複雜的環(huán)境,使其適用於不同的SLAM應(yīng)用。一些創(chuàng)新研究在SLAM中使用了3D高斯飛濺,展示了這種範式的潛力和多功能性。

動態(tài)場景建模

動態(tài)場景建模是指捕捉和表示隨時間變化的場景的三維結(jié)構(gòu)和外觀的過程。這涉及到創(chuàng)建一個數(shù)位模型,該模型準確地反映場景中物件的幾何體、運動和視覺方面。動態(tài)場景建模在各種應(yīng)用中至關(guān)重要,包括虛擬和擴增實境、3D動畫和電腦視覺。 4D高斯散射(4D GS)將3D GS的概念擴展到動態(tài)場景。它結(jié)合了時間維度,允許對隨時間變化的場景進行表示和渲染。這種範式在即時渲染動態(tài)場景的同時保持高品質(zhì)的視覺輸出方面提供了顯著的改進。

AIGC

AIGC是指由人工智慧系統(tǒng)自主創(chuàng)建或顯著改變的數(shù)位內(nèi)容,特別是在電腦視覺、自然語言處理和機器學(xué)習(xí)領(lǐng)域。 AIGC的特點是能夠模擬、擴展或增強人工生成的內(nèi)容,實現(xiàn)從逼真圖像合成到動態(tài)敘事創(chuàng)作的應(yīng)用。 AIGC的意義在於其在各個領(lǐng)域的變革潛力,包括娛樂、教育和技術(shù)發(fā)展。它是不斷發(fā)展的數(shù)位內(nèi)容創(chuàng)作格局中的關(guān)鍵元素,為傳統(tǒng)方法提供了可擴展、可自訂且通常更有效率的替代方案。

3D GS的這種明確特性有助於實現(xiàn)即時渲染功能以及前所未有的控制和編輯水平,使其與AIGC應(yīng)用程式高度相關(guān)。 3D GS的明確場景表示和可微分渲染演算法完全符合AIGC產(chǎn)生高保真度、即時和可編輯內(nèi)容的要求,這對虛擬實境、互動式媒體等領(lǐng)域的應(yīng)用至關(guān)重要。

自動駕駛

自動駕駛旨在讓車輛在沒有人為幹預(yù)的情況下導(dǎo)航和操作。這些車輛配備了一套感測器,包括相機、LiDAR以及雷達,並結(jié)合了先進的演算法、機器學(xué)習(xí)模型和強大的運算能力。中心目標是感知環(huán)境,做出明智的決策,安全且有效率地執(zhí)行機動。自動駕駛對交通運輸具有變革潛力,提供了關(guān)鍵好處,例如透過減少人為失誤提高道路安全性,增強無法駕駛者的機動性,以及優(yōu)化交通流量,從而減少擁塞和環(huán)境影響。

自動駕駛汽車需要感知和解讀周圍環(huán)境,才能安全行駛。這包括即時重構(gòu)駕駛場景,準確識別靜態(tài)和動態(tài)物體,並了解它們的空間關(guān)係和運動。在動態(tài)駕駛場景中,由於其他車輛、行人或動物等移動物體,環(huán)境不斷變化。即時準確地重建這些場景對於安全導(dǎo)航至關(guān)重要,但由於所涉及元素的複雜性和可變性,這是一項挑戰(zhàn)。在自動駕駛中,3D GS可以用於透過將資料點(例如從LiDAR等感測器獲得的資料點)混合成內(nèi)聚和連續(xù)的表示來重建場景。這對於處理不同密度的資料點和確保場景中靜態(tài)背景和動態(tài)目標的平滑準確重建特別有用。到目前為止,很少有作品使用3D高斯對動態(tài)駕駛/街道場景進行建模,與現(xiàn)有方法相比,在場景重建方面表現(xiàn)出優(yōu)異的性能。

效能比較

本節(jié)透過展示我們之前討論的幾種3D GS演算法的效能來提供更多的經(jīng)驗證據(jù)。 3D GS在許多任務(wù)中的不同應(yīng)用,加上每個任務(wù)的客製化演算法設(shè)計,使得在單一任務(wù)或資料集中對所有3D GS演算法進行統(tǒng)一比較變得不切實際。因此,我們在3D GS領(lǐng)域中選擇了三個具有代表性的任務(wù)進行深入的效能評估。性能主要來自原始論文,除非另有說明。

定位效能

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

#靜態(tài)場景渲染效能

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

動態(tài)場景渲染效能

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

#駕駛場景渲染效能

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

#數(shù)位人體表現(xiàn)

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

未來研究方向

儘管近幾個月來3D GS的後續(xù)工作取得了顯著進展,但我們認為仍存在一些有待克服的挑戰(zhàn)。

  • 數(shù)據(jù)高效的3D GS解決方案:從有限的數(shù)據(jù)點生成新穎的視圖和重建場景是非常令人感興趣的,特別是因為它們有可能以最小的輸入增強真實感和用戶體驗。最近的進展已經(jīng)探索了使用深度信息、密集概率分布和像素到高斯映射來促進這種能力。然而,仍然迫切需要在這一領(lǐng)域進行進一步探索。此外,3D GS的一個顯著問題是在觀測數(shù)據(jù)不足的地區(qū)出現(xiàn)偽影。這一挑戰(zhàn)是輻射場渲染中的一個普遍限制,因為稀疏數(shù)據(jù)往往會導(dǎo)致重建不準確。因此,在這些稀疏區(qū)域中開發(fā)新的數(shù)據(jù)插值或積分方法代表了未來研究的一條很有前途的途徑。
  • 內(nèi)存高效的3D GS解決方案:雖然3D GS展示了非凡的能力,但其可擴展性帶來了重大挑戰(zhàn),尤其是當與基于NeRF的方法并置時。后者得益于僅存儲學(xué)習(xí)的MLP的參數(shù)的簡單性。在大規(guī)模場景管理的背景下,這種可擴展性問題變得越來越嚴重,其中計算和內(nèi)存需求顯著增加。因此,迫切需要在訓(xùn)練階段和模型存儲期間優(yōu)化內(nèi)存利用率。探索更高效的數(shù)據(jù)結(jié)構(gòu)和研究先進的壓縮技術(shù)是解決這些限制的有希望的途徑。
  • 高級渲染算法:目前3D GS的渲染管道是向前的,可以進一步優(yōu)化。例如,簡單的可見性算法可能導(dǎo)致高斯深度/混合順序的劇烈切換。這突出了未來研究的一個重要機會:實現(xiàn)更先進的渲染算法。這些改進的方法應(yīng)旨在更準確地模擬給定場景中光和材料特性的復(fù)雜相互作用。一種有前景的方法可能涉及將傳統(tǒng)計算機圖形學(xué)中的既定原理同化和適應(yīng)到3D GS的特定環(huán)境中。在這方面值得注意的是,正在進行的將增強渲染技術(shù)或混合模型集成到3D GS當前計算框架中的努力。此外,逆渲染及其應(yīng)用的探索為研究提供了肥沃的土壤。
  • 優(yōu)化和正則化:各向異性高斯雖然有利于表示復(fù)雜的幾何形狀,但會產(chǎn)生視覺偽像。例如,那些大的3D高斯,尤其是在具有依賴于視圖的外觀的區(qū)域,可能會導(dǎo)致彈出的偽影,視覺元素突然出現(xiàn)或消失,破壞沉浸感。在3D GS的正則化和優(yōu)化方面有相當大的探索潛力。引入抗鋸齒可以緩解高斯深度和混合順序的突然變化。優(yōu)化算法的增強可能會更好地控制空間中的高斯系數(shù)。此外,將正則化納入優(yōu)化過程可以加速收斂、平滑視覺噪聲或提高圖像質(zhì)量。此外,如此大量的超參數(shù)影響了3D GS的泛化,這急需解決方案。
  • 網(wǎng)格重建中的3D高斯:3D GS在網(wǎng)格重建中的潛力及其在體積和表面表示譜中的位置尚待充分探索。迫切需要研究高斯基元如何適用于網(wǎng)格重建任務(wù)。這一探索可以彌合體積繪制和傳統(tǒng)基于表面的方法之間的差距,為新的繪制技術(shù)和應(yīng)用提供見解。
  • 賦予3D GS更多可能性:盡管3D GS具有巨大的潛力,但3D GS的全部應(yīng)用范圍在很大程度上仍未開發(fā)。一個很有前途的探索途徑是用額外的屬性來增強3D高斯,例如為特定應(yīng)用量身定制的語言和物理屬性。此外,最近的研究已經(jīng)開始揭示3D GS在幾個領(lǐng)域的能力,例如,相機姿態(tài)估計、手-物體相互作用的捕捉和不確定性的量化。這些初步發(fā)現(xiàn)為跨學(xué)科學(xué)者進一步探索3D GS提供了重要機會。

結(jié)論

據(jù)我們所知,這篇綜述首次全面概述了3D GS,這是一項革命性的顯式輻射場和計算機圖形學(xué)技術(shù)。它描繪了傳統(tǒng)NeRF方法的范式轉(zhuǎn)變,突出了3D GS在實時渲染和增強可控性方面的優(yōu)勢。我們的詳細分析證明了3D GS在實際應(yīng)用中的優(yōu)勢,特別是那些需要實時性能的應(yīng)用。我們提供了對未來研究方向和該領(lǐng)域尚未解決的挑戰(zhàn)的見解??偟膩碚f,3D GS是一項變革性技術(shù),有望對3D重建和表示的未來發(fā)展產(chǎn)生重大影響。這項調(diào)查旨在作為一項基礎(chǔ)資源,推動這一快速發(fā)展領(lǐng)域的進一步勘探和進展。

開始棄用NeRF?為什么Gaussian Splatting在自動駕駛場景如此受歡迎?

原文鏈接:https://mp.weixin.qq.com/s/jH4g4Cx87nPUYN8iKaKcBA

以上是為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF?的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應(yīng)的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1600
29
PHP教程
1502
276
為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? 為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? Jan 17, 2024 pm 02:57 PM

寫在前面&筆者的個人理解三維Gaussiansplatting(3DGS)是近年來在顯式輻射場和電腦圖形學(xué)領(lǐng)域出現(xiàn)的一種變革性技術(shù)。這種創(chuàng)新方法的特點是使用了數(shù)百萬個3D高斯,這與神經(jīng)輻射場(NeRF)方法有很大的不同,後者主要使用隱式的基於座標的模型將空間座標映射到像素值。 3DGS憑藉其明確的場景表示和可微分的渲染演算法,不僅保證了即時渲染能力,而且引入了前所未有的控制和場景編輯水平。這將3DGS定位為下一代3D重建和表示的潛在遊戲規(guī)則改變者。為此我們首次系統(tǒng)性地概述了3DGS領(lǐng)域的最新發(fā)展與關(guān)

自動駕駛場景中的長尾問題怎麼解決? 自動駕駛場景中的長尾問題怎麼解決? Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關(guān)的問題,所以就想著簡單總結(jié)一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況,即發(fā)生機率較低的可能場景。感知的長尾問題是目前限制單車智慧自動駕駛車輛運行設(shè)計域的主要原因之一。自動駕駛的底層架構(gòu)和大部分技術(shù)問題已經(jīng)解決,剩下的5%的長尾問題,逐漸成了限制自動駕駛發(fā)展的關(guān)鍵。這些問題包括各種零碎的場景、極端的情況和無法預(yù)測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車(AV)中的邊緣情況,邊緣情況是發(fā)生機率較低的可能場景。這些罕見的事件

SIMPL:用於自動駕駛的簡單高效的多智能體運動預(yù)測基準 SIMPL:用於自動駕駛的簡單高效的多智能體運動預(yù)測基準 Feb 20, 2024 am 11:48 AM

原文標題:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving論文連結(jié):https://arxiv.org/pdf/2402.02519.pdf程式碼連結(jié):https://github.com/HKUST-Aerial-Robotics/SIMPLobotics單位論文想法:本文提出了一種用於自動駕駛車輛的簡單且有效率的運動預(yù)測基線(SIMPL)。與傳統(tǒng)的以代理為中心(agent-cent

Sparse4D v3來了!推進端到端3D偵測與追蹤 Sparse4D v3來了!推進端到端3D偵測與追蹤 Nov 24, 2023 am 11:21 AM

新標題:Sparse4Dv3:推進端到端的3D檢測和追蹤技術(shù)論文連結(jié):https://arxiv.org/pdf/2311.11722.pdf需要重新寫的內(nèi)容是:程式碼連結(jié):https://github.com/linxuewu/ Sparse4D重寫的內(nèi)容:作者所屬單位為地平線公司論文想法:在自動駕駛感知系統(tǒng)中,3D偵測與追蹤是兩項基本任務(wù)。本文基於Sparse4D框架更深入研究了這個領(lǐng)域。本文引入了兩個輔助訓(xùn)練任務(wù)(時序?qū)嵗ルs訊-TemporalInstanceDenoising和品質(zhì)估計-Q

選擇相機還是光達?實現(xiàn)穩(wěn)健的三維目標檢測的最新綜述 選擇相機還是光達?實現(xiàn)穩(wěn)健的三維目標檢測的最新綜述 Jan 26, 2024 am 11:18 AM

0.寫在前面&&個人理解自動駕駛系統(tǒng)依賴先進的感知、決策和控制技術(shù),透過使用各種感測器(如相機、光達、雷達等)來感知周圍環(huán)境,並利用演算法和模型進行即時分析和決策。這使得車輛能夠識別道路標誌、檢測和追蹤其他車輛、預(yù)測行人行為等,從而安全地操作和適應(yīng)複雜的交通環(huán)境。這項技術(shù)目前引起了廣泛的關(guān)注,並認為是未來交通領(lǐng)域的重要發(fā)展領(lǐng)域之一。但是,讓自動駕駛變得困難的是弄清楚如何讓汽車了解周圍發(fā)生的事情。這需要自動駕駛系統(tǒng)中的三維物體偵測演算法可以準確地感知和描述周圍環(huán)境中的物體,包括它們的位置、

CLIP-BEVFormer:明確監(jiān)督BEVFormer結(jié)構(gòu),提升長尾偵測性能 CLIP-BEVFormer:明確監(jiān)督BEVFormer結(jié)構(gòu),提升長尾偵測性能 Mar 26, 2024 pm 12:41 PM

寫在前面&筆者的個人理解目前,在整個自動駕駛系統(tǒng)當中,感知模組扮演了其中至關(guān)重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結(jié)果後,才能讓自動駕駛系統(tǒng)中的下游規(guī)控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環(huán)視相機感測器、光達感測器以及毫米波雷達感測器在內(nèi)的多種數(shù)據(jù)資訊感測器來收集不同模態(tài)的信息,用於實現(xiàn)準確的感知任務(wù)?;都円曈X的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結(jié)果能便捷地應(yīng)用於各種下游任務(wù),因此受到工業(yè)

自動駕駛與軌跡預(yù)測看這篇就夠了! 自動駕駛與軌跡預(yù)測看這篇就夠了! Feb 28, 2024 pm 07:20 PM

軌跡預(yù)測在自動駕駛中承擔著重要的角色,自動駕駛軌跡預(yù)測是指透過分析車輛行駛過程中的各種數(shù)據(jù),預(yù)測車輛未來的行駛軌跡。作為自動駕駛的核心模組,軌跡預(yù)測的品質(zhì)對於下游的規(guī)劃控制至關(guān)重要。軌跡預(yù)測任務(wù)技術(shù)堆疊豐富,需熟悉自動駕駛動/靜態(tài)感知、高精地圖、車道線、神經(jīng)網(wǎng)路架構(gòu)(CNN&GNN&Transformer)技能等,入門難度很高!許多粉絲期望能夠盡快上手軌跡預(yù)測,少踩坑,今天就為大家盤點下軌跡預(yù)測常見的一些問題和入門學(xué)習(xí)方法!入門相關(guān)知識1.預(yù)習(xí)的論文有沒有切入順序? A:先看survey,p

FisheyeDetNet:首個以魚眼相機為基礎(chǔ)的目標偵測演算法 FisheyeDetNet:首個以魚眼相機為基礎(chǔ)的目標偵測演算法 Apr 26, 2024 am 11:37 AM

目標偵測在自動駕駛系統(tǒng)當中是一個比較成熟的問題,其中行人偵測是最早得以部署演算法之一。在多數(shù)論文當中已經(jīng)進行了非常全面的研究。然而,利用魚眼相機進行環(huán)視的距離感知相對來說研究較少。由於徑向畸變大,標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述,我們探索了擴展邊界框、橢圓、通用多邊形設(shè)計為極座標/角度表示,並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優(yōu)於其他模型,並同時在用於自動駕駛的Valeo魚眼相機資料集上實現(xiàn)了49.5%的mAP

See all articles