NVIDIA DLSS 3很好地解釋了:您需要了解的有關功能和兼容性的一切

新系列GeForce RTX 4000現在是一個現實:由NVIDIA首席執行官Jensen Huang宣布,在GTC 2022年期間,將在今年秋天以三種不同的版本到達。

RTX 4090,新的旗艦Nvidia,憑藉其24 GB的視頻記憶,將於10月12日開始使用,而RTX 4080將於11月到達,但有兩個不同的版本:一個16和一個12 GB,一個約300歐元的價格差異。 。

顯然,與上一系列系列相比,新視頻卡的性能有所提高,但是在演講中,Huang非常重視了該領域的創新人工智慧。因此,很明顯,公司如何將很多關注的重點放在可以使卡片以智能方式工作的技術開發上,而不僅僅是純硬件功率的增加。

實際上,在新穎性中DLSS 3,NVIDIA深度學習技術的新迭代。一種已經特別有用的工具,並且在某些方面令人驚奇,它已經設法減輕了整個RTX系列的工作量,現在,隨著4000系列的更新,它可以更好地使用可用的資源並增加圖形性能。 DLSS 3將由三個主要要素組成:超級分辨率,NVIDIA反射和框架產生。

在公司研究學習部分副總裁La Stampa的封閉式會議上,進入了該技術的細節,深入告訴我們新DLSS 3的主要特徵。

由Stefano Vinci編輯

什麼是DLSS?

新的NVIDIA GEFORCE RTX家族

“當我們開始與Ray Tracing RTX合作時,我們知道我們會發現自己處於非常激烈的計算工作之前。我們也知道,使用Brutque Force面對問題並不是解決方案,但是我們立即註意到了這一點人工智能領域的進步到來。 Bryan Catanzaro-副總裁,應用深度學習研究

結果是DLSS((深度學習超級抽樣),一種基於密集使用的技術張量芯在RTX系列的GPU中:通過機器學習和人工智能,DLSS可以從較低的分辨率開始重新創建高分辨率圖像。該功能以超級分辨率為名,並使您可以減少單個幀渲染中的工作量,從而使圖像的一部分為人工智能。這樣,GPU可以更敏捷地工作,從而在屏幕上計算出較低量的像素。顯然,這轉化為性能的提高:更高的幀分期付款和更大的響應能力,即使在高分辨率和有效的射線追踪效果下也是如此。

最初,IA被“訓練”以重建特定視頻遊戲的框架,例如《戰地風雲V》和《地鐵外出埃及記》。一個成功的第一個實驗,但是需要為每個支持的標題對人工智能進行專門的人工智能培訓。

DLSS 2的操作

這導致開發人員引入神經圖形框架(NGX),該協議通過數以萬計的高分辨率圖像來訓練神經網絡。由於使用了該新工具,該網絡實際上學會了重建遊戲框架,該遊戲幀以低分辨率計算和渲染,將圖像恢復到更高的分辨率。

由NVIDIA管理的一種升級,但是並不限於在源圖像上工作。 DLSS還考慮了遊戲引擎生成的運動的運動:這些不過是由引擎實時計算的簡單信息,該信息指示場景中的對像從框架移動到另一個方向。有了這些數據,網絡能夠識別移動元素並估計下一幀的外觀。

最後,將傳統上渲染的框架(以低分辨率)與生成的最後一個高分辨率框架進行了比較,以確定如何對要在屏幕上顯示的新圖像重建進行重建。
簡而言之,以DLSS 2.0的名稱為初始技術的更新,向前介紹了一步。

框架生成

DLSS 3操作

該團隊現在為第三代RTX體系結構Ada Lovelace工作是該技術的另一個更新,該技術將成為真正的DLSS 3。

除了AI通過超級分辨率重建圖像重建的經驗(現在是在屏幕上生成大多數像素的經驗),此新版本還引入了一個過程整個框架的產生,這將使您以更清晰的方式提高性能。

以低分辨率渲染並由超級分辨率重建的“混合”框架與完全由AI生成的框架交替。一個稱為精確的過程框架生成因此,這使您還可以對處理器的性能產生積極影響,特別是在需要CPU出色工作的遊戲中,例如Microsoft Flight Simulator,該遊戲必須管理大量元素的模擬。

為什麼框架發電不包括4000系列?

由於運動向量和光流的結合,重建的框架沒有圖形偽像

為了利用這種新功能,GeForce RTX 4000系列的新卡配備了第四代張量芯張量,能夠同時管理每個框架的幾個神經過程,並且光流加速器,專門針對新的體系結構Ada Lovelace,專門針對框架生成的關鍵過程之一。

Catanzaro解釋說:“獲得正確一代框架的挑戰絕對要求,這就是為什麼沒有人尚未嘗試使用該系統的原因。” “我們必須確保對象連貫地移動,而沒有工件或扭曲。在不考慮必須處理遊戲接口和場景的變化的情況下,必須使用真正的無限延遲來計算所有這些,以便為了成為能夠保持幀速率高” 。

實際上,新的體系結構Ada Lovelace已開發出使用新的光流過程。
這是一個研究過程,旨在認識框架和下一個框架之間圖像的變化,以便能夠識別和預測所涉及的元素的運動,以便人工智能可以乾預以更改下一個圖像以查看下一個圖像。與用DLSS 2引入的運動載體系統相比,差異在於與射線追踪效應的接口方式。

如果沒有光流的干預,則無法正確計算陰影

通過僅從移動載體提供的信息開始,實際上,通過追踪光(首先是兩個示例:陰影和反射)直接影響甚至生成的某些元素,這些元素會直接影響甚至產生。最終產生了煩人的文物圖形。之所以發生這種情況,是因為傳輸純幾何信息的運動運動無法(即使在傳統上呈現的圖像的支持下,也沒有傳統的渲染圖像,甚至在低分辨率下)都無法提供II的詳細信息,以通過射線跟踪管理光線的細節以及它與屏幕元素的相互作用。

為了了解我們,一輛在其下方的道路上投射的行駛汽車的陰影不會隨著汽車加速而隨著道路而移動。與當然應該找到自己的位置相比,這完全由AI完全由AI產生,顯示了陰影稍微移動,而該幀的間隔是通過超級分辨率生成的“混合”幀的間隔,從而導致間歇性的閃爍效果。

超級分辨率和框架生成的替代操作

硬件和軟件的組合導致GeForce RTX 4000系列的可怕性能提高

但是,使用經典的運動向量,結合光流提供的像素搜索系統,可以識別這些情況並以可信的方式重新創建最複雜的射線追踪效果。
光流加速器是專門為ADA Lovelace和RTX 4000系列開發的硬件組件,因此您可以在框架生成過程中正確使用關鍵工具。

正是由於這個原因,所討論的過程仍然是GeForce RTX 4000的獨家功能:正如我們所說,新功能基於一系列技術,並且僅基於新的NVIDIA卡中的硬件:光流程主要由4000(光流加速器4000)上的專用硬件組件管理,這是AI完全管理的幀的生成框架的重要元素。由於射線跟踪的效果,由於架構ADA Lovelace的恢復,在沒有恢復的數據的支持的情況下使用框架生成。從資源來渲染圖像的角度方面,後者仍然是最豁免的組成部分,以至於它是最初構思DLSS的主要要素。

nvidia反射

帶有和沒有NVIDIA反射的渲染管道

在Rodato超級分辨率和新的框架生成過程之後,帽子 - 飾有由nvidia反射,協調CPU和GPU之間交換的信息流,從而可以顯著減少輸入的延遲。

由於渲染管道的優化,這是可能的:通常,輸入從我們的外圍設備,鼠標,鍵盤或控制器開始,並由CPU嘗試。在這一點上,處理器將輸入插入渲染尾部,視頻卡可以從中釣到指令以在屏幕上製作圖像。傳統系統以這種方式構建,以使GPU始終有一個指令隊列,一旦上一個處理結束,就可以從中繪製,從而能夠不斷地工作而不會放慢腳步。但是這種指示的尾巴稱為渲染隊列,不可避免地涉及一定潛伏期在包含Aput及其實際屏幕估算之間。

Nvidia Reflex除了將CPU和GPU放置在直接通信中,以便可以直接從視頻卡處理器發送指令。由於兩個組件之間存在協調,因此可以使用正確的時機傳輸指令,以便在先前的工作結束時不斷提供GPU。這樣,視頻卡可以“跳過尾巴”(從字面上看),並在按鈕的壓力和屏幕上顯示的動作之間節省珍貴的毫秒。

將在發布會上支持DLSS 3的遊戲

現在,此功能成為DLSS 3的正確功能以及想要在其標題中使用技術更新的開發人員的基礎,將必須確保遊戲引擎與反射的兼容性。

在10月,我們將開始看到第一場比賽,並全力支持DLSS 3,最初將超過35。這使DLSS 3成為行業最快採用的技術更新之一。

他們支持DLSS 3哪些卡?

DLSS 3與各種Nvidia GeForce視頻卡的兼容性

這三種技術的結合賦予了新的DLSS 3的生命,儘管這些DLSS 3不包括4000系列,但所有一代的圖形卡都不會以相同的方式支持。那裡相容性實際上,它可以在整個RTX系列中確保,但是在某些情況下可能無法使用一個或多個功能。

NVIDIA反射也可以在RTX革命之前的卡上使用,包括GeForce 900系列的所有視頻卡。

關於超級結果的演講不同,這必定需要GeForce RTX,20、30或40系列。

框架生成過程是新的GeForce RTX 4000中僅可用的唯一實際獨家功能。正如我們所說,這是因為新功能基於一系列技術,並且僅基於新的NVIDIA卡中存在的硬件:光流過程,主要由其硬件組件專用於4000(光流加速器)。