2023-05-23
US$399、128bit 介面夠用嗎 !?
NVIDIA GeForce RTX 4060 Ti FE 顯示卡實測
文: John Lam / 台北出差中


NVIDIA 發佈全新主流級 GeForce RTX 4060 Ti 顯示卡,採用 AD106-350 繪圖核心、具備 4,352 個 CUDA Core、34 個 RT Core 及 128 個 Tensor Core,8GB GDDR6 記憶體但只有 128bit 介面真的夠嗎 !? NVIDIA 表示在 DLSS 3 下性能較 RTX 3060 Ti 快 70%,那沒有 DLSS 呢 ? HKEPC 找來 RTX 3060 Ti / 3070 Ti 與 RTX 4060 Ti 進行比對測試。



升級第 4 代 Tensor Cores、全新 DLSS 3 技術

 

 

AD102

 

 

Tensor Cores 是專門為在 AI 和 HPC 應用程序中使用的矩陣乘法和累加數學運算量身定制的高性能運算,可以用於為矩陣計算提供了突破性的性能,這對於深度學習神經網絡訓練和邊緣發生的推理針對遊戲應用層面,Tensor Cores 其中一個重點就是加入全新 DLSS 深度學習超級採樣技術,透過深度神經網絡提取渲染場景的多維特徵,並智能地組合來自多個幀的細節,以構建高質量 3D 影像。與傳統的 AA 技術相比,DLSS 使用更少的輸入樣本,同時避免了透明度和其他復雜場景元素的算法難度。

 

全新 Ada Lovelace GPU 微架構升級至第 4 代 Tensor Cores 運算單元,相較上代在 FP16、BF16、TF32、INT8 和 INT4 性能提升2 倍以上,新增 FP8 運算能力 AD102 可提供超過 1.3 PetaFLOPS 的張量處理,並且升級至 DLSS 3 技術能透過深度學習使用 AI 生成整幀以大幅提升性能。

 

 

AD102
▲ NVIDIA DLSS 2 技術原理

 

 

AD102

▲ NVIDIA DLSS 3 技術原理

 

 

DLSS 3 技術是將先前 DLSS 2 技術,透過 Tensor Cores 運動矢量運算與超分辨率技術下,在幀與幀之間加插由以 AI 運算生成的新幀,啟用 DLSS 3 後,AI 將使用 DLSS 超分辨率重建第一幀的 3/4,並使用 DLSS AI 幀生成重建整個第二幀,因此 DLSS 3 重建了總顯示像素的 7/8,因此顯著提高了性能。

 

 

AD102

 

 

為了令 AI 幀成生的影像不會出現重影、卡頓和模糊等偽影, ADA Lovelace GPU 新增 Optical Flow Accelerator 光流加速器,它能捕獲粒子、反射、陰影和照明等資訊,DLSS 3 可以計算場景中的一切是如何從一個像素移動到另一個像素的,令遊戲畫面不會出現異常重建。

 

更重要的是 DLSS 3 可以減低 CPU 造成的性能瓶頸,一些需要 CPU 物理模擬的遊戲例如 Microsoft Flight Simulator,對於 CPU 的性能要求十分高,因此 GPU 經常處於空閒狀態等待指令,DLSS 3 可以將 CPU 密集型遊戲轉換為 GPU 密集型遊戲,因為在 AI 生成幀中全由 GPU 負責,因此在執行 CPU 受限的遊戲,例如那些需要大量物理或涉及大型世界的遊戲, GeForce RTX 40 系列顯卡在相同 CPU 運算能力下,幀速率高達兩倍的幀速率進行渲染。

 

 

AD102

 

 

NVIDIA 指出支援 DLSS 3 的遊戲將會加速上市,當 5 月 23 日 GeForce RTX 4060 Ti 發售時,已有超過 32 款 DLSS 3 遊戲發佈,再加上支援 DLSS 2 Super Resolution 技術的遊戲將會有 300 款,將會為玩家帶來更好的遊戲體驗。

 

 

 

升級第 8 代 NVENC 編碼引擎

 

AD102

 

 

為提升 GPU 編輯性能,AD106 GPU 配搭了第 8 代 NVENC 編碼器,上代 Ampere GPU 只提供 AV1 解碼支援,Ada Lovelace 新增 AV1 編碼支援能力,其編碼效率相較 H.264 編碼器提升了 40%,可支援 8K/60 HDR 或是同時為 4 個 4K/60 HDR 影片編碼運算。

 

解碼器方面,AD106 GPU 與上代一樣擁有第 5 代 NVDEC 解碼器,支持 MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1 視頻格式的硬件加速視頻解碼,支援 8K/60 解析度。

 

 

▲ 在同等位元率設定下 H.264 (左) 及 AV1 (右) 的畫質表現對比

(建議以 4K 解析度觀看影片)

 

 

由於 AV1 編碼格式比 H.264 格式的編碼效率提升了 40%,變相在相同的位元率設定下 AV1 能提供更高的畫面品質,從上述的比較影片中可以看到左面的 H.264 編碼格式無法在 8Mbps Bandwidth 下滿足 4K 60FPS 的內容,出現了大量不連續的小方塊,反之 AV1 在相同位元率下卻仍能提供清晰的動態畫面,兩者可說是高下立見。

發表評論