果然強者的唯一定律是突破自我——NVIDIA于9月1日發(fā)布的最新GeForce RTX 30系列顯卡,采用全新NVIDIA Ampere架構(gòu)GPU核心,在上一代Turing架構(gòu)GeForce RTX 20系列顯卡的基礎(chǔ)上更進一步,而性能甚至超過了GeForce RTX 2080Ti的RTX 3080,售價僅為5000多元,幾乎是前者的一半。
在上一篇“安培的力量——深入解析NVIDIA GeForce RTX 3000系列顯卡”中,我們剖析了基于NVIDIA Ampere架構(gòu)的新一代顯卡從架構(gòu)上有哪些重要革新,包括重新設(shè)計的著色器、第三代Tensor Core和第二代RT Core,以及最新的GDDR6X顯存,RTX I/O等技術(shù)。
得益于NVIDIA和三星定制的8nm制程工藝,采用GA102核心的GeForce RTX 3080擁有283億個晶體管,其CUDA核心數(shù)量達到了驚人的8704個,要知道上一代RTX 2080 Super也僅僅只有3072個,而RTX 2080Ti作為旗艦卡CUDA核心數(shù)量也只達到4352個。
這種碾壓性的晶體管數(shù)量的超越,為RTX 3080帶來的恐怖的性能,也在核心設(shè)計上為GPU內(nèi)部的著色器設(shè)計帶來了巨大的改善——其每一個SM(流式多處理器)的分區(qū)在每個時鐘周期能夠執(zhí)行32次FP32(32位浮點運算)操作,這就使得SM中的全部4個分區(qū)加在一起每個時鐘周期可以進行128次FP32操作——吞吐量翻倍。對于圖形渲染,著色器的工作和計算都是直接受益于FP32運算速度,而光線追蹤等最新的技術(shù)也會被FP32進一步加持。
下面讓我們來看看在實際測試中GeForce RTX 3080的表現(xiàn)。
主要測試環(huán)境:
CPU:AMD Ryzen 7 3700X ——主流高端CPU平臺(CPU天梯排名與Intel i7-10700K,i9-9820X相當)
內(nèi)存:8GB×4 = 32GB 海盜船DDR4-3600——主流內(nèi)存搭配平臺實現(xiàn)四通道,內(nèi)存容量符合主流玩家配置
GPU:NVIDIA RTX 2080Super(作為對比顯卡)、NVIDIA RTX 3080(測試卡)
RTX 3080顯卡的標準跑分:
3DMark Fire Strike ——詮釋DirectX 11對照上代卡的提升
3DMark Time Spy ——DirectX 12 基準測試
3DMark Port Royal —— 顯卡的光線追蹤基準測試
游戲測試:
刺客信條:奧德賽(Assassin's Creed Odyssey)——眾生平等的基準測試
堡壘之夜(Fortnite)——支持光線追蹤的網(wǎng)游
控制(Control)——支持DLSS 2.0的游戲
德軍總部:新血脈(Wolfenstein: Youngblood)——光線追蹤和DLSS測試
邊境(跑分測試)(Boundary Benchmark)——國產(chǎn)游戲大作,支持光線追蹤
光明記憶:無限(Bright Memory: Infinity)——國內(nèi)知名大作,虛幻4.9引擎打造,光線追蹤+DLSS測試
地鐵:離去(Metro Exodus)——早期支持光線追蹤和DLSS的游戲,標桿
我的世界(光追版)(MineCraft(RTX))——不用多說了吧
CPU-Z和GPU-Z是老牌的CPU和GPU信息查看工具,可以最大限度的讀取硬件信息,詳細到緩存大小、制程工藝以及電壓、功耗等。
圖:CPU-Z顯示的AMD Ryzen 7 3700X的數(shù)據(jù)
圖:GPU-Z更新到2.34版本,識別出RTX 3080顯卡的全部信息
AIDA64自帶的基礎(chǔ)測試可以反映GPU和CPU讀寫內(nèi)存的基本性能和一些算數(shù)性能——可以看出CPU對于內(nèi)存讀寫擁有絕對優(yōu)勢,而在單精度計算方面,RTX 3080比R7 3700X快了30倍,雙精度計算方面兩者不相上下,在24位、32位和64位整數(shù)操作方面,GPU大大勝出。超多的CUDA核心也幫助RTX 3080在AES-256和SHA-1 Hash加密計算方面完勝。
下面我們進入重點的性能測試和游戲測試環(huán)節(jié):
3DMark Fire Strike
3DMark Fire Strike是一項適用于高性能游戲電腦和超頻系統(tǒng)的 DirectX 11 基準測試。即使對于最新的顯卡而言,F(xiàn)ire Strike 測試也非常嚴苛。我們用這個測試來對比經(jīng)典的3A游戲在上一代RTX 2080 Super上的成績以及如今RTX 3080的成績——可以刨除RT Core和 Tensor Core來公平的看待可編程著色器的提升。
測試內(nèi)容:
1.顯卡測試1:具有大量曲面細分和體積照明。
2.顯卡測試2:使用 GPU 上的計算著色器和動態(tài)顆粒照明產(chǎn)生復雜的煙霧模擬。
3.物理測試:物理測試在 CPU 上并列運行 32 項柔體和剛體模擬。
4.綜合測試:包括在 GPU 上運行曲面細分、照明、煙霧模擬和顆粒及后處理效果,同時 CPU 則在運行 32 個并行物理模擬。
可以看出,在DirectX 11的跑分中,RTX 3080顯卡性能是上一代主流RTX 2080 Super顯卡的1.5倍,甚至在4K、5K乃至8K分辨率的測試中,差距會逐漸拉大——8K分辨率下性能差距近2倍。新的可編程著色器確實有著效能上的巨大提升。
3DMark Time Spy ——DirectX 12 基準測試
Time Spy是第一個針對DirectX 12的獨立第三方基準測試工具,整個引擎完全基于DX12設(shè)計,可充分壓榨顯卡的DX12性能,測試負載也遠遠高于此前的DirectX 11 Fire Strike。值得一提的是,測試中可以開啟或者關(guān)閉異步計算(Async Compute),因為不是每一種GPU架構(gòu)都支持該特性——NVIDIA的顯卡從Pascal架構(gòu)開始支持這一特性。
測試內(nèi)容:
1.顯卡測試1:具有許多透明的內(nèi)容,顆粒陰影和曲面細分。
2.顯卡測試2:利用數(shù)百個光源和大量微小顆粒來實現(xiàn)光線追蹤體積照明。
3.CPU測試:CPU測試使用物理運算和定制模擬的嚴格組合來測量處理器性能。
3DMark Port Royal —— 顯卡的光線追蹤基準測試
Port Royal 是用于測試實時光線追蹤性能的顯卡基準測試。在GeForce RTX 2080系列顯卡剛推出的時候,是當時市面上唯一的光線追蹤第三方測試工具。該測試結(jié)合了實時光線追蹤和傳統(tǒng)渲染技術(shù)來測量顯卡性能。場景具有光線追蹤反射,陰影(光線追蹤和陰影映射),具有光線追蹤反射的玻璃表面,體積照明,粒子和后處理效果。
實測性能很“哇塞”,光線追蹤在RTX 2080 Super這一代上可以說是初出茅廬,當時廣受玩家質(zhì)疑,游戲少,旗艦卡才能帶得動,幀率一般。而到了這一代NVIDIA Ampere架構(gòu)打造的RTX 3080顯卡,Port Royal在2K分辨率下都能達到52幀,超過1萬分的成績,相比RTX 2080 Super提升了1.6倍,而4K下的成績則提升了近1.7倍。
3DMark DLSS ——基于深度學習的超采樣測試
深度學習超級采樣(DLSS) 是一種 NVIDIA RTX 系列顯卡擁有的獨特技術(shù),它利用深度學習和 AI 的強大能力來提高游戲性能,同時保持視覺質(zhì)量,相比TAA這類全屏抗鋸齒,AI自動“腦補”的平滑畫面和銳利的細節(jié)得到了完美平衡。
3DMark DLSS功能測試會運行 Port Royal 基準測試兩次,以測試 DLSS 性能和圖像質(zhì)量。第一次運行 Port Royal 時,會以輸出分辨率渲染,并停用 DLSS 以測量基線性能。第二輪以較低的分辨率渲染 Port Royal,然后使用 DLSS 處理以達到輸出分辨率所需的幀。在結(jié)果屏幕會報告每次運行的幀率。
在DLSS測試中,開啟了DLSS功能之后,可以明顯看到幀率的上升——Tensor Core分擔了原來由著色器負責的抗鋸齒功能,釋放了大量的計算力。2K分辨率下,RTX 3080開啟DLSS之后幀率達到72.8幀,是關(guān)閉DLSS功能時52幀的1.4倍。而相比同樣開啟了DLSS的RTX 2080 Super的45幀,RTX 3080的幀率提升了1.6倍以上。其他分辨率場景下也有著類似的提升。
總結(jié)一下,在作為基準性能測試的3DMark評測中,可以看出RTX 3080不管是在傳統(tǒng)DirectX 11還是DirectX 12 乃至壓軸的光線追蹤和DLSS測試中均表現(xiàn)出了1.5倍以上的性能提升。我們還觀察到分辨率越高,這種性能提升就越明顯——新的著色器,Tensor Core和RT Core相比上一代RTX 20系列有著名副其實的提升。
下面是游戲測試:
奇點灰燼:擴展版(Ashes of the Singularity: Escalation)
有個傳說,奇點灰燼這個游戲沒人真正的好好玩過,都是用它來做DirectX 12的跑分Benchmark。這可能說的夸張了,但是事實是用奇點灰燼來做基準衡量顯卡的差異還是很有代表性的。
總結(jié)一下游戲的跑分如下表:
在2K分辨率下,RTX 3080 相比RTX 2080 Super有著1.2倍的幀率提升,而在4K分辨率下,則有著近1.4倍的幀率提升——可見這個游戲因為比較古老,因而只有在高分辨率下才會吃顯卡資源,顯示出新顯卡的優(yōu)勢。
刺客信條:奧德賽(Assassin's Creed Odyssey)
又是一款老游戲,我們評測游戲有一個特色,就是喜歡把“古代游戲”拿出來遛一遛,原因在于可以方便玩家對比當年同平臺測試這款游戲的數(shù)據(jù),也可以實際拷問一下新一代顯卡的GPU自身效率是否提升——拋開光線追蹤等等這些新特性,著色器的效率提升有多大,可以用經(jīng)典的老游戲測試出來。
奧德賽DirectX 11游戲的作為基準測試,可以看出來拋開很多“先進”的技術(shù),只從著色器角度來比較,RTX 3080相比上一代顯卡也有著很大的進步——有著1.4倍以上的提升。而相對來說1080P這樣沒什么負擔的“低分辨率”設(shè)定,就讓顯卡有點吃不飽,因此拉不開差距。
堡壘之夜(Fortnite)
9月15號EPIC正式宣布了《堡壘之夜》更新并將于9月17日加入光線追蹤和DLSS特性,在更新游戲版本后,玩家可以體驗到游戲中的圖像質(zhì)量顯著提升后的效果,包括光線追蹤反射、陰影、全局光照和環(huán)境光遮蔽等特效。同時,英偉達的 DLSS 技術(shù)將為游戲在提高幀率的同時,兼顧清晰的畫面。此外,Reflex 技術(shù)還將為游戲降低延遲。
為了凸顯光線追蹤效果,堡壘之夜還將新增一個名為 “RTX Treasure Run”的特殊創(chuàng)造性模式地圖,在該地圖中,玩家將處于博物館入口,面臨尋寶游戲的挑戰(zhàn),可以體現(xiàn)不同的光線追蹤效果。
我們提前拿到了帶有光線追蹤和DLSS 2.0特性的堡壘之夜,相關(guān)測試如下:
只要是DLSS 2.0就會支持三種模式:質(zhì)量、平衡和性能模式,如果算上關(guān)閉,就是四種狀態(tài)。從上圖可以看出,在關(guān)閉光線追蹤時,無論是2K還是4K分辨率下,開啟DLSS都可以大幅度提高幀率——4K分辨率時,RTX 2080 Super只有51幀,而RTX 3080可以達到82幀,但是一旦開啟DLSS,質(zhì)量模式兩者可以同時提升至79幀以及125幀,提升幅度超過50%,而DLSS性能模式下,兩者分別提升到107幀和163幀——提升了2倍以上。
2K分辨率下也有類似的情況,可以說這才是堡壘之夜這款電競游戲應(yīng)該具有的幀率。
那么開啟光線追蹤以后呢?堡壘之夜這種美漫風格的FPS游戲,內(nèi)部光影和穿著皮衣皮褲的人物都帶來了海量的光線反射、折——如果不打開DLSS,即便是2K分辨率下,RTX 3080也只能到33幀,而4K分辨率下則只有16幀——相對的RTX 2080 Super則可憐的只有18幀和9幀。那么打開了DLSS之后,2K分辨率的性能模式下,RTX 3080的幀數(shù)可以達到93幀,而4K分辨率下則能擁有48幀,提升幅度達到3倍左右。RTX 2080 Super也分別可以提升到55幀和44幀。
可見DLSS對于開啟光線追蹤之后的游戲幀率,可以用“大補仙丹”的效果來形容,讓光線追蹤特性幾乎不會額外對顯卡產(chǎn)生消耗,彌補了光線追蹤海量計算帶來的性能下降。而RTX 3080顯卡相對RTX 2080 Super有著1.7倍左右的優(yōu)勢。
控制(Control)
《控制》是一款去年8月發(fā)布的第三人稱動作冒險游戲,畫風看上去與同門作品《量子破碎》頗有幾分相似,兩者還都主打超能力元素。玩家要在超自然的空間中,利用各項超能力、武器和環(huán)境要素,打敗邪惡力量。
游戲里可以選擇開啟光線追蹤的哪些細節(jié)選項,以及高、中、關(guān)掉三種光線追蹤選項。
上圖里開啟和關(guān)閉光線追蹤可以看到地磚反射的光線完全不同,開啟之后更加真實。此外,這款游戲也是支持光線追蹤和DLSS 2.0特性的,可以為玩家提供身臨其境的視效體驗。
和之前測試的堡壘之夜類似,支持DLSS 2.0的《控制》也是擁有一大堆排列組合的測試結(jié)果——明顯的趨勢是4K分辨率下RTX 3080顯卡更能發(fā)揮出優(yōu)勢, 要比RTX 2080 Super幀率提升的多。例如開啟光線追蹤之后,RTX 3080的幀率從62幀掉到40幀,仍然可玩;而RTX 2080 Super則直接從40幀掉到了16幀,變成了幻燈片。
在打開DLSS之后,4K分辨率的性能模式下,RTX 3080的幀率達到了102幀,RTX 2080 Super也攀上了60幀。在2K分辨率下,同時打開光線追蹤和DLSS性能模式,兩者則各自能達到160幀和104幀,幀率提升幅度震撼。
經(jīng)過這幾個測試,我們強烈建議,無論是否打開光線追蹤,都建議各位玩家打開DLSS,這種做法都可以極大地提升游戲幀率——可以說是電競玩家的一針興奮劑。
德軍總部:新血脈(Wolfenstein: Youngblood)
《德軍總部:新血脈》是德軍總部系列游戲重啟之后的第四部外傳性質(zhì)的作品,游戲口碑一般,但是用來做測試是再好不過——這款2019年的游戲支持光線追蹤和DLSS。讓我們來看一下在2K分辨率和4K分辨率模式下的跑分狀況:
圖:2K分辨率下RTX 3080 vs RTX 2080 Super
圖:4K分辨率下RTX 3080 vs RTX 2080 Super
對比2K和4K分辨率分別只打開RT光線追蹤,以及同時打開光線追蹤+DLSS的成績,可以看出來在2K分辨率時,同時打開光線追蹤+DLSS可以極大的提升平均幀率,讓游戲更加流暢,這其中,RTX 3080在只打開光線追蹤時的幀率(147幀)是RTX 2080 Super(90幀)的1.6倍,而同時打開光線追蹤+DLSS,RTX 3080的幀率(191幀)是上代顯卡(122幀)的1.56倍。
但是在4K分辨率時,情況就不一樣了,首先是RTX 2080 Super,可能是因為計算力不足,同時打開光線追蹤+DLSS,幀率反而有了下降(從50幀降到33幀),而RTX 3080則從84幀上升到120幀——這應(yīng)該和第三代Tensor Core有著密不可分的聯(lián)系。4K分辨率下,RTX 3080在只打開光線追蹤時的幀率(84幀)是RTX 2080 Super(50幀)的1.68倍,而打開了光線追蹤+DLSS之后,RTX 3080(120幀)是RTX 2080 Super(33幀)的3.6倍,大幅的碾壓了上代顯卡。
可以說這個測試體現(xiàn)了RTX 3080已經(jīng)在4K分辨率下做好了全面支持光線追蹤+DLSS的準備,而DLSS也確實可以通過人工智能解放GPU的算力,在保證畫面的同時,大大提升光線追蹤開啟后的游戲幀率。
邊境(跑分測試)(Boundary Benchmark)
《邊境》這個游戲是國內(nèi)知名的柳葉刀工作室今年的重磅FPS游戲作品,雖然還沒有正式發(fā)售,但是這兩天放出了支持光線追蹤的基準測試軟件(Raytracing Benchmark),基于《邊境》舞臺背景的測試程序,以全程實時光線追蹤還原出一個更加真實的《邊境》世界。在本月稍晚時,玩家們也能夠下載程序并親自體驗。
邊境這個基準測試最能說明的問題就是在全部打開光線追蹤的前提下,DLSS 2.0的4個模式分別有什么作用——明顯關(guān)閉了DLSS之后,光線追蹤的壓力將游戲幀率壓得很低。2K分辨率下,RTX 3080只有41.8幀,而RTX 2080 Super更是只有23.6幀,堪堪不是幻燈片。而4K分辨率下,不論是RTX 3080還是RTX 2080 Super都變成了幻燈片,幀率分別為19.6幀和9.07幀。
而性能模式的DLSS可以極大的發(fā)揮作用,用已經(jīng)訓練好的AI模型利用Tensor Core做推理,進而釋放著色器和RT Core的計算量,幀率在2K分辨率時,分別達到了99.9幀(RTX 3080)和59.6幀(RTX 2080 Super)。在4K分辨率時,幀率提升到48.8幀(RTX 3080) 和23.1幀(RTX 2080 Super)。
當切換到DLSS質(zhì)量模式時,畫面比性能模式更精細,但是幀率在2K分辨率時也下降到了69.9幀(RTX 3080) 和41.1幀(RTX 2080 Super),而4K分辨率下幀率則只有34.2幀(RTX 3080) 和18.8幀(RTX 2080 Super)。
DLSS平衡模式介于性能模式和質(zhì)量模式之間,幀率也介于兩者之間,這里就不在贅述。值得一提的是,我們注意到在選擇DLSS性能模式時,游戲?qū)︼@卡的顯存占用率并不大,而在選擇DLSS質(zhì)量時最大——我們推測是DLSS所選用的AI模型的精度導致了占用的緩存的大小,越精細的訓練模型占用空間越大,而性能模式用了較小的AI模型,所以也能兼顧一部分幀率。
光明記憶:無限(Bright Memory: Infinity)
《光明記憶:無限》是即將發(fā)售的國內(nèi)知名的FPS游戲,由飛燕群島工作室基于虛幻4.9引擎打造。游戲雖然是FPS第一人稱射擊類型,但是擺脫了傳統(tǒng)的戰(zhàn)斗類型并融合了ACT動作元素。雖然游戲沒有發(fā)售,但是我們在其基準測試中可以測試大量的光線追蹤特效,這個測試有兩種模式:能測試模式,在每次運行完后顯示幀率和幀數(shù)統(tǒng)計信息;演示模式,循環(huán)播放直至用戶退出。四級畫質(zhì)模式供選擇:低、中、高、最高。
據(jù)官方介紹,在光明記憶:無限中使用到了非常多的光追特效:
· 光追焦散(ray traced caustics)
· 光追折射(ray traced refractions)
· 光追反射(透明及不透明表面)(ray traced reflections on translucent & opaque surface)
· 光追陰影(ray traced shadows)
· 光追環(huán)境光遮蔽(ray traced ambient occlusion)
· 光追多層透明(ray traced order-independent transparency, OIT)
這個基準測試擁有相當多的組合,可以看到RT的光線追蹤特性可以選擇:極高品質(zhì)、高品質(zhì)、普通品質(zhì)和低品質(zhì),而DLSS也可以選擇性能模式、質(zhì)量模式和關(guān)閉。排列組合一下,2K和4K分辨率分別能有12個成績。
可以看出,在2K模式下,選擇極高品質(zhì)光線追蹤時,關(guān)閉DLSS之后,RTX 3080的成績只有36幀,而RTX 2080 Super更是只能達到25幀的幀率。而開啟DLSS之后幀率最高可以提升到99幀和56幀,可見DLSS對于光線追蹤的助力相當大。
而在4K分辨率下,極高品質(zhì)的光線追蹤,在關(guān)閉DLSS時RTX 3080只能有16幀,而RTX 2080 Super只有區(qū)區(qū)14幀,測試這個項目的時候基本上是在看幻燈片。而在打開DLSS之后,性能模式下RTX 3080可以達到50幀,RTX 2080 Super可以達到27幀,畫面雖然不卡頓,但是作為FPS游戲,不到60幀談不上流暢,而實際上應(yīng)該在120幀以上才能達到競技的標準。不過我們認為實際游戲上市時應(yīng)該會做更多優(yōu)化,放低一些身段。
地鐵:離去(Metro Exodus)
《地鐵:離去》是一款由4A Games開發(fā)、Deep Silver發(fā)行的第一人稱射擊游戲,本作是地鐵系列的第三作,作為2019年早期發(fā)布的游戲,地鐵這款游戲是很早就支持光線追蹤和DLSS特效的大作,可以看到如下圖,開啟了光線追蹤以后,游戲場景變得更加自然,光照呈現(xiàn)了物理世界應(yīng)有的漫反射,而并不假。
對比兩個顯卡的成績,可以發(fā)現(xiàn),在關(guān)閉了DLSS的情況下,4K分辨率下,打開光線追蹤的RTX 2080 Super只有11.25幀的成績,而RTX 3080則可以擁有33.85的幀率,是前者的近3倍。如果再打開DLSS,RTX 2080 Super的成績可以來到31.51幀,而RTX 3080則可以達到47.74幀的成績——DLSS就像催化劑一樣將幀率提升了一大截。
有意思的是,如果關(guān)閉光線追蹤,只開啟DLSS來抗鋸齒,幀率仍然會大幅上升——RTX 2080 Super從21.95幀上升到40.28幀,而RTX 3080則從34.08幀上升到57.64幀??梢娪肈LSS來取代傳統(tǒng)TAA可以極大的釋放可編程著色器的計算力,進而影響幀率。
我的世界(光追版)(MineCraft(RTX))
自從4月份NVIDIA和微軟聯(lián)合宣布《我的世界》RTX光追版以來,玩家們紛紛感嘆這與之前相比完全是兩個游戲——“路徑追蹤”光線追蹤技術(shù),可模擬光線在整個場景中的傳輸方式,為眾多不同類型的效果提供統(tǒng)一的光照計算模型,是傳統(tǒng)光柵化或混合渲染器難以實現(xiàn)的,其中包括:
- 來自太陽、天空和各種光源的直射光照
- 逼真的清晰陰影和柔和陰影
- 來自發(fā)光石和熔巖等發(fā)射面的光線
- 全局照明
- 水和金屬表面的精確反射
- 可反射、折射和散射的透明材質(zhì),如彩色玻璃、水、冰
- 體積霧和光軸
可以明顯看出有了光線追蹤之后,我的世界里的一草一木一磚一瓦,雖然仍是像素級游戲風格,但是已經(jīng)充滿了真實的光追特效——巖漿仿佛都能感受到溫度。
除了光線追蹤,我的世界里還加入了DLSS,從測試中可以看到,在4K分辨率下,即便是RTX 3080的強大能力,在開啟了光線追蹤而關(guān)閉了DLSS之后,幀率也只能達到31.6幀,RTX 2080 Super更是只有18.7幀。而一旦同時開啟了DLSS,RTX 3080的幀率會飆升到92.2幀,而RTX 2080 Super的幀率也可以達到56.4幀——和之前的游戲一樣,DLSS會極大的釋放著色器的工作負荷,從而提升幀率。
相比之下,2K分辨率下的成績更有意思,尤其是同時開啟光線追蹤和DLSS的時候,RTX 3080異軍突起的成績直達148.6幀,而RTX 2080 Super只有90.9幀——這應(yīng)該是得益于全新RT Core和第三代Tensor Core的共同發(fā)力,再加上新設(shè)計的著色器,在2K分辨率這個甜點上可以充分的配合,發(fā)揮全部性能。
TensorFlow
作為彩蛋,我們還測試了知名的TensorFlow深度學習卷積神經(jīng)網(wǎng)絡(luò)的訓練。要知道很多人,尤其是學生和中小公司,買不起計算卡來做訓練,往往就會去買GeForce系列的顯卡來做CUDA計算——2017年A.I取得突破性的發(fā)展之后,這種趨勢更加明顯。
可以看到RTX 3080相比RTX 2080 Super的長足進步,在深度學習的訓練上有至少37%的提升,VSG11模型的訓練能達到75%以上的性能提升——我們推測這是8704個CUDA核心vs 3072個CUDA核心的優(yōu)勢。
那么為什么不是兩倍以上的提升呢?兩個原因:1.我們只有Windows版最初的驅(qū)動,這里面肯定還有很多優(yōu)化空間,而真實的訓練場景用的是Linux環(huán)境。2.對于新的GPU來說,原來的這些訓練框架有不少值得優(yōu)化的地方,未來可以釋放更多硬件的潛力。
總結(jié)一下,基于NVIDIA Ampere架構(gòu)的GeForce RTX 3080顯卡在我們的測試中確實達到了發(fā)布會上的性能,在幾乎所有的游戲和基礎(chǔ)測試中碾壓了RTX 2080 Super。有網(wǎng)友可能會疑惑為什么我們不拿RTX 2080Ti來做對比測試,有三個原因:
1、RTX 3080的售價是5499元人民幣,理應(yīng)和同價位區(qū)間的顯卡做對比,而RTX 2080Ti售價超過1萬。
2、發(fā)布會上發(fā)布的RTX 3090雖然對應(yīng)的是之前的Titan系列顯卡,主要為專業(yè)人士使用,但是超過萬元的售價似乎更適合于RTX 2080Ti對標。
3、我們認為NVIDIA也許保留了RTX 3080Ti在未來的某個時候發(fā)布,因而應(yīng)該把和RTX 2080Ti的對比測試留到那時候。
2018年底我們在深度解析第一代支持光線追蹤的GeForce RTX 2080Ti顯卡時曾經(jīng)感嘆,RT Core和Tensor Core這兩種核心將徹底改變計算機圖形領(lǐng)域和整個游戲產(chǎn)業(yè),時間證明了這個趨勢,而NVIDIA用自己的Ampere架構(gòu)進一步夯實了光線追蹤+DLSS的未來——RTX 3080用親民的價格,強大的性能,將光線追蹤和第二代DLSS全面帶入4K時代,黃教主又一次證明了自己的遠見卓識。
聯(lián)系客服