NVIDIA GeForce RTX 4090 İncelemesi

Adanali

Member
NVIDIA, yakın tarihte orijinal bir grafik mimarisiyle birlikte GeForce RTX 4000 serisi ekran kartlarını tanıtmıştı. Ada Lovelace mimarili kartların hükümdarı GeForce RTX 4090, artık ofisimize konuk oluyor.


İlk bilgisayar programcısı olarak kabul edilen Ada Lovelace’ın ismini taşıyan GeForce “Ada” grafik mimarisi, CUDA çekirdeklerinden RT çekirdeklerine, yapay zeka konusunda değerli bir faktör olan Tensor çekirdeklerinden gölgelendirici performansını artıran Shader Execution Reordering SIMD optimizasyonlarına kadar her alanda yenilikler getiriyor.

“Ada” CUDA çekirdekleri, Ampere mimarisi üzerinde fazlaca büyük frekans ve IPC artışları sağlıyor. Yeni kuşak GPU’ların NVIDIA’ya özel olarak optimize edilen TSMC 4nm üretim teknolojisinden faydalandığını biliyoruz. GeForce RTX 4090 ise bu jenerasyon için geliştirilen en büyük GPU olan “AD102” silikonundan gücünü alıyor. AD102 silikonu aslında 18.432 CUDA çekirdeğinin kullanılmasına imkan tanıyor, lakin mevcut amiral gemisi 16.384 CUDA çekirdeğiyle çalışacak biçimde ayarlanmış.

CUDA çekirdeklerinin yanı sıra, 568 Tensor çekirdeğinden 512’si, 142 RT çekirdeğinden 128’i kullanılıyor. Kart ayrıyeten 512 TMU ve 192 ROP ile donatılmış. Tam yapılandırma ise muhtemelen GeForce RTX 4090 Ti için saklanıyor. Mevcuttaki en kuvvetli kart olan 4090, RTX 3090 Ti ile birebir biçimde 21 Gbps süratte çalışan, teorik olarak 1008 GB/sn bant genişliği sunan 24 GB GDDR6X belleklerden yararlanıyor.


NVIDIA, donanımsal ve rasterizasyon açısından jenerasyonlar içinde büyük performans artışları sağlamış. Tüm bunlara bir de devrimsel DLSS 3 teknolojisi dahil olduğunda işler bambaşka bir noktaya geliyor. Sırf RTX 4000 serisine özel olan DLSS 3 teknolojisi, GPU’nun ana grafik sürece sisteminden hariç olarak sadece yapay zeka kullanarak yeni kareler üretebiliyor. Şirket bundan “sinirsel sürece (neural rendering)” olarak bahsediyor ve grafik dünyasına yeni tatekrar getiriyor. Bu hakikaten epeyce kıymetli bir atılım. NVIDIA, yeni teknolojisini rasterizasyon ve ışın izleme tekniklerinin yanında başka bir biçimde konumlandırıyor.

İncelememize konuk NVIDIA GeForce RTX 4090 Founders Edition, yeşil ekil grubun referans dizaynını temsil ediyor. Yeni kuşak kartların genel görünümü RTX 3000 serisiyle birebir kalmış, fakat RTX 4090 hakikaten gösterişli ve fazlaca büyük. RTX 4000 serisi PCI-Express Gen 4 irtibat arabirimini kullanmaya devam ederken, güç mimarisi için PCIe Gen 5 standardına geçiş yapılmış. 12VHPWR ismi verilen yeni 12+4 pin tasarımı, referans tasarım da dahil olmak üzere üretim ortakları tarafınca geliştirilen RTX 4090 modellerinde standart haline geliyor.

Türkiye’de satışa sunulmayan RTX 4090 Founders Edition 1.599 dolarlık fiyatla satışa çıktı. GeForce RTX 4090 ise iki yıl öncesinde 100 dolarlık farkla, 1.499 dolar fiyatla çıkış yapmıştı. Bu ortada, özel soğutmalı RTX 4090 modellerinin 1.999 dolara kadar uzandığını ve hatta birtakım modellerin 2.000 dolar üzerine çıktığını belirtelim. Ülkemizde ise özel dizaynlar 40.000-50.000 lira civarında fiyatlarla satılıyor.

Graphics CardRTX 4090RTX 3090 TiRTX 3090RTX 3080 TiRX 6950 XTArc A770 16GB
MimariAD102GA102GA102GA102Navi 21ACM-G10
Üretim TeknolojisiTSMC 4NSamsung 8NSamsung 8NSamsung 8NTSMC N7TSMC N6
Transistör Sayısı76.3 milyar28.3 milyar28.3 milyar28.3 milyar26.8 milyar21.7 milyar
Kalıp Boyutu608.4 mm^2628.4 mm^2628.4 mm^2628.4 mm^2519 mm^2406 mm^2
SM / CU / Xe-Core1288482808032
GPU Çekirdeği1638410752104961024051204096
Tensor Çekirdeği/
XMX Motoru
512336328320512
Işın İzleme Çekirdeği1288482808032
Boost Frekansı2520 MHz1860 MHz1695 MHz1665 MHz2310 MHz2100 MHz
Bellek Hızı21 Gbps21 Gbps19.5 Gbps19 Gbps18 Gbps17.5 Gbps
Bellek Kapasitesi24 GB24 GB24 GB12 GB16 GB16 GB
Bellek Bant Genişliği384-bit384-bit384-bit384-bit256-bit256-bit
L2 / Infinity Önbellek7266612816
ROP176112112112128128
TMU512336328320320256
TFLOPS FP3282.64035.634.123.717.2
TFLOPS FP16 (FP8/INT8)661 (1321)160 (320)142 (285)136 (273)47.4138 (275)
Bant Genişliği1008 GBps1008 GBps936 GBps912 GBps576 GBps560 GBps
TDP450W450W350W350W335W225W
Liste Fiyatı1,599$1,999$1,499$1,199$1,099$349$

Yukarıdaki teknik özellikler tablosu aslında birfazlaca şeyin göstergesi; transistör sayıları Ampere mimarisine kıyasla neredeyse üç katına çıktı, RTX 4090’daki çekirdek sayıları RTX 3090 Ti’den %52 daha yüksek, GPU saat suratları %35 daha fazla ve 12 kat daha fazla L2 önbellek mevcut. RTX 4090’ın potansiyelini teorik olarak rahatlıkla bakılırsabiliyoruz ve RTX 3090/3090 Ti’ye kıyasla kıymetli farklar var. Fakat GPU’nun ortasında fark yaratan diğer değişiklikler de var.

Eğer ekran kartlarını profesyonel gayeyle kullanacaksanız, bilhassa de derin öğrenme ve yapay zeka alanında iş yapıyorsanız, GeForce RTX 4000 serisi nitekim parasının hakkını verecek bir eser serisi. Ayrıyeten içerik üreten bireyler için de Ada mimarili kartlar ülkü bir seçenek olabilir. Bu işten para kazananlar için zaman=para demek. RTX 4000 serisi kartlar da hakikaten kıymetli gelişmeler sunuyor.

NVIDIA Ada Lovelace mimarisi.

Peki ya oyuncular? RTX 3090 ve 3090 Ti’nin tersine NVIDIA, RTX 4090’ın sırf profesyoneller için tasarlandığını söylemiyor Evet, RTX 4090 profesyoneller için olağanüstü işler çıkaracak. Fakat bu kart hem de GeForce ailesinin bir modülü ve şirket oyun performansı konusunda daima grafik kıyaslamaları yapıyor. RTX 4090 ile yaptığımız testlerde gördüğünüz üzere, yeni amiral gemisi DLSS 3 devre dışı olsa bile nitekim epey kuvvetli. DLSS 3 devreye girdiğinde ise işler esasen apayrı bir hal alıyor.

3. Kuşak Ray Tracing Çekirdekleri

Işın izleme bir kere daha büyük ehemmiyet kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle bir arada çeşitli iyileştirmeler sunuluyor, lakin geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.

NVIDIA Shader Execution Reordering performans hasılatları.

OMM Motoru, yapraklar, parçacıklar ve çitler için çoğunlukla kullanılan dokuların epey daha düzgün işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha süratli Bounding Volume Hierarchy (BVH) oluşturma müddeti sunarak geometrik olarak karmaşık sahnelerin gerçek vakitli ışın takibini mümkün hale getiriyor.

Opacity Micro-Maps (OMM)

Ada GPU ortasında yer alan ışın izleme üniteleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla detay eklemelerini sağlıyor.

Shader Execution Reordering

Gelişmiş ışın izleme, bir sahne boyunca fazlaca sayıda farklı objeye çarpan, epey sayıda ışının hesaplamasını gerektiriyor. bu biçimdelikle çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, öncesinden verimsiz olan bu iş yüklerini dinamik olarak bir daha düzenleyerek fazlaca daha verimli hale getirecek. SER, ışın izleme süreçleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare suratlarını %25’e kadar artırabiliyor.

4. Kuşak Tensor Çekirdekleri

Derin öğrenme ve yapay zeka iş yüklerine gelince, bir daha bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü jenerasyon Tensor çekirdekleri, birinci vakit içinderda Hopper H100 bilgi merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak randımanı 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.

Transformer Engine yardımıyla FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama hüneri iki katına çıkıyor.

AV1 Kodek Desteği

Önceki jenerasyon Ampere ekran kartlarında AV1 kod çözme takviyesi sunulsa da AV1 kodlama takviyesi sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama takviyesi sunan sekizinci kuşak NVIDIA Encoder’a (NVENC) sahip olacak. bu biçimdelikle yayıncılar ve görüntü işiyle uğraşanlar için yeni imkanlar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıyeten 1080p’de yayın yapan kullanıcıların birebir bit suratı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.

RTX 4000 Serisi AV1 ekosistemi.

Ada GPU’lar ayrıyeten çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel görüntü düzenleme için 8K/60 yahut dört adet 4K/60 görüntü kodlamasına imkan sağlıyor. DaVinci Resolve, Adobe Premiere Pro için tanınan Voukoder eklentisi ve Çin’in en güzel görüntü düzenleme uygulaması olan Jianying, AV1 dayanağının yanı sıra çift kodlama takviyesiyle kullanıma sunulacak. NVIDIA ayrıyeten tanınan efekt uygulaması Notch’a AV1 dayanağı getirmek ve Topaz yazılımına çift kodlama dayanağı sunmak için çalışıyor.

DLSS 3, Gerçek Vakitli üç boyutlu Uygulamalarına da Katkı Sağlıyor

Grafik dünyasında üç boyutlu düzenleme yapmak kuvvetli bir tecrübedir. üç boyutlu içerik üreticileri, çalışma yaptığı sıralarda daima önizleme yapmak zorunda kalırlar. Lakin DLSS 3’ün performans kazanımları yardımıyla sanatkarlar, gerçek vakitli render uygulamalarında akıcı ve sıkıntısız biçimde içerik üretebilecekler.

DLSS 3 teknolojisi birinci etapta Unreal Engine, Unity ve Omniverse’e geliyor. üç boyutlu sanatkarları, daha evvel hiç görülmemiş gerçekçilik düzeyleriyle gerçek vakitli etkileşime imkan tanıyan malzemeler, aydınlatma, objeler, karakterler ve sahneler oluşturabilecekler. Sanatkarlar sahnelerinde değişiklikler yaparken manzara anında işlenecek ve süratli geri bildirim alabilecekler.

24 GB GDDR6X Bellek

Bildiğiniz üzere, biroldukça iş yükü için GPU bellek boyutu ve suratları hayli kıymetli. GeForce RTX 4090, öteki iyileştirmelerin yanı sıra 21 Gbps suratında çalışan 24 GB GDDR6X belleğiyle içerik üreticilerin işlerini kolaylaştıracak. Çok sayıda materyal ve doku kullanan, büyük bilgi kümeleriyle çalışan bireyler, ağır GPU kullanmasına gereksinim duyan iş akışlarını rahat yürütebilecek.

DLSS 3, kaliteyi bozmadan FPS oranlarında iki kat ve kimi durumlarda daha yüksek performans artışları getiriyor. Bu hakikaten oyun ve grafik dünyasında ihtilal yaratan bir teknoloji.

DLSS 2’nin tüm özelliklerine ek olarak, bu teknoloji grafik oluşturma süreç çizgisini dahil etmeden sadece yapay zeka kullanarak kareleri oluşturma yeteneğine sahip. DLSS 3 ile değişen her kare, evvelki işlenmiş karenin bir kopyası olmaksızın yapay zeka ile üretilmekte.

NVIDIA DLSS 3 Teknolojisi.

DLSS 3, manzara kalitesi ve cevap verme özelliğini korurken performansı büyük ölçüde artıran yapay zeka dayanaklı grafiklerde ihtilal niteliğinde bir atılım olarak tanımlanıyor. DLSS Frame Generation otomatik kodlayıcısı 4 temel datayı ele alıyor: mevcut ve evvelki oyun kareleri, Ada mimarisinin Optical Flow Accelerator’ı tarafınca oluşturulan bir optik akış alanı, hareket vektörleri ve derinlik üzere oyun motoru dataları.

Optical Flow Accelerator, iki ardışık oyun içi kareyi tahlil ediyor ve bir optik akış alanı hesaplaması yapıyor. Optik akış alanı, piksellerin kare 1’den kare 2’ye hareket ettiği tarafı ve suratı yakalamakta. Optik Akış Hızlandırıcı, oyun motoru hareket vektörü hesaplamalarına dahil edilmeyen parçacıklar, yansımalar, gölgeler ve aydınlatma üzere piksel seviyesinde ayrıntıları yakalama yeteneğine sahip. Aşağıdaki motosiklet meselade, motosikletlinin hareket akışı gölgenin motosiklete nazaran ekranda kabaca birebir yerde kaldığını hakikat bir biçimde temsil etmekte.

Optik Akış Hızlandırıcı, yansıma üzere piksel seviyesindeki efektleri gerçek bir biçimde takip ederken, DLSS 3 ayrıyeten sahnedeki geometrinin hareketini tam olarak izlemek için oyun motoru hareket vektörlerini kullanıyor. Aşağıdaki örnekte oyun hareket vektörleri motosikletçinin yanından geçen yolun hareketini gerçek bir biçimde izlediği (ancak gölgeleri değil) gösterilmiş. Sırf motor hareket vektörlerini kullanarak çerçeveler oluşturmak, gölgede pürüz üzere görsel anormalliklere niye olmakta.

DLSS Frame Generation yapay zeka ağı, her piksel için orta kareler oluşturmak üzere oyun hareket vektörlerinden, optik akış alanından ve sıralı oyun karelerinden gelen ayrıntıların nasıl kullanılacağına karar veriyor. Bu ağ, hareketi izlemek için hem motor hareket vektörlerini birebir vakitte optik akışı kullanarak (aşağıdaki fotoğrafta görüldüğü gibi) hem geometriyi birebir vakitte efektleri hakikat bir biçimde bir daha oluşturabiliyor.


Yapay zeka, DLSS 3 etkinleştirildiğinde birinci karenin dörtte üçünü ve DLSS Frame Generation kullanarak ikinci karenin tamamını bir daha yapılandırıyor. Biraz evvel belirttiğimiz üzere, görüntülenen toplam piksellerin sekizde yedisi bir daha yapılandırılıyor ve performansa büyük katkı sağlanıyor.


DLSS 3’ün Performans Katkısı

NVIDIA’nın tezlerine nazaran muhakkak oyun ve motorlarda klasik işlemeye kıyasla dört kata kadar performans artışı sağlanabiliyor. Erken yaptığımız DLSS 3 testlerine aşağıdaki videomuzdan ulaşabilirsiniz. Yeni şoförler, oyun güncellemeleri ve gelişmiş DLSS 3 takviyesi ile hayli daha düzgününü nazaranbiliriz.


Eskiden içerik üretimi büyük stüdyolar tarafınca yapılırken, artık kişisel geliştiriciler kuvvetli sistemleriyle birlikte üstün görseller sunan içerikler üretebiliyor. NVIDIA, bildiğiniz üzere Game Ready şoförünün yanı sıra Studio şoförüyle profesyonel kullanıcılar için yenilikler ve optimizasyonlar sağlıyor. İşte yeşil ekibin sunduğu birtakım ayrıcalıklar:

  • üç boyutlu, görüntü ve yapay zeka takviyeli işleri hızlandırmak için özel donanım optimizasyonları.
  • Güvenilirliği en üst seviyeye çıkarmak için uygulamalar üzerinde kapsamlı bir biçimde test edilmiş Studio şoförleri.
  • 110’dan fazla tanınan uygulamada RTX donanımı için uygulama optimizasyonları.
  • Ayrıca bu uygulamaların daha süratli çalışmasını sağlayan, Optix, DLSS ve Maxine üzere özel özellikler sunan yazılım geliştirme kitleri.
  • NVIDIA Omniverse, Broadcast, Canvas ve RTX Remix dahil olmak üzere Studio Suite uygulamaları.
RTX 4000 serisiyle birlikte sunulan yenilikler:

  • Canlı yayınlar yapıyorsanız, daha güzel canlı akış kalitesi için AV1 takviyeli yeni sekizinci jenerasyon kodlayıcıdan yararlanabilir, ayrıyeten NVIDIA Broadcast yapay zeka efektleriyle mikrofon ses kalitenizi ve web kamera imajlarınızı güzelleştirebilirsiniz.
  • Video düzenleme işleriyle ilgileniyorsanız, RTX 4000 serisiyle sunulan çift kodlayıcı yardımıyla 2 kata kadar daha yüksek yapay zeka performansı ve 2 kata kadar daha yüksek çıktı performansı elde edebilirsiniz.
  • üç boyutlu sanatkarlar, 3. jenerasyon RT çekirdekleri, gölgelendirici yürütme bir daha düzenlemesi, DLSS 3 ve NVIDIA Omniverse yardımıyla 4K60’ta içerik oluşturabilir.
  • Mod yapımcısıysanız klasik oyunları bir daha düzenleyebilir, RTX Remix ile RTX’i etkin edebilirsiniz.
AV1 ve Yapay Zeka Dayanaklı Yayıncılık

Canlı yayıncılar çoklukla bant genişliğiyle ilgili meseleler (mesela Twitch yahut Discord’un azamî 8 Mbps bit suratı gibi) yaşar. Bu da yayıncıların sunduğu kaliteyi ve çözünürlüğü olumsuz etkilemekte. AV1 ile canlı yayınlar daha ayrıntılı ve daha kusursuz görünecek, artık daha yüksek çözünürlükte yayın yapabilecek. AV1 ayrıyeten HDR ve düşük gecikme yetenekleriyle gelişmiş kodlama özelliklerini de destekliyor.

H.264 ve AV1 kodlama verimliliği.

NVIDIA, AV1 için kesimdeki önde gelen şirketlerle birlikte çalıştığını söylüyor. Tanınan uygulamalardan olan OBS Studio, 2022 Ekim ayında yayınlanacak bir güncellemeden daha sonra NVENC ile AV1 dayanağı sunmaya başlayacak. Bunun yanında, oyuncuların her gün kullandığı Discord, 2022 sonlarında AV1 ile uçtan uca canlı yayın özelliği alıyor.

Video Düzenleme

Adobe Premiere Pro ve Blackmagic Design DaVinci Resolve üzere görüntü düzenleme uygulamaları, CUDA çekirdeklerinin yanı sıra yapay zeka takviyeli Tensor çekirdekleriyle birlikte GPU gücünden yararlanıyor. Renk düzeltme, görüntü kare boyutu dönüştürme, bulanıklaştırma, sertleştirme, manzara sürece efektleri ve RAW belge dönüştürme üzere temel fonksiyonların tümü, gelişmiş GPU teknolojileri yardımıyla her zamankinden daha kısa müddette tamamlanıyor.

RTX 4090 Performansı

RTX 4090, AI Magic Mask kullanmasında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli:

RTX 4090, AI Magic Mask kullanmasında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli.

RTX 4000 serisinde bulunan çift kodlayıcı, yeni algoritma ve mimari performans iyileştirmeleri ile birlikte HEVC/AV1 kodlamasında RTX 3000 serisine nazaran 2 kata kadar daha âlâ performans sağlıyor:

RTX 3000 serisine göre 2 kata kadar daha süratli kodlama.

ON1 Resize AI 2022, daha yüksek çözünürlüklü çıktılar oluşturmak için GPU hızlandırmalı AI fonksiyonelliğini kullanıyor. bu biçimdelikle manzara detaylarından ödün vermeden düşük çözünürlüklü imajlardan yüksek çözünürlüklü imaj çıktıları almamıza imkan veriyor. RTX 4090, ON1 Resize AI 2022’d yapay zeka hızlandırmalı manzara boyutlandırma senaryosunda RTX 3090 Ti’ye kıyasla 1.6 kata kadar daha süratli.

ON1 Resize AI 2022 ile yapay zeka dayanaklı manzara kırpma.

Işın izleme takviyeli sürece, animatörlerin sinemalardaki görsel efektler ve oyunlardaki animasyonlu karakterler üzere fotogerçekçi dijital varlıklar tasarlamasına imkan tanıyor. Bu teknoloji yıllardır Hollywood’da standart olarak kullanılıyor lakin yüksek kuvvetli sunucular ve iş istasyonları gerektiriyor. RTX 4000 serisi ise bu işi son tüketici bazında diğer bir noktaya taşıyor.

Yeni amiral gemisi, ışın izlemeli sürece konusunda en kuvvetli GPU oldu. Bu kart Blender Cycles, Chaos VRay ve Luxion Keyshot üzere görüntü sürece uygulamalarında evvelki jenerasyon RTX 3090 Ti’ye kıyasla 1.9 kata kadar daha süratli kare sürece performansı sunuyor. DLSS 3 ve gölgelendirici yürütme bir daha sıralama özelliğiyle birleştirildiğinde ise gerçek vakitli render uygulamalarında 4 kata kadar daha süratli render performansı elde etmek mümkün.

RTX 4090, ışın izlemeyle manzara sürece konusunda RTX 3090 Ti’den 4 kata kadar daha yeterli performans vaat ediyor.

8K Oyunculuğa Hakikat Adım Adım

AD102 GPU, DLSS 3 Frame Generation ile desteklendiğinde ve Ultra Performans moduna oyunlarda 8K HDR oyun tecrübesine hazır. Ayrıyeten RTX 4090’da bulunan çift kodlayıcılar yardımıyla GeForce Experience üzerinden 8K görüntü oyun çekimi yapabiliyoruz.

NVIDIA, 8K çözünürlüğe giden yolda DLSS 3 faktörünün epeyce değerli olduğunu vurguluyor. İşte şirket tarafınca paylaşılan bir test çizelgesi:

7680×4320 çözünürlük, en yüksek oyun ayarları, DLSS performans modu, oyuna bağlı olarak DLSS Frame Generation özelliği, Core i9-12900K CPU, 32 GB RAM, Windows 11 işletim sistemi.