AMD, 3 Kasım 2022’de Radeon RX 7900 serisi ekran kartlarına ait temel detayları deklare etti. Sunumda yeni ekran kartları ve yeni RDNA 3 mimarisi hakkında kimi bilgiler verildi lakin birden fazla şey eksikti. Artık RDNA 3 mimarisinin bilgilerina derinlemesine bakış atacağız.
Kırmızılılar yeni mimarisiyle bir arada rakibi NVIDIA’ya bir adım daha yaklaştı. En kıymetli ayrıntıya baştan değinecek olursak, fazlaca yongalı yapısı yardımıyla GPU tasarımı baştan aşağı değişti.
Daha evvel birfazlaca sefer belirttiğimiz üzere, RX 7900 serisinde Navi 31 isimli üst sınıf bir GPU kullanılıyor. Navi 31, Grafik Süreç Kalıbı (GCD) ve Bellek Önbellek Kalıbı (MCD-Memory Cache Dies) olmak üzere iki temel kesimden meydana geliyor. AMD’nin Zen 2/3/4 işlemcilerinde benimsenen çiplet dizaynla benzerlikler var, fakat her şey grafik dünyasının gereksinimlerine uyacak biçimde tasarlanmış. Diğer bir deyişle, kırmızı ekip işlemci tarafındaki tecrübelerini grafik cephesine aktarmayı başarmış.
Navi 21 GPU özellikleri
AMD Zen Mimarisinin Temeli
AMD, Zen 2 ve daha sonrasındaki işlemcilerde sistem belleğine bağlanan ve PCIe Express arayüzü, USB irtibat noktaları ve entegre grafik işlemcisi (Zen 4 ile geldi) üzere üniteleri barındıran bir Giriş/Çıkış Kalıbı (IOD) kullanıyor. İçerisinde biroldukca başka ünite barındıran bu yonga, AMD’nin Infinity Fabric teknolojisiyle bir yahut birden çok CCD’ye (Core Compute Die yahut Core Complex Die) bağlanıyor. Bu CCD’ler ise CPU çekirdeklerini, önbellek ünitesini ve farklı bileşenleri içeriyor.
Çekirdekleri ortasında barındıran üniteler küçük yapıdayken, IOD yaklaşık 125 mm² (Ryzen 3000) ile 416 125 mm² (EPYC xxx2 nesil) içinde değişkenlik gösterebiliyor. En son teknolojileri barındıran Zen 4 mimarisinde işler biraz daha değişti. Ryzen 7000 işlemcilerde CCD’ler TSMC N5 (5nm), IOD TSMC N6 (6nm) teknolojisine dayanıyor. Yani bu biçimde yapılarda gereksinime ve maliyetlere nazaran kullanılan teknolojiler farklılık gösterebiliyor. Bu da aslında üreticiler için kıymetli bir avantaj.
RDNA 3 Mimarisine Derinlemesine Dalış
Şimdi gelelim asıl mevzumuza. GPU’lar bildiğiniz üzere farklı ihtiyaçlara sahip ve fazlaca farklı yapıda. Grafik süreç üniteleri, tüm GPU çekirdeklerini beslemek için bol bol bellek bant genişliğine gereksinim duyar. Örneğin, 12 kanallı DDR5 yapılandırmasına sahip devasa EPYC 9654 bile ‘yalnızca’ 460,8 GB/s’ye kadar bant genişliği sunuyor. RTX 4090 ve RTX 3090 Ti üzere ekran kartları ise bu ölçüleri ikiye katlarken 1 TB/sn düzeyinde bant genişliğine sahip.
GPU yongalarının tesirli bir biçimde çalışması için AMD’nin farklı bir şey yapması gerekiyordu. Şirket mühendisleri tahlili CPU yapılandırmasının tam karşıtını uygulamakta buldu: ana süreç merkezi olarak GCD kullanılırken, bellek denetimcileri ve önbellek birden çok küçük yongaya yerleştirildi.
GCD ismi verilen ünite görüntü kodlama donanımı, ekran arayüzleri ve PCIe ilişkisi üzere öbür temel fonksiyonlarla bir arada Bilgi Süreç Ünitelerini (Compute Unit olarak biliniyor) ortasında barındırıyor. Navi 31 GCD, tipik grafik sürece vazifelerini üstlenmek üzere 96 adede kadar CU barındırabiliyor. AMD, GCD’yi gelişmiş Infinity Fabric teknolojileriyle çipin etrafına yayılan MCD’lere ve kartın geri kalanına bağlıyor.
Adından da anlaşılacağı üzere, MCD’ler (bellek kalıpları) büyük L3 önbellek bloklarını (Infinity Cache) ve fizikî GDDR6 bellek arayüzünü içeriyor. birebir vakitte, MCD’lerin GCD’ye bakan tarafında Infinity Fabric kontakları yer alıyor.
AMD, TSMC’nin N5 teknolojisini kullanarak 300 mm² boyutundaki Navi 31 GCD’ye 45.7 milyar transistör entegre etmeyi başardı. TSMC N6 bandından çıkan 37 mm² boyutundaki MCD’lerde ise 2.05 milyar transistör bulunmakta.
Yüksek Performanslı Orta Temas Teknolojileri: Fanout
Çipler ortası ara ilişki teknolojileri kelam konusu olduğunda birfazlaca kaygı ortaya çıkar. Bu noktada birinci vakit içinderda Infinity Fabric irtibatlarının gerektirdiği güç (harici çipler neredeyse her vakit daha fazla güç kullanır) akıllara geliyor. Bunun yanında, irtibat teknolojisinin verimliliği ve suratı hayli kıymetlidir.
1 – 3
Örnek olarak, Zen CPU’larda üretimi nispeten ucuz olan organik bir alt katman orta kesimi var, fakat 1,5 pJ/b (bit başına pikojul) tüketmekte. Misal bir yaklaşımı 384 bitlik arayüzde kullanmak çok yüksek güç tüketimine yol açacaktı, bu niçinle AMD Navi 31 ile arayüzü geliştirmek için fazlaca gayret harcadı.
Sonuç olarak ortaya “Fanout” orta ilişkisi olarak isimlendirilen bir tahlil çıktı. Slaytlar her şeyi kapsamlı biçimde açıklamıyor, fakat sunum görsellerinde CPU’lar (CPU chiplet bandwidth) ve GPU’larda (MCD bandwidth) sunulan bant genişliğinin farkını nazaranbilirsiniz.
AMD RDNA 3 mimarisi.
İşlemcilerde 25 orta temas bulunurken, GPU’lar için kullanılan 50 orta ilişki daha küçük bir alana yerleştiriliyor. Bu da güç ihtiyaçlarını kıymetli ölçüde azaltıyor. AMD, tüm Infinity Fanout kontakları toplamda 3,5 TB/s aktif bant genişliği sağlarken toplam GPU güç tüketiminin sadece %5’inden azını oluşturduğunu söylüyor.
Kırmızılılar yeni mimarisiyle bir arada rakibi NVIDIA’ya bir adım daha yaklaştı. En kıymetli ayrıntıya baştan değinecek olursak, fazlaca yongalı yapısı yardımıyla GPU tasarımı baştan aşağı değişti.
Daha evvel birfazlaca sefer belirttiğimiz üzere, RX 7900 serisinde Navi 31 isimli üst sınıf bir GPU kullanılıyor. Navi 31, Grafik Süreç Kalıbı (GCD) ve Bellek Önbellek Kalıbı (MCD-Memory Cache Dies) olmak üzere iki temel kesimden meydana geliyor. AMD’nin Zen 2/3/4 işlemcilerinde benimsenen çiplet dizaynla benzerlikler var, fakat her şey grafik dünyasının gereksinimlerine uyacak biçimde tasarlanmış. Diğer bir deyişle, kırmızı ekip işlemci tarafındaki tecrübelerini grafik cephesine aktarmayı başarmış.
Navi 21 GPU özellikleri
AMD Zen Mimarisinin Temeli
AMD, Zen 2 ve daha sonrasındaki işlemcilerde sistem belleğine bağlanan ve PCIe Express arayüzü, USB irtibat noktaları ve entegre grafik işlemcisi (Zen 4 ile geldi) üzere üniteleri barındıran bir Giriş/Çıkış Kalıbı (IOD) kullanıyor. İçerisinde biroldukca başka ünite barındıran bu yonga, AMD’nin Infinity Fabric teknolojisiyle bir yahut birden çok CCD’ye (Core Compute Die yahut Core Complex Die) bağlanıyor. Bu CCD’ler ise CPU çekirdeklerini, önbellek ünitesini ve farklı bileşenleri içeriyor.
Çekirdekleri ortasında barındıran üniteler küçük yapıdayken, IOD yaklaşık 125 mm² (Ryzen 3000) ile 416 125 mm² (EPYC xxx2 nesil) içinde değişkenlik gösterebiliyor. En son teknolojileri barındıran Zen 4 mimarisinde işler biraz daha değişti. Ryzen 7000 işlemcilerde CCD’ler TSMC N5 (5nm), IOD TSMC N6 (6nm) teknolojisine dayanıyor. Yani bu biçimde yapılarda gereksinime ve maliyetlere nazaran kullanılan teknolojiler farklılık gösterebiliyor. Bu da aslında üreticiler için kıymetli bir avantaj.
RDNA 3 Mimarisine Derinlemesine Dalış
Şimdi gelelim asıl mevzumuza. GPU’lar bildiğiniz üzere farklı ihtiyaçlara sahip ve fazlaca farklı yapıda. Grafik süreç üniteleri, tüm GPU çekirdeklerini beslemek için bol bol bellek bant genişliğine gereksinim duyar. Örneğin, 12 kanallı DDR5 yapılandırmasına sahip devasa EPYC 9654 bile ‘yalnızca’ 460,8 GB/s’ye kadar bant genişliği sunuyor. RTX 4090 ve RTX 3090 Ti üzere ekran kartları ise bu ölçüleri ikiye katlarken 1 TB/sn düzeyinde bant genişliğine sahip.
GPU yongalarının tesirli bir biçimde çalışması için AMD’nin farklı bir şey yapması gerekiyordu. Şirket mühendisleri tahlili CPU yapılandırmasının tam karşıtını uygulamakta buldu: ana süreç merkezi olarak GCD kullanılırken, bellek denetimcileri ve önbellek birden çok küçük yongaya yerleştirildi.
GCD ismi verilen ünite görüntü kodlama donanımı, ekran arayüzleri ve PCIe ilişkisi üzere öbür temel fonksiyonlarla bir arada Bilgi Süreç Ünitelerini (Compute Unit olarak biliniyor) ortasında barındırıyor. Navi 31 GCD, tipik grafik sürece vazifelerini üstlenmek üzere 96 adede kadar CU barındırabiliyor. AMD, GCD’yi gelişmiş Infinity Fabric teknolojileriyle çipin etrafına yayılan MCD’lere ve kartın geri kalanına bağlıyor.
Adından da anlaşılacağı üzere, MCD’ler (bellek kalıpları) büyük L3 önbellek bloklarını (Infinity Cache) ve fizikî GDDR6 bellek arayüzünü içeriyor. birebir vakitte, MCD’lerin GCD’ye bakan tarafında Infinity Fabric kontakları yer alıyor.
AMD, TSMC’nin N5 teknolojisini kullanarak 300 mm² boyutundaki Navi 31 GCD’ye 45.7 milyar transistör entegre etmeyi başardı. TSMC N6 bandından çıkan 37 mm² boyutundaki MCD’lerde ise 2.05 milyar transistör bulunmakta.
Yüksek Performanslı Orta Temas Teknolojileri: Fanout
Çipler ortası ara ilişki teknolojileri kelam konusu olduğunda birfazlaca kaygı ortaya çıkar. Bu noktada birinci vakit içinderda Infinity Fabric irtibatlarının gerektirdiği güç (harici çipler neredeyse her vakit daha fazla güç kullanır) akıllara geliyor. Bunun yanında, irtibat teknolojisinin verimliliği ve suratı hayli kıymetlidir.
1 – 3
Örnek olarak, Zen CPU’larda üretimi nispeten ucuz olan organik bir alt katman orta kesimi var, fakat 1,5 pJ/b (bit başına pikojul) tüketmekte. Misal bir yaklaşımı 384 bitlik arayüzde kullanmak çok yüksek güç tüketimine yol açacaktı, bu niçinle AMD Navi 31 ile arayüzü geliştirmek için fazlaca gayret harcadı.
Sonuç olarak ortaya “Fanout” orta ilişkisi olarak isimlendirilen bir tahlil çıktı. Slaytlar her şeyi kapsamlı biçimde açıklamıyor, fakat sunum görsellerinde CPU’lar (CPU chiplet bandwidth) ve GPU’larda (MCD bandwidth) sunulan bant genişliğinin farkını nazaranbilirsiniz.
AMD RDNA 3 mimarisi.
İşlemcilerde 25 orta temas bulunurken, GPU’lar için kullanılan 50 orta ilişki daha küçük bir alana yerleştiriliyor. Bu da güç ihtiyaçlarını kıymetli ölçüde azaltıyor. AMD, tüm Infinity Fanout kontakları toplamda 3,5 TB/s aktif bant genişliği sağlarken toplam GPU güç tüketiminin sadece %5’inden azını oluşturduğunu söylüyor.
Bit başına pikojul (pJ/b) |
---|