AMD Radeon RX 7900 XTX İncelemesi

AMD Radeon RX 7900 XTX İncelemesi

AMD Radeon RX 7900 XTX ekran kartı nihayet elimize ulaştı, şimdi inceleme zamanı. Daha önce üretimi referans tasarıma dayanan kartın kutu açılışını yapmıştık. Şirket aslında RX 7900 XTX ve RX 7900 XT olmak üzere iki model piyasaya sürmüştü. Biz şimdi amiral gemisi 7900 XTX’e bakacağız.

Kırmızı takım ilk olarak Radeon RX 6000 serisiyle birlikte NVIDIA’ya kafa tutmaya başlamıştı. Şirket şimdi yepyeni bir mimariyle karşımıza çıkarken üst düzey GPU segmentinde NVIDIA ile rekabeti korumayı umuyor. Yeni nesil kartlar bu sebeple 4K oyunculuk için konumlandırıldı.

AMD, referans tasarımlı ekran kartları konusunda NVIDIA’ya göre daha geleneksel bir yaklaşıma sahip. NVIDIA artık referans tasarımlı kartlarını satmıyor ve bunlar OEM’lere mühendislik örnekleri olarak dağıtılıyor. Founders Edition adıyla bahsettiğimiz kartlar ise NVIDIA mühendisleri tarafından ilk elden tasarlanırken şirket bunları yalnızca NVIDIA markası altında satmakta. Öte yandan AMD, referans tasarımlı pazarlama modelini hiç değiştirmedi. Şirket bu kartları hem doğrudan AMD web sitesinde kendi markası altında hem de ortakları (AIB) aracılığıyla satıyor. Şimdi elimizde AMD tarafından belirlenen temel saatlere ve soğutma tasarımına sahip olan bir model var. Bildiğiniz üzere özel markaların ürettiği kartlar daha yüksek frekanslara çıkabiliyor.

RDNA 3 mimarisi, tıpkı Ryzen işlemcilere benzer şekilde çiplet mantığıyla geliştirildi. Ana grafik birimi TSMC 5nm üretimini, etrafında toplanan ayrı bellek yongaları ise TSMC 6nm teknolojisiyle üretiliyor. AMD, gölgelendirici sayısında ve IPC performansında artış yaptı. Bu da kartların çok daha güçlü olmasını sağlıyor. Şirket ayrıca ışın izleme çekirdeklerini geliştirdi, aynı zamanda Tensor çekirdeklerine benzer şekilde yapay zeka hızlandırıcılar kullanmaya başladı.

Navi 31 GPU’nun iki çeşidi piyasaya çıkıyor. Daha güçlü RX 7900 XTX tam etkinleştirilmiş GCD ve altı MCD kullanırken, RX 7900 XT’de 96 Hesaplama Birimi’nin 84’ü etkinleştirilmiş ve yalnızca beş MCD kullanılıyor. Altıncı MCD teknik olarak hala GPU’da mevcut, ancak ya işlevsel değil ya da muhtemelen sahte bir kalıp olarak yerinde kalıyor. Son MCD her şekilde devre dışı ve ekstra 4 GB GDDR6 belleğe bağlı olmayacak, bu nedenle altıncı yongayı yeniden etkinleştirmenin hiçbir yolu yok.

AMD’nin sunumunda 61 teraflop’luk hesaplama gücünden bahsediliyor. Normalde bu değer 56.5 teraflop olmalıydı. RDNA 3 mimarisi, verimlilik amacıyla bölümlenmiş frekans hızı alanına sahip. Doku ve render birimleri 2.5 GHz hızda (oyun saati) çalışırken, gölgelendiriciler 2.3 GHz’de çalışıyor. Teraflop değerleri gölgelendirici ile hesaplandığında 56.5 teraflop değeri ortaya çıkmalı, ancak şirket yeni mimarisinde bazı farklı yaklaşımlar benimsemiş.

Ekran Kartı RX 7900 XTX RX 7900 XT RX 6950 XT RTX 4090 RTX 4080 RTX 3090 Ti
GPU Navi 31 Navi 31 Navi 21 AD102 AD103 GA102
Üretim Teknolojisi TSMC N5 + N6 TSMC N5 + N6 TSMC N7 TSMC 4N TSMC 4N Samsung 8N
Transistörler 58 milyar 58 milyar – 1 MCD 26.8 milyar 76.3 milyar 45.9 milyar 28.3 milyar
Kalıp Boyutu 300 + 222 mm^2 300 + 185 mm^2 519 mm^2 608.4 mm^2 378.6 mm^2 628.4 mm^2
SM / CU / Xe-Core 96 84 80 128 76 84
GPU Çekirdeği (Shader) 6144 5376 5120 16384 9728 10752
Tensor
Çekirdeği
512 304 336
Işın İzleme
Çekirdeği
96 84 80 128 76 84
Boost Saati 2500 MHz 2400 MHz 2310 MHz 2520 MHz 2505 MHz 1860 MHz
Bellek Hızı 20 Gbps 20 Gbps 18 Gbps 21 Gbps 22.4 Gbps 21 Gbps
Bellek Kapasitesi 24 GB GDDR6 20 GB GDDR6 16 GB GDDR6 24 GB GDDR6X 16 GB GDDR6X 24 GB GDDR6X
Bellek Veri Yolu 384-bit 320-bit 256-bit 384-bit 256-bit 384-bit
L2 / Infinity Cache Önbellek 96 MB 80 MB 128 MB 72 MB 64 MB 6 MB
ROP 192 192 128 176 112 112
TMU 384 336 320 512 304 336
TFLOPS FP32 56.5 43.0 23.7 82.6 48.7 40.0
TFLOPS FP16 (FP8) 113 86 47.4 661 (1321) 390 (780) 160 (320)
Bant Genişliği 960 GBps 800 GBps 576 GBps 1008 GBps 717 GBps 1008 GBps
Etkin Bant Genişliği 3500 GB/s 2900 GB/sn 1728.2 GB/sn 1664.2 GB/sn
TDP/TBP 355W 300W 335W 450W 320W 450W
Liste Fiyatı 999$ 899$ 1099$ 1599$ 1199$ 1999$

Kendi testlerimizden hariç olarak AMD tarafından sağlanan verileri de sizlerle paylaşıyoruz. Şirket tahmin edebileceğiniz üzere RTX 4080 ile kıyaslamalar yapmış. Ham performans söz konusu olduğunda seçilen oyunların birçoğunda 7900 XTX daha üstün görünüyor. İşin içine ışın izleme teknolojisi girdiğinde ise işler biraz değişiyor.

4K Oyun Performansı

Radeon
RX 7900 XTX
Radeon
RX 7900 XT
GeForce RTX 4080 Radeon
RX 6950 XT
RX 7900 XTX vs. RTX 4080
ASSASSIN’S CREED VALHALLA
(DX12, ULTRA HIGH)
108 FPS 93 FPS 100 FPS 77 FPS + 8%
BORDERLANDS 3
(DX12, BADASS)
107 FPS 89 FPS 90 FPS 73 FPS + 19%
CALL OF DUTY: MW2
(DX12, EXTREME)
119 FPS 99 FPS 94 FPS 77 FPS + 27%
CYBERPUNK 2077
(DX12, ULTRA)
71 FPS 60 FPS 65 FPS 45 FPS + 8%
DOOM ETERNAL
(VULKAN, ULTRA NIGHTMARE)
207 FPS 178 FPS 202 FPS 152 FPS + 3%
DYING LIGHT 2
(DX12, HIGH)
82 FPS 64 FPS 72 FPS 57 FPS + 14%
F1 2022
(DX12, ULTRA HIGH)
187 FPS 158 FPS 169 FPS 144 FPS + 10%
FAR CRY 6
(DX12, ULTRA)
125 FPS 106 FPS 105 FPS 89 FPS + 19%
FORZA HORIZON 5
(DX12, MAX)
87 76 FPS 80 FPS 69 FPS + 10%
GOD OF WAR
(DX11, ULTRA)
98 FPS 84 FPS 93 FPS 67 FPS + 6%
HITMAN 3
(DX12, ULTRA, DUBAI)
195 FPS 167 FPS 174 FPS 135 FPS + 12%
METRO EXODUS
(DX12, EXTREME)
96 FPS 81 FPS 98 FPS 67 FPS – 2%
RED DEAD REDEMPTION 2
(DX12, ULTRA)
92 FPS 77 FPS 84 FPS 65 FPS + 9%
RESIDENT EVIL VILLAGE
(DX12, MAX)
187 FPS 154 FPS 164 FPS 123 FPS + 14%
TOTAL WAR: WARHAMMER 3
(DX11, ULTRA)
79 FPS 65 FPS 75 FPS 49 FPS + 6%
WATCH DOGS LEGION
(DX12, ULTRA)
97 FPS 83 FPS 89 FPS 67 FPS + 9%

4K Raytracing Oyun Testi

Radeon
RX 7900 XTX
Radeon
RX 7900 XT
GeForce RTX 4080 Radeon
RX 6950 XT
RX 7900 XTX vs. RTX 4080
CYBERPUNK 2077
(DX12, RT MEDIUM)
29 FPS 25 FPS 36 FPS 18 FPS – 20%
DIRT 5
(DX12, ULTRA HIGH + RT)
118 FPS 100 FPS 112 FPS 82 FPS + 5%
DOOM ETERNAL
(DX12, ULTRA + RT)
138 FPS 119 FPS 159 FPS 83 FPS – 14%
F1 2022
(DX12, MEDIUM RT)
102 FPS 89 FPS 100 FPS 65 FPS + 1%
FAR CRY 6
(DX12, ULTRA)
104 FPS 90 FPS 95 FPS 74 FPS + 9%
METRO EXODUS ENHANCED
EDITION
(DX12, ULTRA RT)
68 FPS 57 FPS 80 FPS 45 FPS – 15%
RESIDENT EVIL VILLAGE
(DX11, MAX RAYTRACING)
140 FPS 115 FPS 142 FPS 94 FPS – 2%
SAINTS ROW
(DX12, ULTRA + MED RT)
80 FPS 68 FPS 92 FPS 54 FPS – 13%
SHADOW OF THE TOMB RAIDER
(DX12, HIGHEST)
86 FPS 73 FPS 97 FPS 59 FPS – 13%
Radeon
RX 7900 XTX
Radeon
RX 7900 XT
GeForce RTX 4080 Radeon
RX 6950 XT
RX 7900 XTX vs. RTX 4080
APEX LEGENDS
(DX11, ULTRA HIGH)
300 FPS 300 FPS 299 FPS 254 FPS + 0%
DOTA 2 REBORN
(DX11, ULTRA)
293 FPS 293 FPS 299 FPS 294 FPS – 2%
TOM CLANCY’S RAINBOW SIX
SIEGE
(VULKAN, ULTRA)
665 FPS 583 FPS 606 FPS 552 FPS + 10%
VALORANT
(DX11, HIGH)
847 FPS 777 FPS 862 FPS 760 FPS – 2%
ASSASSIN’S CREED VALHALLA
(DX12, ULTRA HIGH)
168 FPS 149 FPS 153 FPS 130 FPS + 10%
CYBERPUNK 2077
(DX12, ULTRA)
137 FPS 120 FPS 132 FPS 97 FPS + 3%
DOOM ETERNAL
(VULKAN, ULTRA NIGHTMARE)
308 FPS 275 FPS 265 FPS 241 FPS + 16%
DYING LIGHT 2
(DX12, HIGH)
154 FPS 128 FPS 144 FPS 110 FPS + 7%
F1 2022
(DX12, ULTRA HIGH)
298 FPS 263 FPS 275 FPS 249 FPS + 8%
FAR CRY 6
(DX12, ULTRA)
177 FPS 173 FPS 156 FPS 143 FPS + 13%
FORZA HORIZON 5
(DX12, MAX)
125 FPS 112 FPS 124 FPS 111 FPS + 1%
GOD OF WAR
(DX11, ULTRA)
147 FPS 129 FPS 136 FPS 102 FPS + 8%
RED DEAD REDEMPTION 2
(DX12, ULTRA)
133 FPS 115 FPS 126 FPS 96 FPS + 6%
RESIDENT EVIL VILLAGE
(DX12, MAX)
345 FPS 295 FPS 314 FPS 239 FPS + 10%
SAINTS ROW
(DX12, ULTRA)
172 FPS 148 FPS 184 FPS 128 FPS – 7%
TINY TINA’S WONDERLANDS
(DX12, BADASS)
156 FPS 140 FPS 165 FPS 133 FPS – 5%

Sentetik Testler

Uygulama API Çözünürlük Ön Ayar Test RX 7900 XTX RX 7900 XT RTX 4080
Time Spy DX12 2560×1440 Skor 25820 23395 25192
Grafik
Skoru
29375 25818 28459
CPU Skoru 15285 15275 15249
TIME SPY EXTREME DX12 3840×2160 Extreme Skor 13609 12116 13161
Grafik
Skoru
14636 12662 14060
CPU Skoru 9743 9741 9667
PORT ROYAL DX12 2560×1440 Skor 15762 13602 17886
Grafik
Skoru
15789 13602 17886
Grafik
Test1
73.1  63 82.8
FIRE STRIKE DX11 1920×1080 Skor 49327 46528 46744
Grafik Skoru 72386 67233 63615
Fizik Skoru 41508 40971 40912
Birleşik
Skor
16051 14931 16801
FIRE STRIKE EXTREME DX11 2560×1440 Extreme Skor 34766 31006 30574
Grafik Skoru 39526 33731 33106
Fizik Skoru 41477 41204 40972
Birleşik
Skor
16175 15677 15615
FIRE STRIKE ULTRA DX11 3840×2160 Ultra Skor 19976 16925 17272
Grafik Skoru 20161 16986 17073
Fizik Skoru 41494 41225 41060
Birleşik
Skor
10822 8856 9677
3DMARK11 P DX11 1280×720 Skor 53961 51681 53194
Grafik Skoru 85636 79140 76024
Fizik Skoru 27114 26726 27842
Birleşik
Skor
23793 23568 28117

Daha önce birçok kez belirttiğimiz gibi, RX 7900 serisinde Navi 31 isimli üst sınıf bir GPU kullanılıyor. Navi 31, Grafik İşlem Kalıbı (GCD) ve Bellek Önbellek Kalıbı (MCD-Memory Cache Dies) olmak üzere iki temel parçadan meydana geliyor. AMD’nin Zen 2/3/4 işlemcilerinde benimsenen çiplet tasarımla benzerlikler var, ancak her şey grafik dünyasının ihtiyaçlarına uyacak şekilde tasarlanmış. Başka bir deyişle, kırmızı takım işlemci tarafındaki deneyimlerini grafik cephesine aktarmayı başarmış.


Navi 31 GPU özellikleri

AMD Zen Mimarisinin Temeli

AMD, Zen 2 ve sonrasındaki işlemcilerde sistem belleğine bağlanan ve PCIe Express arayüzü, USB bağlantı noktaları ve entegre grafik işlemcisi (Zen 4 ile geldi) gibi birimleri barındıran bir Giriş/Çıkış Kalıbı (IOD) kullanıyor. İçerisinde birçok ayrı birim barındıran bu yonga, AMD’nin Infinity Fabric teknolojisiyle bir veya birden fazla CCD’ye (Core Compute Die veya Core Complex Die) bağlanıyor. Bu CCD’ler ise CPU çekirdeklerini, önbellek birimini ve farklı bileşenleri içeriyor.

Çekirdekleri içinde barındıran birimler küçük yapıdayken, IOD yaklaşık 125 mm² (Ryzen 3000) ile 416 125 mm² (EPYC xxx2 nesil) arasında değişkenlik gösterebiliyor. En son teknolojileri barındıran Zen 4 mimarisinde işler biraz daha değişti. Ryzen 7000 işlemcilerde CCD’ler TSMC N5 (5nm), IOD TSMC N6 (6nm) teknolojisine dayanıyor. Yani böyle yapılarda ihtiyaca ve maliyetlere göre kullanılan teknolojiler farklılık gösterebiliyor. Bu da aslında üreticiler için önemli bir avantaj.

RDNA 3 Mimarisine Derinlemesine Dalış

Şimdi gelelim asıl konumuza. GPU’lar bildiğiniz gibi farklı gereksinimlere sahip ve çok farklı yapıda. Grafik işlem birimleri, tüm GPU çekirdeklerini beslemek için bol miktarda bellek bant genişliğine ihtiyaç duyar. Örneğin, 12 kanallı DDR5 yapılandırmasına sahip devasa EPYC 9654 bile ‘yalnızca’ 460,8 GB/s’ye kadar bant genişliği sunuyor. RTX 4090 ve RTX 3090 Ti gibi ekran kartları ise bu miktarları ikiye katlarken, 1 TB/sn seviyesinde bant genişliğine sahip.

GPU yongalarının etkili bir şekilde çalışması için AMD’nin farklı bir şey yapması gerekiyordu. Şirket mühendisleri çözümü CPU yapılandırmasının tam tersini uygulamakta buldu: ana işlem merkezi olarak GCD kullanılırken, bellek kontrolcüleri ve önbellek birden fazla küçük yongaya yerleştirildi.

GCD adı verilen birim video kodlama donanımı, ekran arayüzleri ve PCIe bağlantısı gibi diğer temel işlevlerle birlikte Bilgi İşlem Birimlerini (Compute Unit olarak biliniyor) içinde barındırıyor. Navi 31 GCD, tipik grafik işleme görevlerini üstlenmek üzere 96 adede kadar CU barındırabiliyor. Ayrıca AMD, GCD’yi gelişmiş Infinity Fabric teknolojileriyle çipin etrafına yayılan MCD’lere ve kartın geri kalanına bağlıyor.

Adından da anlaşılacağı gibi, MCD’ler (bellek kalıpları) büyük L3 önbellek bloklarını (Infinity Cache) ve fiziksel GDDR6 bellek arayüzünü içeriyor. Bununla birlikte, MCD’lerin GCD’ye bakan tarafında Infinity Fabric bağlantıları yer alıyor.

AMD, TSMC’nin N5 teknolojisini kullanarak 300 mm² boyutundaki Navi 31 GCD’ye 45.7 milyar transistör entegre etmeyi başardı. TSMC N6 bandından çıkan 37 mm² boyutundaki MCD’lerde ise 2.05 milyar transistör bulunmakta.

Şimdi GPU’nun çeşitli bölümlerindeki mimari değişikliklere geçelim. Değişimi dört ana başlığa ayırabiliriz: çip tasarımında genel değişiklikler, GPU gölgelendiricilerinde (Stream Processors) geliştirmeler, ışın izleme performansını iyileştirmek için güncellemeler ve matris işlem donanımında iyileştirmeler.

İlk başta saat hızları konusunda kafa karışıklığı yaratan detaylar vardı. Şimdi frekans hızlarına ilişkin daha net veriler sağlandı. AMD tarafından sağlanan verilere gelince, RX 7900 XT 2.4 GHz, RX 7900 XTX ise 2.5 GHz boost frekansına sahip. Ancak şirket RDNA 3 GPU’ların 3.0 GHz hıza ulaşacak şekilde tasarlandığını söylüyor. Referans saatler 500 MHz kadar daha düşük. Bu noktada kırmızı ekibin verimliliği üst düzeye çıkarmak istediğini düşünüyoruz. MSI ve ASUS gibi üretim ortakları güç limitlerini, voltajları ve saat hızlarını isteğine göre yükseltmekte özgür.

AMD’ye göre RDNA 3 GPU’lar yarı güç kullanırken RDNA 2 GPU’larla aynı frekansa ulaşabiliyor veya aynı gücü kullanırken 1.3 kat daha yüksek frekans sunabiliyor. AMD en iyi deneyimi sağlamak üzere frekans ve gücü dengelemek istiyor. Özellikle amiral gemisi RX 7900 XTX’in yüksek güç limitleriyle birlikte yüksek frekanslara eriştiğini görebiliriz.

GPU tasarımcısının dikkat çektiği bir diğer nokta ise silikon kullanımını yaklaşık %20 oranında iyileştirmiş olması. RDNA 2 GPU’larda kart tam yük altındayken bile çipin parçalarının sıklıkla boşta kaldığı işlevsel birimler vardı. AMD’nin sözlerine bakılırsa bu konuda önemli geliştirmeler yapıldı.

Hesaplama Birimleri (CU)

Çiplet tasarımı bir kenara, en önemli değişiklikler Hesaplama Birimleri (Compute Unit-CU) ve Çalışma Grubu İşlemcileri (Workgroup Processor-WGP) tarafında gerçekleştirildi. Bunlar arasında L0/L1/L2 önbellek boyutlarında güncellemeler, FP32 ve matris iş yükleri için daha fazla SIMD32 kaydı ve bazı öğeler arasında daha geniş ve daha hızlı arayüzler yer alıyor.

RDNA 3, RDNA yongaların ana yapı taşı haline gelen Hesaplama Birimleri açısından önemli (çiftli işlem birimleri) geliştirmelerle geliyor. Görsellerde RDNA 3 ve RDNA 2 pek farklı görünmeyebilir, ancak zamanlayıcı ve Vektör GPR’leri için ilk blokta “Float / INT / Matrix SIMD32” ve ardından “Float / Matrix SIMD32” ibarelerini görebilirsiniz. Bu ikinci blok RDNA 3 mimarisinde yeni ve temel olarak kayan nokta veriminin iki katına çıkarılması anlamına gelmekte.

1 – 4





Resmiyette her bir Hesaplama Ünitesi’nde 64 Akış İşlemcisi’ne (Stream Processor) yer verilmiş. Her şey RDNA 2 mimarisiyle aynı görünebilir, ancak yeni yapılandırma sayesinde aslında toplam 12.288 ALU (Aritmetik Mantık Birimleri-gölgelendirici) elde ediyoruz.

Yeni RDNA 3 birleşik Hesaplama Birimi’nde 64 adet çift çıkışlı (dual-issue) Akış İşlemcisi (GPU gölgelendiricileri) bulunuyor. Bu RDNA 2 mimarisine kıyasla iki katlık bir fark demek. AMD, her SIMD birimine farklı iş yükleri gönderebiliyor veya her ikisinin de aynı komut türü üzerinde çalışmasını sağlayabiliyor.

Aslında bu konu herkeste kafa karışıklığı yaratmıştı. Bazı yerlerde Navi 31’in 6.144, bazı yerlerde ise 12.288 gölgelendiriciye sahip olduğu söyleniyordu. Baş GPU mimarı ve RDNA 3 tasarımının arkasındaki ana isim olan Mike Mantor, bu konu sorulduğunda 12.288 rakamını verdi. Ancak AMD sunumlarında düşük rakamları kullanmayı seçiyor.

2. Nesil Infinity Cache

RDNA 3 mimarisi, verilerin GPU’ya daha hızlı iletilmesini sağlayan Infinity Cache teknolojisi geliştirerek ikinci nesle yükseltti. Böylelikle bant genişliği muazzam rakamlara çıkabiliyor, veri akışı çok hızlı şekilde sağlanabiliyor.

GPU’ya entegre edilen önbellek, aşağıda görebileceğiniz gibi büyük sıçramalar yaratıyor:

  • Radeon RX 6950 XT: 256 bit bellek veri yolunda 18 Gb/sn hızla çalışan GDDR6 bellekler, 128 MB 1. Nesil AMD Infinity Cache ile birlikte 1793,5 GB/sn bant genişliği sunuyor.
  • Radeon RX 7900 XT: 320 bit bellek veri yolunda 20 Gb/sn hızla çalışan GDDR6 bellekler, 80 MB 2. Nesil AMD Infinity Cache ile birlikte 2912 GB/sn bant genişliği sağlıyor.
  • Radeon RX 7900 XTX: 384 bit bellek veri yolunda 20 Gb/sn hızla çalışan GDDR6 bellekler, 96 MB 2. Nesil AMD Infinity Cache ile birlikte 3494,4 GB/sn bant genişliğine sahip.

Önbellek ve Ara Bağlantı

Önbellekler ve sistemin geri kalanı arasındaki arabirimleri tümünde geliştirmeler yapıldı. Örneğin L0 önbellek 32 KB’a (RDNA 2’nin iki katı), L2 önbellek 6 MB’a (RDNA 2’den 1.5 kat daha büyük) ve L2 önbellek yine 6 MB’a (1.5 kat) yükseltildi. Ek olarak, ana işlem birimleri ile L1 önbellek arasındaki bağlantı artık 1.5 kat daha geniş ve saat başına 6144 bayt verim sağlıyor. Aynı şekilde, L1 ve L2 önbellek arasındaki bağlantı da 1.5 kat daha geniş (saat başına 3072 bayt).

Infinity Cache olarak da adlandırılan L3 önbellek Navi 21’e göre (96 MB’a karşı 128 MB) küçüldü. Buna karşılık L3’ten L2’ye bağlantı artık 2.25 kat daha geniş (saat başına 2304 bayt) ve toplam aktarım hızı çok daha yüksek.

Son olarak, GDDR6 bellek yapılandırmasında toplam 384 bit bağlantı için artık 6 adede kadar 64 bit GDDR6 arabirimi var. VRAM toplam 960 GB/sn’lik bant genişliğini ortaya çıkarırken 20 Gbps (RX 6×50 kartlarda 18 Gbps ve orijinal RDNA 2 yongalarında 16 Gbps) hızında çalışıyor.

Başka bir noktaya parmak basacak olursak, GDDR6 ve GDDR6X arasındaki fark da yeni nesille birlikte daraldı. 960 GB/sn bant genişliği sunan RX 7900 XTX, 1008 GB/sn bant genişliğine sahip RTX 4090’a çok yakın. RTX 3090 (936 GB/sn) ve RX 6900 XT’nin (512 GB/sn) arasındaki fark ise çok daha fazlaydı.

2. Nesil Ray Tracing (Işın İzleme)

Işın Hızlandırıcı (Ray Accelerator) birimleri ikinci nesle geçiş yapıyor. Bu birimlerin sayısı aynı kalmış. Yani tıpkı RDNA 2 mimarisinde olduğu gibi, her İşlem Birimi’nde (Compute Unit) birer Ray Accelerator yer alıyor.


AMD RDNA 3 ışın izleme teknolojileri.

Kırmızı takım, çekirdeklerin ışın izleme senaryolarında 1.5 kat daha fazla ışın üretebilecek kapasiteye ulaştığını belirtiyor. Ayrıca GPU’ya ışın izlemeyle ilgili yeni komut setleri de eklenmiş. Her bir CU’da bir RA olduğunu söylemiştik. AMD’ye göre bu birimler eskisine göre %50 daha performanslı.

Yapay Zeka Hızlandırıcı

Bildiğiniz gibi ekran kartları artık birçok alanda önemli rol oynuyor. AMD de her bir İşlem Birimi’ne iki adet Yapay Zeka Hızlandırıcı (AI Accelerator) dahil etmiş. Yapay zeka iş yüklerinde verimlilik artarken performansın 2.7 kata kadar arttığı iddia edilmiş.

Ham işlem gücünden emin değiliz, ancak AI hızlandırıcıların hem INT8 hem de BF16 (brain-float 16-bit) işlemlerini desteklediğini biliyoruz. Yani muhtemelen NVIDIA’nın Tensor çekirdeklerine benzer bir yapı var, ancak desteklenen toplam komut seti sayısı aynı değil. Ne olursa olsun, AMD yeni yapay zeka hızlandırıcılarının 2,7 kata kadar iyileştirme sağladığını iddia ediyor. Hızlandırıcı sayısının artması, daha fazla Hesaplama Ünitesi ve artan verimlilik bir araya gelerek bu performans artışını sağlıyor.

Diğer İyileştirmeler

Komut İşlemcisi (CP) güncellemeleri, belirli iş yükleri için performansı artırırken sürücü ve API tarafındaki CPU darboğazlarını da azaltacak. Donanım tabanlı ayıklama performansı da geometri tarafında %50 daha hızlı ve saat başına en yüksek rasterleştirilmiş piksel sayısında %50 artış var.

Yeni mimariyle birlikte kullanıma sunulan Dual Media Engine, AMD’yi video tarafında NVIDIA ve Intel ile aynı seviyeye getirecek. Ancak kalite ve performansı görmek için detaylı testler gerekli.

AMD Display Engine

AMD ayrıca yeni RX 7000 ekran kartlarıyla DisplayPort 2.1 desteği sunmaya başlıyor. Bu sektörde bir ilk. Intel de Arc GPU’larında DP2 desteği sunmuştu, ancak bu destek 40 Gbps (UHBR 10) ile sınırlıydı. AMD’nin bağlantısı 54 Gbps (UHBR 13.5) hıza erişebiliyor.

Şirket şu anda piyasada olan yeni nesil GPU’ların yalnızca DisplayPort 1.4 desteği sunduğunu, bunun da oyuncuları kısıtladığını söylüyor. Ancak DP 2.1 desteğinin ne kadar gerekli olduğu tartışılır.

Radeon RX 6950 XT Radeon RX 7900 Serisi
DisplayPort Sürümü DisplayPort 1.4 DisplayPort 2.1
Maksimum Yenileme Hızı – 1440p 480 Hz 900 Hz
Maksimum Yenileme Hızı – 4K 280 Hz 480 Hz
Maksimum Yenileme Hızı – 8K 60 Hz 165 Hz

Güç Tüketimi

Kırmızılılar, TBP (Toplam Kart Gücü) değerini ve önerilen PSU değerlerini neredeyse sabit bırakırken yüksek performans değerleri sunulduğunu vurguluyor. Bu arada, ortakların ürettiği ekran kartlarında güç seviyelerinin ve güç kaynağı watt değerinin değişebileceğini hatırlatalım.

Radeon RX 6950 XT Radeon RX 7900 XTX Radeon RX 7900 XT
Temel TBP 335W 355W 315W
Önerilen Güç Kaynağı 850W 800W 750W
Sosyal Medya'da Paylaş

Yorum gönder