AMD neden Ray Tracing'de daha kötü performans gösteriyor?

Uzun uzadıya konuşulan konulardan biri de düşük performans AMD Ray Tracing'deki grafik kartları , özellikle karşılaştırıldığında NVIDIA's. Bununla birlikte, Radeon Teknoloji Grubu tarafından gerekli donanımın uygulanmasının o kadar zayıf olduğunu söylediğimizde, kelimenin tam anlamıyla bu teknolojinin benimsenmesini boykot etmek gibi göründüğümüzde, çoğu kişi ellerini havaya kaldırıyor. Bilgisayar grafiklerindeki belirli görsel sorunları çözmek için ideal olduğunu ve GeForce üreticisinin bir icadı olmadığını da hatırlayalım.

Bizim için bir grafik kartının ana işlevi, oyunlarımızı kolay ve performanslı oynamamıza izin vermesidir, aynı zamanda video düzenleme veya 3D oluşturma gibi daha profesyonel görevler için ihtiyacınız olacaksa. modeller, fazlasıyla yeterli. yaptığı iş ile. AMD'nin Ray Tracing'de performansının düşük olduğunu söylediğimizde, NVIDIA'yı tavana vurmuyoruz, daha ziyade, biz de kullanıcı olarak, Radeons'ta çok daha iyi olabilecek bir şeyin olmadığını görmekten üzüntü duyuyoruz.

ışın izleme algoritması

AMD kartlarının Ray Tracing'deki düşük performansını anlamak için, bunun aslında tam bir sahne oluşturmak için yinelemeli bir algoritma olduğunu anlamamız gerekir; bu en basit haliyle şu şekilde özetlenebilir:

Sahnedeki her piksel için
- Görselleştirme ışınını hesaplayın
  - Yıldırım bir nesneye çarparsa, nesnenin rengini değerlendirin.
  - Değilse, o pikselin arka plan rengi vardır.

Işın, sahneyi "kaydeden" kameradan hareket eden ve her birinin bir piksel olduğu bir nokta matrisinden veya bir ağdan geçen bir vektörden başka bir şey değildir. Her seferinde sahnede bir kontrol efekti uygulanacaktır. Peki, Full HD bir sahnemiz varsa, bu 2 milyon kontrolün yapılması gerektiği anlamına gelir, eğer oyun 60 FPS'de ise bu saniyede 120 milyon kontrol demektir.

Matematiksel olarak, bunu kontrol etmek için en yaygın formül basit bir işlem değil, biraz güç gerektiren vektörlerle karmaşık bir denklemdir. Öyle ki, bu görevi yerine getirmekle görevli paralel bir birime sahip olmama basit gerçeği, yüzde performansını tek haneli rakamlara indirebilir.

Donanım kesişim birimleri

Bu nedenle NVIDIA'nın RT Çekirdekleri ve AMD'nin Işın Hızlandırıcı Birimleri vardır, bunlar aynıdır, çünkü aynı tipte birimlerdir ve aynı görev için kullanılırlar. Bununla birlikte, son nesilde, RX 6000, şans eseri RTG'nin RDNA 3'te ve sonuç olarak RX 7000 aralığında çözdüğü bir sınırlamaya sahipti.

O halde sorun nedir?

İyi ve dolayısıyla olumlu olan şey, RDNA 2'de eksik olanın artık RDNA 3'e dahil edilmiş olmasıdır.
Kötü olan ve AMD'de Işın İzleme performansının düşük olmasına neden olan şey, ışın-üçgen etkileşimlerinin miktarı hesaplayabilmesidir. Rakibiniz performansı bir nesilden diğerine iki katına çıkardığında, yalnızca %50'lik bir sıçrama çok zayıftır.

Bu konuda en yaygın olan üçgen rasterleştirme işleminin giderek hızlanmasından, piyasaya çıkan ilk 3D kartların sorumlu olduğunu unutmayalım. Aynısı ışın izlemede bu kısım için de geçerli. Dolayısıyla AMD'nin bu konuda bu kadar küçük bir sıçrama yapmış olması hayal kırıklığı yaratıyor.

Genel performansı nasıl etkiler?

Işınların kesişmesi setin bir parçası olsa da esas olan tüm sahnelerde ortak bir unsurdur. Unutmayalım ki bu aşama aşama ilerleyen, birinin normalden yavaş gitmesinin sonrakilerin performansını etkilemesiyle sonuçlanan bir süreç.

Bu nedenle, bir aşamayı hızlandırmayı başarırsak, aynı kareyi oluşturmak için daha kısa bir süre elde ederiz, yani daha az milisaniye sürer ve bu, saniyede daha fazla karedir. Açık olması gereken, ışın izlemede kesişme sürecinin yinelemeli ve sürekli olduğu ve bu nedenle bu bölümün iyi bir performansa sahip olması gerektiğidir.

Diğer sorun: kayan nokta performansı

GPU'lar tipik olarak veri blokları üzerinde uyum içinde çalışır ve bunlara aynı talimatı uygular. Bu nedenle, onun özlü birim türü, adından da anlaşılacağı gibi, aynı talimatı birkaç farklı veriye aynı anda uygulayan SIMD birimleri dediğimiz şeydir. Eh, RTX 30'daki NVIDIA, saat döngüsü ve çekirdek başına iki kat daha fazla 32 bit kayan nokta işlemi hesaplamasına izin veren oldukça ilginç bir iyileştirme yaptı.

İşin püf noktası, alt çekirdeklerin her birine ikinci bir 16 öğeli SIMD birimi ekleyerek birim başına toplam 64 ek işlem yapmaktı. GPU. Ancak tamsayı birimi ile çevrildikleri için kayıt ve erişim sayılarını artırmadılar. Bu ne anlama geliyor? Hem RTX 30 hem de RTX 40, her zaman değil, belirli koşullar altında çift kayan nokta performansına ulaşır.

AMD ise Dual Issue adını verdikleri başka bir çözüm aramış ancak teknik özelliklerinde kayan noktalı birimlerin sayısının artmadığını ancak belirli koşullar altında 2 komutu aynı anda paketleyebileceklerini söylüyorlar. . Ancak çekirdek veya Bilgi İşlem Birimi başına birim sayısı, NVIDIA örneğinde olduğu gibi 64 yerine maksimum 128'tür.

AMD, RDNA 3'teki “İkili Sayı” ile ne demek istiyor?

Bununla birlikte, AMD tarafından verilen ve genellikle teorik bir maksimumda verilen kayan nokta işlemlerinin sayısını sayarsanız, zamanın %100'ünü FMA işlemi veya kayan nokta çarpma ile toplama gerçekleştirir; hesap belleği erişimleri ve programların her zaman söz konusu talimatı kullanmadığı, ancak grafik oluştururken en çok kullanılan talimat olduğunu dikkate aldığı gerçeği. Gerçek şu ki, talimat 2 işlemdir.

AMD'nin yaptığı şey, belirli komutların hesaplama birimlerinde ikişer ikişer paketlenebilmesi ve böylece belirli koşullar altında RDNA 2 ile kayan noktadaki gücün iki katına ulaşılmasına izin verilmesi. NVIDIA GPU'larda olduğu gibi aynı durum. Ek kayan nokta gücü genel olarak ikiye katlanmaz, ancak yalnızca belirli koşullar altında. Bu yüzden yaygın bir sorundur. Her durumda, TFLOPS'taki ölçüm bugün hala bir pazarlama hilesidir.

Peki AMD'nin Işın İzleme performansı neden önemlidir? Eh, ışın izlemenin ışınların kesişimi olmayan geri kalan aşamalarında kullanılan birimlerin hesaplama gücünü ölçmemize yardımcı olduğu gerçeğinden dolayı. Her halükarda, AMD'nin kendisi nesiller arası iyileşmenin aynı saat hızında %18 olduğunu iddia ediyor.

Işın İzlemede AMD GPU Performansı: Rakamlar

NVIDIA ve AMD'nin farklı nesil grafik kartlarının her ikisinde de farklı kesişim birimlerinin performansını karşılaştırırsak, sorunun ne olduğunu görebiliriz.

GPU'lar	Kavşaklar/sn (milyon olarak)	çekirdekler	MHz	Kavşaklar (çekirdek ve MHz)
RTX2080Ti	105600	68	1545	bir
RTX3090Ti	312480	84	1860	2
RTX 4090	1290240	144	2520	3.6
RX 6950 XT	184800	80	2310	bir
RX7900XTX	360000	96	2500	1.5

İlk bakışta, bu yönüyle ham güç bir RTX 3090 Ti'den daha yüksek, evet, ikinci sütuna bakıyoruz. Bununla birlikte, GPU'da çekirdek ve saat döngüsü başına kaç kesmenin hesaplandığını bize söylediği için önemli olan ikincisidir. Ve hayal kırıklığı, AMD'den RTX 3.6 için 40'lık bir sonuç vermesi istenmemesine rağmen, RTX 2 için en az 30'ye ulaşmasının istenmesinden kaynaklanmaktadır. AMD ekran kartlarının düşük performansının ana nedeni budur. Işın İzleme'de. Ve çok daha iyisini yapabileceklerini düşünmemizin nedeni.

Daha fazlası var ve şimdiden bitmek üzere, çünkü Işın Hızlandırıcı Birimi mimarinin geri kalanını etkilemeden değiştirilebilen başlı başına bir kara kutu. AMD, önümüzdeki yıl için mevcut RDNA 7'ün tüm iyiliğini koruyan bir RX 50×3 serisini alıp yapabilir, ancak geliştirilmiş RAU ile oyun performansının kare hızı açısından çift haneli yüzdelerde arttığını görebilir.

RDNA 3'te Işın İzleme özellikli AMD oyunlarının performansı nedir?

Şimdi bitirmek için pastanın üzerindeki vişne var ve oyunlarda nasıl performans gösterdiği hakkında konuşacağız. AMD alenen %50'lik bir iyileştirme iddiasında bulunduğundan, eşit derecede büyük bir sıçrama beklemeliyiz. Ancak, daha sonra bunların watt başına performansa, bunların belirli bir miktarına ve belirtilmeyen belirli bir oyuna atıfta bulunduğunu keşfettik. Bu nedenle önemli olan, özellikle RX 6000'den gelen ışın izlemede oldukça zayıf bir performanstan başladıkları gerçeği nedeniyle, bu açıdan önceki nesle kıyasla iyileştirmenin ne olduğunu bilmektir.