TFLOPS: waarom ze niet nuttig zijn bij het vergelijken van opbrengsten

Als er iets is waar iedereen naar kijkt bij het vergelijken van prestaties tussen CPU's, GPU's of consoles, dan wel TFLOPS . Maar tegelijkertijd weet de overgrote meerderheid niet wat ze zijn, wat ze meten en vooral waarom ze in deze sector niet echt belangrijk zijn. Vandaag gaan we wit en zwart op deze en andere onderwerpen plaatsen door eenvoudig te berekenen hoe ze worden gemeten en waarom ze zo overschat worden.

Het is de eeuwige strijd tussen degenen die proberen de gemiddelde gebruiker bewust te maken van het feit dat TFLOPS als prestatiemaatstaf niet het belangrijkste is bij het evalueren van de prestaties van een component of systeem, en onder degenen die het als het woord van God beschouwen . .

TFLOPS: waarom ze niet nuttig zijn

Hoe te begrijpen dat deze maatregel als zodanig niet echt representatief is? Nou, eerst haar beter leren kennen.

Het zou juist zijn om over FLOPS te praten, waarom?

GPU-NVIDIA

In wezen omdat TFLOPS niets meer is dan een grotere meeteenheid dan het intrinsiek afhankelijk is door middel van FLOPS of Drijvende-kommabewerkingen per seconde, vertaald als drijvende-kommabewerkingen per seconde. Zoals de naam al aangeeft, is het de eenheid voor prestatiemeting voor pc binnen drijvende-kommabewerkingen en wordt het standaard gedefinieerd door verschillende binnen de pc-wereld, zoals LINPACK.

Met dit inzicht ontstaat er controverse, omdat er verschillende manieren zijn om FLOPS en dus TFLOPS te meten, waarbij de laatste niets meer is dan een grotere meeteenheid om miljarden instructies per seconde weer te geven, in het bijzonder tien tot 12 FLOPS.

De normen weerspiegelen twee verschillende metingen: real-time en duurzaam , waarbij in het algemeen geen enkele fabrikant specificeert welke hij precies in zijn gegevens verzamelt. Normaal gesproken bieden ze de realtime, aangezien dit meestal samenvalt met het maximum piek van elk onderdeel, wat een enigszins vertekende meting oplevert.

Waarom is vergelijken met TFLOPS niet correct?

NVIDIA Quad-GPU IA

In feite omdat TFLOPS een maat is die geen rekening houdt met de architectuur, maar met de rekeneenheden en hun snelheid of frequentie. Daarom laat het elke parameter weg die de prestaties beïnvloedt, zoals inputs en outputs, de opstelling van caches, hun latenties, ALU's, bussen en anderen.

Om een ​​eenvoudig en duidelijk voorbeeld te geven, de RX 5700 XT krijgt 9,754 TFLOPS, terwijl de RTX 2070 7,465 TFLOPS krijgt, wat een verschil zou weerspiegelen van 30.66% tussen de twee is de voorstelling echter praktisch hetzelfde in het echte leven.

Hoe kom je bij deze nummers? Erg makkelijk:

  • TFLOPS-> Shaders x 2 x boostfrequentie
  • RTX 2070-> 2304 x 2 x 1620 -> 7,464,960 FLOPS -> 7,465 TFLOPS
  • RX 5700 XT -> 2560 x 2 x 1905 MHz -> 9,753,600 FLOPS -> 9,753 TFLOPS

As AMD doet zijn berekeningen in Boost Clock, maar het blijkt dat de frequentie nooit echt zulke niveaus bereikt en ergens tussen de Game Clock en de Base Clock ligt, het is realistischer om opbrengsten te vergelijken om de laatste te nemen in plaats van de eerste, voor wat de RX 5700 XT zou ongeveer 8,217 TFLOPS .

Bovendien moet u om te vergelijken de prestatie per watt en in ieder geval de architectuur kennen, met alle variaties die dit met zich meebrengt. Dit geldt voor zowel CPU's, GPU's, consoles of elk ander onderdeel dat zijn zout waard is, waarbij in veel gevallen de kracht van de CPU en GPU worden toegevoegd als het gaat om SoC's, wat de meetlat nog ingewikkelder maakt. .