Fabric Attached Memory, hukommelse, der ikke er RAM eller cache i CPU

Fabric Attached Memory

Fremskridt inden for computerarkitektur medfører ikke kun forbedringer i processorerne, men også i de anvendte hukommelser, og mange gange skabes der nye typer hardware. En af dem er Fabric Attached Memory, en type RAM det er en del af det nye paradigme for in-memory-behandling. Hvad er det, og hvilke egenskaber har denne type hukommelse?

Inden du starter, skal det afklares, at du ikke finder Fabric Attached Memory på nogen pc på markedet i skrivende stund, selvom vi taler om en HEDT-arbejdsstation. Grunden? Enkelt, FAM er en type hukommelse, der er relateret til High Performance Computing eller HPC. Formålet med udviklingen af ​​denne type hukommelse? Det er meget vigtigt at overskride ExaFLOP'ens computerkraft og på dette tidspunkt systemernes hukommelsesarkitektur.

Hvad er Fabric Attached Memory?

Fabric Attached Memory

Vi forstår som Fabric Attached Memory (FAM) eller FAM en type hukommelse, der kan tilgås af en eller flere processorer, som kan være af samme type eller af en anden type. Hvordan adskiller det sig fra konventionelle minder? I det faktum, at den kan tilgås gennem en netværksgrænseflade, og da sammenkoblingsinfrastrukturerne udvikler sig til den såkaldte Netværk på en chip, kan det siges, at denne hukommelse, der er forbundet til grænsefladen, er nøglen til at accelerere processer i fremtidens CPU'er og GPU'er.

Når vi taler om RAM, tænker vi normalt på hukommelse eksternt til processoren, som er monteret på separate chips og tilgås via en grænseflade. Under denne definition kan vi tro, at vi kan definere 3DIC-kredsløbene med vertikalt forbundet hukommelse som FAM, men FAM, som navnet indikerer, er hukommelse, der er direkte forbundet med det, vi kalder "Fabric". Og hvad mener vi med det navn? Hvad er Northbridge, som er det element, der kommunikerer de forskellige processorer med hinanden og disse med RAM'en.

Nå, Fabric Attached Memory, er i Northbridge og derfor før RAM, deraf dens navn.

Scratchpad -hukommelseskonceptet

Cache -mikroskop

Når vi taler om Scratchpad-hukommelse, henviser vi til en alternativ RAM-brønd, adskilt fra hvad konventionel hukommelse er, hvad angår dens adressering, så det betyder, at hvert system med en Scratchpad-hukommelse kræver to datafangstsystemer. . Vi har selvfølgelig glemt at sige, at Scratchpad Memory normalt ikke findes uden for processoren, men inde i processoren. Hvilket har en række fordele:

  • Programmer, der kører inde i Scratchpad Memory, kører hurtigere på grund af den lave afstand til processoren og med lavere strømforbrug.
  • På grund af dets nærhed til processoren bruges et cachesystem ikke til at få adgang til nævnte hukommelse.

Denne type hukommelse er blevet brugt i årtier, og i dag kan vi finde den i shader-enhederne i GPU'er, så de er ikke en nyhed. Hvordan er det relateret til Fabric Attached Memory? Tja, det faktum, at FAM er en slags Scratchpad-hukommelse, men hvor brugen af ​​en netværksgrænseflade til at kommunikere gør den helt anderledes i sin adgang.

Fabric Attached Memory er et niveau forud for hierarkiet med hensyn til RAM, men dets adgang udføres som det gøres i et NoC, hvor de forskellige elementer fungerer som et sammenkoblet netværk med NoC i den centrale del og hvert element, der har din router . Det vil sige, for at få adgang til FAM'en er det kun nødvendigt at ringe til dens netværksadresse, og det er noget, som alle elementer i systemet kan.

Hukommelse er den største flaskehals for behandling

Evolución cuello botella memoria

I det ideelle system ville hukommelsen have tilstrækkelig responstid, så behandlingen af ​​instruktionerne blev udført med den højest mulige hastighed. Desværre har udviklingen af ​​hukommelsen ikke holdt trit med udviklingen af ​​processorer og er blevet en byrde, der har gjort det nødvendigt at finde løsninger på disse problemer.

Der er to grunde til, at hukommelsen ikke kan nå hastigheden, men den vigtigste er, at vi ikke kan lægge store mængder hukommelse inde i en processor, og derfor er vi nødt til at lægge den udenfor den på en anden chip. Det andet besvares med følgende spørgsmål: hvad sker der med de elektriske signaler, når ledningsafstanden øges? Dit energiforbrug vokser. Og det er her den Fabric Attached Memory udnytter alle sine fordele, da den er en hukommelse tæt på processorenhederne kan nå høje båndbredder uden at kræve et højt forbrug.

Multiprocesador hukommelse med tekstil

Men Fabric Attached Memory er ikke kun nøglen til at kommunikere elementer i den samme processor, men forskellige processorer med hinanden, for eksempel, hvis vi har flere SoC'er, der skal kommunikere regelmæssigt, skriver de normalt dataene i RAM'en, der deles af alle dem, så det senere genfindes. fra den samme RAM af resten af ​​processorerne for at fortsætte med arbejdet. Med Fabric Attached Memory er det ikke nødvendigt for processorerne at få adgang til RAM'en, da dataene kan skrives i Fabric Attached Memory, som er placeret på ét niveau i hierarkiet mellem de forskellige processorers sidste niveau cache og grænsefladen. til hver af dems RAM.

FAM'en er en del af fremtiden i pc'en

CPU-chipletter CPU GPU AMD Intel

I begyndelsen af ​​artiklen lavede vi udsagnet, der giver titlen til dette afsnit, men hver udsagn er stadig et svar på et spørgsmål, der svarer til en årsag. Og dette er ingen ringere end i konventionelle pc'er, at mængden af ​​FAM, der skal bruges i processoren, er begrænset. Så den bedste løsning er et chiplet-baseret system, hvor Northbridge er afbrudt fra resten af ​​systemet, som det er tilfældet i AMD's Ryzen 3000 og Ryzen 5000 CPU'er.

FAM'en skal i sin natur i hukommelseshierarkiet have mere kapacitet end den hurtigste cache, men mindre end RAM-hukommelsen. Med Northbridge på en separat chip er det muligt at integrere Fabric Attached Memory i den, men på en 2D -chip er det svært at gøre det. På den anden side er det en 3D-chip, der er sammensat af flere niveauer, med systemets Northbridge på det ene niveau og FAM-hukommelsen på de andre. Takket være dette accelereres en god del af processerne og endda tråde, der udfører processorerne parallelt og på en koordineret måde, og undgår dermed den enorme flaskehals forbundet med traditionel RAM.

Der er et stort antal applikationer, der har været belastet i ydeevne, ikke på grund af manglende behandlingshastighed, men på grund af manglende hukommelseshastighed. Placering af en hukommelse tættere på processoren afhjælper mange af disse problemer og med springet til chiplet-baserede processorer, hvor en enkelt processor er adskilt i flere stykker, og brugen af ​​nye emballeringssystemer muliggør implementering i pc'en.