Denna artificiella intelligens drar dina tankar med extrem precision

Denna artificiella intelligens drar dina tankar med extrem precision

Artificiell intelligens är förmodligen en av de teknikgrenar som har avancerat mest de senaste månaderna. Ledningen tas av OpenAi, ett företag knutet till Microsoft som inte har slutat visa förbättringar i sin multidisciplinära artificiella intelligens, som kan förstå och skriva text på olika språk och skapa bilder från beskrivningar .

Inte bara NFT:er avancerade 2021

dall-e-2 instruktioner

2021 medförde många framsteg inom området artificiell intelligens . För första gången i historien, naturlig språkbehandling och generativa modeller har gått samman. Vid mitten av året, OpenAI hade redan avancerat så mycket att de första produkterna baserade på dess API började kommersialiseras. Bland dem stack skriv-AI:erna ut, där användaren skriver en instruktion med normalt och aktuellt språk och maskinen resulterar i en mening eller ett stycke med korrekt syntaktisk struktur — utdatainformationen kommer inte nödvändigtvis att vara korrekt —.

Samma sak hände med bilderna. I början av 2021 presenterade OpenAI Platta , en implementering av dess artificiella intelligens som kan skapa bilder med text och utan att enbart förlita sig på specifik utbildning inom ett område. Den ursprungliga versionen av Dall-E höll dock inte länge. Inom några månader var OpenAI i rampljuset med CLIP, en AI som kan lära sig visuella modeller och som kan generera bilder med vissa stilar. Det är faktiskt träningsbasen som används av Wombo Art-appen för att skapa bilder i stil med Studio Ghibli eller Salvador Dalí, bland många andra tillgängliga varianter.

Men CLIP var inte heller den stora revolutionen 2021. I slutet av året lanserade OpenAI GLIDE, en slags Dall-E-gaffel med imponerande möjligheter, eftersom den kunde lösa vilken textinmatning som helst med en enda modell. Visuellt var CLIP överlägsen Dall-E. Även vad gäller upplösning och detaljer. De youtuber Dot CSV är en expert på detta område, och under det senaste året ägnade han sig åt att ladda upp informativa videor till sin kanal som förklarade hur han förbättrade den här tekniken med stormsteg.

Dall-Es avkastning förbättrades 2022

dall e variationer

Men detta 2022 har Dall-E återvänt till striden med Dall-E 2 . OpenAI bevisar återigen att man ligger i framkant av generativ modellutveckling med denna nya version, som förutom att matcha de redan imponerande funktionerna i GLIDE, även tillför sina egna funktioner. Den här nya versionen kan skala bilder och skapa varianter av ett foto. Det har också förbättrats avsevärt när det kommer till att generera skuggor, reflektioner och texturer i bilder.

Till exempel har en av stjärnfunktionerna i tidigare versioner av företagets artificiella intelligens varit att skapa ansikten. Tja, den andra generationen av Dall-E förhindrar skapandet av ansikten med programvara. Detta har gjorts i syfte att hindra människor från att skapa realistiska bilder eller filmer av offentliga personer. På så sätt kan artificiell intelligens inte användas för att generera djupa förfalskningar för att skapa bluff, desinformation eller nedvärdera andra människor.

För tillfället, denna teknik är inte tillgänglig för allmänheten . Vissa OpenAI-implementeringar är dock tillgängliga via tredjepartstjänster (vissa som att skriva är betalda) och andra kräver ett akademiskt konto för att använda programvaran.