GPT-4 er nu officiel: hvordan den seneste version af kunstig intelligens fungerer

Midt i den nuværende ChatGPT boom hans firma, OpenAI, har udgivet GPT-4 , en mere kraftfuld opgradering til sin tidligere model, der endda kan analysere billeder og har bedre ræsonnement. OpenAI er så sikker på revolutionen, som GPT-4 indebærer, at den ikke har tøvet med at erklære, at den ” overgår ChatGPT i sine avancerede ræsonnementer ".

GPT-4 er den seneste milepæl i OpenAI's indsats for at udvide dyb læring til kunstig intelligens. GPT-4 er en stor multimodal model (accepterer billed- og tekstinput og udsender tekstoutput), der, selv om den er mindre dygtig end mennesker i mange scenarier i den virkelige verden, udviser præstation på menneskeligt niveau på forskellige synsvinkler. akademisk og faglig reference.

GPT-4 er nu officiel

GPT-4 er den nye revolution

GPT står for generative pre-trained transformer, og GPT-4 er en del af en række grundlæggende sprogmodeller, der går tilbage til original GPT i 2018. Efter den oprindelige udgivelse annoncerede OpenAI GPT-2 i 2019 og GPT-3 i 2020. En anden forfining kaldet GPT-3.5 ankom i 2022. I november udgav OpenAI ChatGPT , som på det tidspunkt var en raffineret chatmodel baseret på GPT-3.5 .

Over tid har OpenAI øget størrelsen og kompleksiteten af ​​hver GPT-model, hvilket resulterer i generelt bedre ydeevne, model over model, sammenlignet med, hvordan et menneske ville færdiggøre tekst i samme scenarie, selvom det varierer fra opgave til opgave. GPT-4 er en stor multimodal model, der er i stand til at behandle billede og tekstinput og fremstilling af tekstoutput. Det har potentiale til at blive brugt i en lang række applikationer, såsom dialogsystemer, tekstresumé og maskinoversættelse.

Brugerbillede af twitter
Åbn AI
@OpenAI
Annoncering af GPT-4, en stor multimodal model, med vores bedste resultater nogensinde med hensyn til muligheder og tilpasning: https://t.co/TwLFssyALF https://t.co/lYWwPjZbSg
14. marts 2023 • 18:00

58.2K

4.9K

Et af hovedmålene med at udvikle denne nye version er at forbedre sin evne til at forstå og generere tekst i naturligt sprog , især i mere komplekse scenarier. For at teste sine muligheder i sådanne scenarier blev GPT-4 endda testet på en række forskellige tests, der oprindeligt er designet til mennesker. Den klarer sig ret godt på disse vurderinger, og overgår ofte det store flertal af menneskelige testpersoner, normalt de øverste 10 % af testpersonerne (dette er i modsætning til GPT-3.5, den version, ChatGPT var baseret på, som scorede på de nederste 10 % ).

GPT-4 er mere kreativ og samarbejdsvillig end nogensinde. Du kan generere, redigere og iterere med brugere på kreativ og teknisk skrivning opgaver, såsom at komponere sange, skrive manuskripter eller lære en brugers skrivestil. I afslappet samtale kan skelnen mellem GPT-3.5 og GPT-4 være subtil. Forskellen opstår, når opgavens kompleksitet når en tilstrækkelig tærskel: GPT-4 er mere pålidelig, kreativ og dygtig at håndtere meget mere konkrete instruktioner end GPT-3.5.

"Vi brugte 6 måneder på at gøre GPT-4 mere sikker og mere pålidelig. GPT-4 er 82 % mindre tilbøjelige til at reagere på anmodninger om ikke-tilladt indhold og 40 % større sandsynlighed for at give pålidelige svar end GPT-3.5 i vores interne evalueringer."

GPT-4

På trods af denne revolution, begrænsninger er stadig anerkendt . "GPT-4 har stadig mange kendte begrænsninger, som vi arbejder på at løse, såsom social bias, hallucinationer og modstridende indikationer. Vi tilskynder og faciliterer gennemsigtighed, brugeruddannelse og øget AI-kompetence, når samfundet omfavner disse modeller. Vi har også til hensigt at udvide adgangsmulighederne for folk til at forme vores modeller."

I øjeblikket, GPT-4 er tilgængelig i ChatGPT Plus og som API for udviklere til at bygge applikationer og tjenester. Nogle af de mærker, som der allerede er annonceret alliancer med, omfatter Duolingo, Be My Eyes, Morgan Stanley eller Khan Academy.

Hvad du kan gøre takket være GPT-4

Greg Brockman, præsident og medstifter af OpenAI, viste i GPT-4-præsentationen nogle af de anvendelser, som denne nye version af modellen kan bruges til. For eksempel takket være billedgenkendelse , det giver dig mulighed for at analysere dem og starte samtaler om dem. Hvis du uploader et billede med det du har i køleskabet og spørger "Hvad kan jeg gøre med disse ingredienser?" det burde give dig en fuld recept tilbage.

GPT-4 reconocimiento billeder

Også gennem Be My Eyes kan du beskrive og forstå, hvad der er interessepunktet i et billede, endda opdelt i forskellige kasser eller sektioner. Be My Eyes bruger GPT-4 til at transformere visuel tilgængelighed . Forskellen på GPT-4 og andre sprog- og maskinlæringsmodeller, forklarer Jesper Hvirring Henriksen, CTO i Be My Eyes, er både evnen til at føre en samtale og den større grad af analytisk dygtighed, som teknologien tilbyder.

"Grundlæggende billedgenkendelsesapps fortæller dig kun, hvad der er foran dig. De kan ikke have en diskussion for at forstå, om nudlerne har den rigtige slags ingredienser, eller om genstanden på gulvet ikke bare er en bold, men en snublefare, og kommunikere det.”

I en af ​​de demoer vist af OpenAI, muligheden for endda at omdanne simple input til kode og oprette en webside ud fra et simpelt billede blev vist. Et billede med en meget grundlæggende skitse af en webside, som brugeren ønskede at oprette med HTML og JavaScript, blev vist, og GPT-4 returnerede den nødvendige kode for at oprette denne webside med alt i rækkefølge som vist på skitsen.

Brugerbillede af twitter
Rowan Cheung
@rowancheung
Jeg har lige set GPT-4 forvandle en håndtegnet skitse til en funktionel hjemmeside.

Det her er sindssygt. https://t.co/P5nSjrk7Wn

14. marts 2023 • 21:47

10.7K

690

Hvis du er fan af memeet "masser af tekst", er GPT-4 nu en god allieret til at hjælpe dig med at forstå og syntetisere store tekststrenge. GPT-4 er i stand til at håndtere over 25,000 ord tekst , hvilket muliggør brugssager som f.eks. skabelse af indhold i lang form, udvidede samtaler og dokumentsøgning og -analyse.

Når det kommer til kreativ skrivning , kan du opnå nogle virkelig fantastiske ting, som ville koste et menneske en del timer i løbet af få minutter. Et eksempel, som OpenAI ønskede at fremhæve, viser svaret på følgende anmodning: "forklar mig plottet af Askepot i en sætning, hvor hvert ord skal starte med det næste bogstav i alfabetet fra A til Z, uden at gentage noget bogstav. Resultatet (på engelsk) kunne ikke være mere perfekt. «En smuk Askepot, der bor ivrigt, vinder endelig lykke; inspirerende jaloux pårørende, kærlighed nærer magisk en overdådig prins; stille og roligt redder, tøflen triumferer, forener sig meget forunderligt, xenial ungdom nidkært«.

Brugerbillede af twitter
Linus (●ᴗ●)
@LinusEkenstam
Her er nogle utrolige ting, folk allerede gør med GPT-4

Der er gået mindre end 3.5 time

🧵 En tråd

14. marts 2023 • 22:27

29.5K

968

spring i forhold til at skrive kode er også betydelig. I Twitter tråd, som du har ovenfor, som inkluderer nogle af de første GPT-4-applikationer, kan vi se, hvordan simple spil som Snake eller Pong er blevet genskabt, og giver koden til folk uden programmeringsviden.

For eksempel: GPT-4 er det, der driver den nye Bing , kører på denne nye version, der microsoft har tilpasset til søgning. Hvis du har brugt den nye Bing-forhåndsvisning på noget tidspunkt inden for de sidste fem uger, har du allerede oplevet en tidligere version af denne kraftfulde model. Når OpenAI laver opdateringer til GPT-4 og senere, Bing vil drage fordel af disse forbedringer sammen med sine egne opdateringer baseret på community-feedback. Faktisk, hvis du vil opleve GPT-4, tilmeld dig den nye Bing-forhåndsvisning , og når du først er med, vil du være i stand til at bruge den nye Bing til at søge, svare, chatte og oprette.

ansvarsfraskrivelse