Ta sztuczna inteligencja rysuje Twoje myśli z niezwykłą precyzją

Ta sztuczna inteligencja rysuje Twoje myśli z niezwykłą precyzją

sztuczna inteligencja to prawdopodobnie jedna z gałęzi technologii, która w ostatnich miesiącach rozwinęła się najbardziej. Prowadzenie przejmuje OpenAi, firma powiązana z Microsoft która nie przestała wykazywać ulepszeń w swojej multidyscyplinarnej sztucznej inteligencji, która jest zdolna do rozumienia i pisania tekstu w różnych językach i tworzenie obrazków z opisów .

Nie tylko transakcje NFT rozwinęły się w 2021 r.

Dall-e-2 instrukcje

Rok 2021 przyniósł wiele postępów w dziedzinie sztuczna inteligencja . Po raz pierwszy w historii przetwarzanie języka naturalnego i modele generatywne złożyli ręce. Do połowy roku OpenAI rozwinęła się już tak bardzo, że pierwsze produkty oparte na jej API zaczęły być komercjalizowane. Wśród nich wyróżniały się piszące AI, w których użytkownik pisze instrukcję w normalnym i aktualnym języku, a maszyna daje w wyniku zdanie lub akapit o poprawnej strukturze składniowej — informacja wyjściowa niekoniecznie będzie poprawna—.

To samo stało się z obrazami. Na początku 2021 roku zaprezentowano OpenAI Płyta , implementacja sztucznej inteligencji zdolnej do generowanie obrazów za pomocą tekstu i bez polegania wyłącznie na specjalistycznym szkoleniu w danej dziedzinie. Jednak oryginalna wersja Dall-E nie przetrwała długo. W ciągu kilku miesięcy OpenAI znalazł się w centrum uwagi dzięki CLIP, sztucznej inteligencji zdolnej do uczenia się modeli wizualnych i zdolnej do generowania obrazów o określonych stylach. Jest to w rzeczywistości baza treningowa wykorzystywana przez aplikację Wombo Art do generowania obrazów w stylu Studio Ghibli lub Salvador Dalí, wśród wielu innych dostępnych odmian.

Ale CLIP też nie był wielką rewolucją 2021 roku. Pod koniec roku OpenAI uruchomiło GLIDE, rodzaj widelca Dall-E o imponujących możliwościach, ponieważ był w stanie rozwiązać każdy wprowadzany tekst za pomocą jednego modelu. Wizualnie CLIP przewyższał Dall-E. Także pod względem rozdzielczości i szczegółowości. ten YouTuber Dot CSV jest ekspertem w tej dziedzinie i przez ostatni rok poświęcił się przesyłaniu na swój kanał filmów informacyjnych, wyjaśniających, w jaki sposób udoskonala tę technologię skokowo.

Poprawa zwrotów Dall-E w 2022 r.

Dall e wariacje

Jednak w 2022 r. Dall-E powrócił do walki z Dall E 2 . OpenAI po raz kolejny udowadnia, że ​​jest w czołówce rozwoju modeli generatywnych dzięki nowej wersji, która oprócz dopasowania już imponujących funkcji GLIDE, dodaje również własne funkcje. Ta nowa wersja może skalować obrazy i tworzyć wariacje zdjęcia. Znacznie poprawiła się również generacja cieni, odbić i tekstur na obrazach.

Na przykład jedną z głównych funkcji poprzednich wersji sztucznej inteligencji firmy było generowanie twarzy. Cóż, druga generacja Dall-E zapobiega tworzeniu twarzy przez oprogramowanie. Dokonano tego w celu uniemożliwienia ludziom tworzenia realistycznych obrazów lub filmów przedstawiających osoby publiczne. W ten sposób sztuczna inteligencja nie może być wykorzystywana do generowania głębokich podróbek w celu tworzenia oszustw, dezinformacji lub oczerniania innych ludzi.

W tej chwili ta technologia nie jest dostępny dla ogółu społeczeństwa . Jednak niektóre implementacje OpenAI są dostępne za pośrednictwem usług stron trzecich (niektóre, takie jak pisanie, są płatne), a inne wymagają konta akademickiego do korzystania z oprogramowania.