Cette intelligence artificielle dessine vos pensées avec une extrême précision

Cette intelligence artificielle dessine vos pensées avec une extrême précision

intelligence artificielle est probablement l'une des branches de la technologie qui a le plus avancé ces derniers mois. L'initiative est prise par OpenAi, une société liée à Microsoft qui n'a cessé de montrer des améliorations dans son intelligence artificielle multidisciplinaire, qui est capable de comprendre et d'écrire des textes dans différentes langues et créer des images à partir de descriptions .

Non seulement les NFT ont progressé en 2021

instructions dall-e-2

2021 a apporté de nombreuses avancées dans le domaine de intelligence artificielle . Pour la première fois dans l'histoire, traitement du langage naturel et modèles génératifs se sont donné la main. Vers le milieu de l'année, OpenAI avait déjà tellement avancé que les premiers produits basés sur son API ont commencé à être commercialisés. Parmi elles, les IA d'écriture se sont démarquées, dans lesquelles l'utilisateur écrit une instruction avec un langage normal et courant et la machine aboutit à une phrase ou un paragraphe avec une structure syntaxique correcte — les informations de sortie ne seront pas nécessairement correctes —.

La même chose s'est produite avec les images. Début 2021, OpenAI a présenté Lui donner , une implémentation de son intelligence artificielle capable de générer des images par texte et sans s'appuyer exclusivement sur une formation spécifique dans un domaine. Cependant, la version originale de Dall-E n'a pas duré longtemps. En quelques mois, OpenAI était à l'honneur avec CLIP, une IA capable d'apprendre des modèles visuels et capable de générer des images avec certains styles. C'est en fait la base d'entraînement utilisée par l'application Wombo Art pour générer des images dans le style du Studio Ghibli ou de Salvador Dalí, parmi de nombreuses autres variantes disponibles.

Mais le CLIP n'a pas non plus été la grande révolution de 2021. À la fin de l'année, OpenAI a lancé GLIDE, une sorte de fork Dall-E aux capacités impressionnantes, car il était capable de résoudre n'importe quelle saisie de texte à l'aide d'un modèle unique. Visuellement, CLIP était supérieur à Dall-E. Aussi en termes de résolution et de détails. Le youtuber Dot CSV est un expert dans ce domaine et, tout au long de l'année écoulée, il s'est consacré à la mise en ligne de vidéos informatives sur sa chaîne expliquant comment il améliorait cette technologie à pas de géant.

Les rendements de Dall-E se sont améliorés en 2022

toutes les variations

Cependant, ce 2022, Dall-E est revenu dans la mêlée avec De E 2 . OpenAI prouve une fois de plus qu'il est à la pointe du développement de modèles génératifs avec cette nouvelle version, qui en plus de correspondre aux fonctionnalités déjà impressionnantes de GLIDE, ajoute également ses propres fonctionnalités. Cette nouvelle version peut redimensionner les images et créer des variations d'une photo. Il s'est également considérablement amélioré lorsqu'il s'agit de générer des ombres, des reflets et des textures dans les images.

Par exemple, l'une des fonctions vedettes des versions précédentes de l'intelligence artificielle de l'entreprise était la génération de visages. Eh bien, la deuxième génération du Dall-E empêche la création de visages par logiciel. Cela a été fait dans le but d'empêcher les gens de créer des images ou des vidéos réalistes de personnalités publiques. De cette façon, l'intelligence artificielle ne peut pas être utilisée pour générer des faux profonds pour créer des canulars, de la désinformation ou dénigrer d'autres personnes.

Actuellement, cette technologie n'est pas accessible au grand public . Cependant, certaines implémentations d'OpenAI sont accessibles via des services tiers (certains comme l'écriture sont payants) et d'autres nécessitent un compte académique pour utiliser le logiciel.