Esta inteligência artificial desenha seus pensamentos com extrema precisão

Esta inteligência artificial desenha seus pensamentos com extrema precisão

inteligência artificial é provavelmente um dos ramos da tecnologia que mais avançou nos últimos meses. A liderança está sendo assumida pela OpenAi, empresa ligada à Microsoft que não para de apresentar melhorias em sua inteligência artificial multidisciplinar, capaz de compreender e escrever textos em diferentes idiomas e criando imagens a partir de descrições .

Não apenas as NFTs avançaram em 2021

instruções dall-e-2

2021 trouxe muitos avanços na área de inteligência artificial . Pela primeira vez na história, processamento de linguagem natural e modelos generativos deram as mãos. Em meados do ano, OpenAI já havia avançado tanto que os primeiros produtos baseados em sua API começaram a ser comercializados. Dentre elas, destacaram-se as IAs de escrita, nas quais o usuário escreve uma instrução com linguagem normal e atual e a máquina resulta em uma frase ou parágrafo com estrutura sintática correta —as informações de saída não serão necessariamente corretas—.

A mesma coisa aconteceu com as imagens. No início de 2021, a OpenAI apresentou Laje , uma implementação de sua inteligência artificial capaz de geração de imagens por texto e sem depender exclusivamente de formação específica na área. No entanto, a versão original de Dall-E não durou muito. Em questão de meses, o OpenAI estava no centro das atenções com o CLIP, uma IA capaz de aprender modelos visuais e capaz de gerar imagens com determinados estilos. É de fato a base de treinamento usada pelo aplicativo Wombo Art para gerar imagens no estilo do Studio Ghibli ou Salvador Dalí, entre muitas outras variações disponíveis.

Mas o CLIP também não foi a grande revolução de 2021. No final do ano, a OpenAI lançou o GLIDE, uma espécie de fork Dall-E com capacidades impressionantes, pois era capaz de resolver qualquer entrada de texto usando um único modelo. Visualmente, o CLIP foi superior ao Dall-E. Também em termos de resolução e detalhe. o youtuber Dot CSV é um especialista neste campo e, ao longo do ano passado, dedicou-se a enviar vídeos informativos para seu canal explicando como ele estava aprimorando essa tecnologia aos trancos e barrancos.

Retornos de Dall-E melhorados em 2022

dall e variações

No entanto, neste 2022, Dall-E voltou à briga com De E 2 . O OpenAI mais uma vez prova que está na vanguarda do desenvolvimento de modelos generativos com esta nova versão, que além de corresponder aos recursos já impressionantes do GLIDE, também adiciona recursos próprios. Esta nova versão pode dimensionar imagens e criar variações de uma foto. Também melhorou significativamente quando se trata de gerar sombras, reflexos e texturas nas imagens.

Por exemplo, uma das funções estrela das versões anteriores da inteligência artificial da empresa foi a geração de rostos. Bem, a segunda geração do Dall-E impede a criação de rostos por software. Isso foi feito com o objetivo de impedir que as pessoas criem imagens ou vídeos realistas de figuras públicas. Dessa forma, a inteligência artificial não pode ser usada para gerar deep fakes para criar hoaxes, desinformação ou denegrir outras pessoas.

Atualmente, esta tecnologia não está disponível para o público em geral . No entanto, algumas implementações do OpenAI são acessíveis por meio de serviços de terceiros (alguns, como a escrita, são pagos) e outros exigem uma conta acadêmica para usar o software.