O reinado do Chat GPT-4 está chegando ao fim? Um novo projeto de código aberto chamado MiniGPT-4 está ganhando atenção, pois oferece desempenho comparável ao Chat GPT-4. Desenvolvida por um grupo de estudantes, essa tecnologia de IA agora está disponível para acesso de demonstração gratuito. A eficiência do MiniGPT-4 em processos complexos de reconhecimento de imagem causou sensação entre os entusiastas de IA.
O Chat GPT-4 ainda é a tecnologia de IA mais usada globalmente e ganhou imensa popularidade. Suas aplicações vão desde a criação de aplicações web até a resolução de diversas dúvidas ou até mesmo na programação de videogames. No entanto, o MiniGPT-4 visa fornecer uma opção mais eficiente em menor escala, com a vantagem adicional de ser gratuito e não se limitar a processos simples como gerar rostos falsos com IA.
Criado por um grupo de alunos
O projeto MiniGPT-4 foi iniciado por uma equipe de estudantes da King Abdullah University of Science and Technology, na Arábia Saudita, com o objetivo de fornecer uma tecnologia semelhante ao Chat GPT-4, mas com abordagem e sistema únicos. Além disso, a equipe queria que o projeto fosse uma iniciativa de código aberto, acessível gratuitamente a todos.
O projeto MiniGPT-4 conta com tecnologia avançada para potencializar sua funcionalidade, incluindo o decodificador de linguagem Vicuna baseado em LlaMA e o poderoso componente BLIP-2, que permite recursos sofisticados de reconhecimento de imagem que podem ser aproveitados para responder perguntas com base em dados visuais. Apesar de ser apelidado de uma versão “mini” do GPT-4, o MiniGPT-4 apresenta um impressionante nível de eficiência de 90%, de acordo com a análise do GPT-4. Embora possa não corresponder às capacidades da IA da OpenAI, o desempenho do MiniGPT-4 é certamente digno de nota e atraiu um interesse significativo da comunidade de tecnologia.
O que ele é capaz de fazer?
Simplificando, o MiniGPT-4 tem uma capacidade semelhante ao Chat-GP4 em reconhecimento de imagem, mas com uma diferença de 10% em sua taxa de sucesso. Os gerentes de projeto forneceram exemplos claros para mostrar a capacidade de análise visual da IA. Um exemplo envolveu a análise de uma foto de uma planta doente para testar se a IA poderia detectar com precisão o que estava acontecendo com ela.
Segundo relatos, o MiniGPT-4 forneceu resultados precisos com apenas uma pergunta e a imagem da planta em questão. Outro exemplo envolveu o upload do logotipo da Vicuna para solicitar a opinião do MiniGPT-4, e a IA forneceu uma descrição completa e comentários sobre cada elemento, concluindo com uma avaliação final.
Apesar de suas capacidades impressionantes, o MiniGPT-4 ainda tem espaço para melhorias. As respostas da IA podem ser repetitivas e depender muito de certas frases e expressões, especialmente ao analisar imagens de fontes públicas. No entanto, os desenvolvedores reconhecem que esse problema pode ser resolvido com treinamento adicional. Atualmente, o MiniGPT-4 pode analisar fotos e gerar descrições de marketing, músicas e comentários relacionados a alimentos.
A versão atual do MiniGPT-4 passou por um processo de aprendizado de 10 horas com a ajuda de quatro GPUs A100 e 5 milhões de pares de texto e imagem. Com melhorias adicionais, a IA tem potencial para exceder seu desempenho atual. Os usuários interessados podem testar o MiniGPT-4 em seu site Github.
Para usar o MiniGPT-4, basta visitar o site e fazer o upload da imagem que deseja usar para a conversa. No entanto, lembre-se de que, se a foto for muito grande, o upload pode demorar um pouco. Depois disso, você pode digitar seu comentário ou pergunta e aguardar a resposta. Vale a pena notar que a velocidade de resposta pode variar e às vezes requer até 50 segundos para gerar uma resposta, como experimentamos durante nosso teste. No entanto, o tempo de espera é exibido no site para gerenciar as expectativas.