A DeepSeek, uma startup chinesa de inteligência artificial, depois de causar grande impacto no mercado mundial de tecnologia esses últimos dias com o sucesso de seu chatbot, voltou a chamar a atenção ao apresentar o Janus-Pro, uma nova linha de modelos de IA multimodais especializados em análise e geração de imagens.
Janus-Pro: DeepSeek já lançou IA de geração de imagens?
O lançamento do Janus-Pro foi nesta segunda-feira (27), com as versões Janus-Pro-1B e Janus-Pro-7B. A empresa afirma que o sistema supera em desempenho soluções amplamente reconhecidas, como o DALL-E 3, da OpenAI, e o 3 Medium, da Stable Diffusion, desafiando novamente as grandes companhias americanas.
Assim como o chatbot da startup chinesa, a DeepSeek afirma que o Janus-Pro também foi desenvolvido com um orçamento reduzido, o que permite oferecer um modelo eficiente e acessível. A startup também adotou uma política de preços agressiva para o Janus-Pro, oferecendo acesso ao modelo por valores bem abaixo dos praticados por gigantes do setor.
Como funciona o Janus-Pro?
O Janus-Pro é um modelo de inteligência artificial projetado para interpretar e criar imagens de forma integrada com texto. Ele é chamado de multimodal porque combina essas duas capacidades, permitindo, por exemplo, que descrições textuais sejam transformadas em imagens detalhadas.
Sua tecnologia, baseada em uma estrutura autorregressiva, constrói imagens passo a passo, como se estivesse pintando cada detalhe de maneira sequencial.
Em relação à eficiência, segundo a empresa, mesmo com menos parâmetros do que outros modelos renomados, ele é mais rápido, leve e flexível, superando alternativas como o DALL-E 3 em benchmarks de desempenho.
Além disso, permite aplicações variadas, desde a geração de imagens originais para projetos de design e publicidade, até a edição de imagens, como a restauração de fotos antigas ou a remoção de elementos. Ele também pode realizar análises de imagens, como identificar objetos ou emoções.
O modelo está disponível gratuitamente na plataforma Hugging Face, com código aberto sob a licença MIT, o que possibilita que desenvolvedores e pesquisadores personalizem sua utilização.
Quem é a DeepSeek
Fundada em 2023, a DeepSeek nasceu como parte de uma iniciativa do fundo de investimento High-Flyer, avaliado em US$ 8 bilhões. Seu modelo de chatbot, o DeepSeek-R1, foi projetado para realizar tarefas complexas de raciocínio com custo de treinamento reduzido.
Em números de download na AppStore, o app chinês DeepSeek lançado em janeiro deste ano já ultrapassou o ChatGPT. Na loja da Apple, ele é um dos mais bem avaliados. Além disso, ações da Nvidia e Oracle despencaram com a ascensão do aplicativo.
Sam Altman, CEO da OpenAI, reconheceu o potencial da DeepSeek em uma publicação do X, elogiando a eficiência dos modelos DeepSeek-R1 e V3, destacando que a competição impulsiona o avanço tecnológico. Apesar disso, Altman reforçou que novos lançamentos da OpenAI estão em desenvolvimento para manter sua relevância no setor.
A rápida popularização do DeepSeek também trouxe desafios. Ataques cibernéticos no dia do lançamento resultaram em instabilidades nos serviços, que precisou limitar temporariamente o registro de novos usuários. A startup afirmou que já solucionou os problemas.
LEIA MAIS