O Google apresentou o Gemini, seu mais recente avanço em inteligência artificial (IA), um modelo de linguagem multimodal que promete ultrapassar as capacidades do GPT-4 da OpenAI, amplamente utilizado no conhecido chatbot ChatGPT.
A estrutura foi concebida para impulsionar o desempenho de uma gama de produtos, desde os aplicativos do Google até os dispositivos Android.
A visão ambiciosa do Google ficou evidente no comunicado de lançamento, que destacou o Gemini como o principal e mais poderoso modelo de inteligência artificial da empresa.
Anunciado pelo CEO e cofundador do Google DeepMind, Demis Hassabis, o Gemini é descrito como um modelo capaz de processar uma variedade de informações, incluindo texto, áudio, imagem, vídeo e linguagens de programação.
A ênfase da empresa está em torná-lo menos parecido com um software inteligente e mais com uma ferramenta útil e intuitiva, permitindo respostas contextualizadas a questões complexas.
LEIA TAMBÉM
65% dos alunos afirmam que se distraem nas aulas de Matemática por causa do celular
IA pode ser usada no combate à lavagem de dinheiro, diz presidente do BC
O Gemini é apontado como o modelo mais flexível desenvolvido pela empresa até o momento, projetado para ser implementado tanto em data centers quanto em dispositivos móveis, como smartphones. Lançado na versão Gemini 1.0, a ferramenta será distribuída em três tamanhos distintos:
Gemini Ultra: destinado a lidar com tarefas altamente complexas;
Gemini Pro: ideal para escalabilidade em um amplo espectro de tarefas;
Gemini Nano: uma versão mais compacta e eficiente para atividades em dispositivos móveis.
Gemini pode ser usada no Google Bard
Disponível desde ontem (06) no Google Bard em 170 países, o Gemini inicialmente estará disponível apenas em inglês. No entanto, a previsão é expandir para mais idiomas até 2024, quando a versão mais poderosa será incorporada ao chatbot.
IA está em vários produtos do Google
Além disso, o Gemini já está presente no Google Pixel 8 Pro e será integrado à busca do Google, ao Chrome e a outros serviços e produtos da empresa. No celular, o Gemini Nano poderá executar tarefas no aplicativo de gravação de áudio e na função Smart Reply do Gboard no WhatsApp.
Previsto para ser lançado no próximo ano, o Gemini Ultra passará inicialmente por um período de teste com clientes, desenvolvedores, parceiros e especialistas em segurança e responsabilidade, visando coletar feedbacks para aprimoramentos.
Google já recebeu feedbakcs positivos do Gemini
De acordo com o Google, o Gemini foi concebido para ser nativamente multimodal, possibilitando a compreensão e o raciocínio sobre diversos tipos de informações desde sua origem.
O Google destaca que o Gemini obteve sucesso em 30 dos 32 benchmarks acadêmicos utilizados na pesquisa e desenvolvimento de grandes modelos de linguagem. A versão Ultra, com uma pontuação de 90%, seria o primeiro modelo a superar especialistas humanos em Massive Multitask Language Understanding (MMLU).
Comparado ao GPT-4, o Gemini Ultra demonstrou superioridade em capacidades de texto, raciocínio, matemática e programação. Em testes multimodais, mostrou-se mais confiável em situações envolvendo imagens, vídeos e áudios, segundo dados divulgados pela empresa.
LEIA MAIS