14 de dezembro de 2024
- Publicidade -
Tudo Inovação

Nova IA da Meta traduz texto e fala em até 100 idiomas

Tecnologia está disponível para pesquisadores e desenvolvedores, com permissões para compartilhar e adaptar o conteúdo

 

 

A Meta recentemente lançou uma nova inteligência artificial (IA) multimodal para tradução de idiomas. Conhecida como SeamlessM4T, que significa “Massively Multilingual & Multimodal Machine Translation” ou “Tradução de Máquina Multilíngue e Multimodal Massiva”, em português, essa inovação está disponível como um projeto de código aberto e possui a habilidade de traduzir tanto texto quanto fala em aproximadamente 100 idiomas diferentes.

As funcionalidades-chave do SeamlessM4T incluem: reconhecimento automático de fala para cerca de 100 idiomas; tradução de fala para texto em aproximadamente 100 idiomas; tradução de fala para fala em mais de 100 idiomas de entrada e 36 idiomas de saída; tradução de texto para texto em cerca de 100 idiomas; tradução de texto para fala em mais de 100 idiomas de entrada e 36 idiomas de saída.

Veja detalhes da SeamlessM4T
O destaque do SeamlessM4T está na sua capacidade de realizar traduções a partir de um único comando de entrada. Isso significa que a plataforma pode processar e converter o mesmo modelo para texto ou áudio, além de identificar diversos idiomas utilizados na mesma frase.

Essa flexibilidade elimina a necessidade de criar comandos distintos toda vez que se deseja mudar o idioma ou o formato da tradução final. Resultados de testes publicados pela Meta evidenciam um desempenho altamente positivo para os idiomas suportados. 

 

LEIA TAMBÉM 

Threads vai ganhar versão web nos próximos dias 

- Publicidade -

Inteligência Artificial integra gestão de frota pública em Porto Alegre

Uso para pesquisadores e desenvolvedores
A Meta adotou uma abordagem aberta ao disponibilizar a tecnologia do SeamlessM4T sob a licença CC BT-NC 4.0 da Creative Commons. Isso permite que pesquisadores e desenvolvedores compartilhem e adaptem o conteúdo de acordo com suas necessidades.

Além disso, a empresa divulgou os metadados do “SeamlessAlign”, que é considerado o maior conjunto de dados abertos de tradução multimodal até o momento, contendo mais de 270 mil horas de fala e ajustes de texto.

Para experimentar a nova IA, você pode conferir uma demonstração da ferramenta em seamless.metademolab.com/demo.

- Publicidade -
Compartilhe:
Rafaela Viveiros
Formada em Jornalismo pela Universidade Paulista (Unip). Jornalista do Grupo EP, repórter do Tudo EP, está no portal desde 2021 e possui experiências com produção de matérias para os portais, edição de vídeos, imagens e criação de conteúdo para as redes sociais.
- Publicidade -
plugins premium WordPress