Meta revela modelo de IA com mais de 4 mil idiomas

Meta revela modelo de IA com mais de 4 mil idiomas

A Meta confirmou hoje ter desenvolvido um novo modelo de linguagem, que ao contrário do que tem vindo a ser a norma, não será apenas um “clone” do ChatGPT da OpenAI. O novo Massively Multilingual Speech (MMS) é um projeto da Meta, focado em criar um sistema de IA que pode vir a ajudar na tradução para mais de 4000 idiomas diferentes e produzir texto-para-voz em mais de 1100 idiomas diferentes.

O Massively Multilingual Speech é mais um projeto da Meta baseado para o mercado da Inteligência Artificial, e hoje a empresa confirmou que o mesmo encontra-se a tornar open-source, abrindo as portas para a criação de novos conteúdos.

Mark Zuckerberg indicou que “Hoje, estamos a disponibilizar outro novo modelo de IA, a que chamamos Massively Multilingual Speech. O modelo consegue identificar mais de 4.000 idiomas e vai facilitar as conexões entre pessoas e o acesso à informação no próprio idioma”.

Os modelos de reconhecimento de voz existentes cobrem apenas cerca de 100 idiomas – Uma fração dos mais de 7.000 idiomas conhecidos falados no planeta. Ainda mais preocupante é o facto de quase metade destas línguas estarem em risco de desaparecer durante o nosso tempo de vida.

No projeto ‘Massively Multilingual Speech’ (MMS), a Meta deu um primeiro passo para ultrapassar este desafio, combinando o wav2vec 2.0 – a ferramenta pioneira em aprendizagem auto-supervisionada – e um novo conjunto de dados que fornecem informação rotulada para mais de 1100 línguas, e dados não rotulados para quase 4000 línguas.

Atualmente, a Meta partilha publicamente os seus modelos e códigos, para que outros membros da comunidade de investigação possam desenvolver o seu trabalho. Com este projeto, a Meta espera contribuir para preservar a diversidade linguística no Mundo. 

A empresa sublinha, no entanto, que o modelo ainda não é perfeito. Existem situações onde certas palavras ou frases podem ser reconhecidas de forma incorreta ou fora do contexto, elevando a resultados finais que não são inteiramente os acertados. No entanto, a empresa espera vir a melhorar o sistema durante os próximos tempos e com a ajuda da comunidade.