Google revela dois novos modelos LLM de IA abertos para todos

Publicado em 21/02/2024 por Pedro Fernandes

Menos de uma semana depois de ter apresentado os novos modelos LLM do Gemini, a Google encontra-se agora a revelar mais novidades para o mercado. Desta vez, a revelação da empresa será de dois novos modelos LLM abertos para todos.

Apelidados de Gemma, estes novos modelos LLM focam-se em serem inteiramente abertos para a comunidade, e capazes de processar dados em sistemas modestos comparativamente aos modelos mais avançados do Gemini.

A empresa revelou dois modelos em concreto: Gemma 2B e Gemma 7B, que a empresa afirma terem sido “inspirados” no Gemini, e encontram-se agora disponíveis para uso comercial e de investigação.

A empresa optou por não comparar estes modelos com alternativas no mercado, citando apenas nos seus documentos que estes foram criados para serem os “melhores” na sua área. No entanto, a empresa espera revelar mais detalhes sobre os mesmos brevemente, incluindo o benchmark dos mesmos em várias atividades.

Os modelos Gemma encontram-se disponíveis em várias plataformas, como a Hugging Face, MaxText e NeMo da NVIDIA. Os interessados podem começar a explorar as capacidades dos mesmos em breve, e treinar para os diferentes usos.

Embora a Google indique que os modelos são abertos a todos, é importante notar que os mesmos não são “open source”. Portanto, não se terá total abertura para conhecer como os mesmos funcionam, e ainda usam as tecnologias proprietárias da Google para tal.

A empresa afirma que os modelos abertos de LLMs estão a tornar-se cada vez mais relevantes no mercado, ainda mais com a expansão da IA para novas áreas. A empresa pretende aproveitar essa tendência, fornecendo as suas opções para quem pretenda ter acesso a modelos atualizados e capazes para os mais variados meios.

É ainda referido que estes modelos, embora sejam baseados no Gemini, podem correr em hardware modesto, o que abre as portas a que possam ser adaptados para sistemas com utilidade no mundo real e para um público mais vasto.

A par com estes novos modelos, a empresa revelou ainda um conjunto de guias para ajudar os programadores a criarem soluções responsáveis de IA, bem como ferramentas para ajudar no debug dos modelos.

Adiciona no ecrã inicial!