Google revela dois novos modelos LLM de IA abertos para todos

Google revela dois novos modelos LLM de IA abertos para todos

Menos de uma semana depois de ter apresentado os novos modelos LLM do Gemini, a Google encontra-se agora a revelar mais novidades para o mercado. Desta vez, a revelação da empresa será de dois novos modelos LLM abertos para todos.

Apelidados de Gemma, estes novos modelos LLM focam-se em serem inteiramente abertos para a comunidade, e capazes de processar dados em sistemas modestos comparativamente aos modelos mais avançados do Gemini.

A empresa revelou dois modelos em concreto: Gemma 2B e Gemma 7B, que a empresa afirma terem sido “inspirados” no Gemini, e encontram-se agora disponíveis para uso comercial e de investigação.

A empresa optou por não comparar estes modelos com alternativas no mercado, citando apenas nos seus documentos que estes foram criados para serem os “melhores” na sua área. No entanto, a empresa espera revelar mais detalhes sobre os mesmos brevemente, incluindo o benchmark dos mesmos em várias atividades.

Os modelos Gemma encontram-se disponíveis em várias plataformas, como a Hugging Face, MaxText e NeMo da NVIDIA. Os interessados podem começar a explorar as capacidades dos mesmos em breve, e treinar para os diferentes usos.

Embora a Google indique que os modelos são abertos a todos, é importante notar que os mesmos não são “open source”. Portanto, não se terá total abertura para conhecer como os mesmos funcionam, e ainda usam as tecnologias proprietárias da Google para tal.

A empresa afirma que os modelos abertos de LLMs estão a tornar-se cada vez mais relevantes no mercado, ainda mais com a expansão da IA para novas áreas. A empresa pretende aproveitar essa tendência, fornecendo as suas opções para quem pretenda ter acesso a modelos atualizados e capazes para os mais variados meios.

É ainda referido que estes modelos, embora sejam baseados no Gemini, podem correr em hardware modesto, o que abre as portas a que possam ser adaptados para sistemas com utilidade no mundo real e para um público mais vasto.

A par com estes novos modelos, a empresa revelou ainda um conjunto de guias para ajudar os programadores a criarem soluções responsáveis de IA, bem como ferramentas para ajudar no debug dos modelos.