IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

08-04-2024

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Fonte Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz António Branco.

Texto por Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil

Email de Contacto noticias@ciencias.ulisboa.pt

Tags

FCUL

CIÊNCIAS

ULisboa

António Branco

Inteligência Artificial

MediAlbertina

start-up

Notícias Relacionadas Já conhece o Albertina PT?

Fernando Pereira, vice-presidente Google Deepmind

26-11-2025

Fernando Pereira, antigo aluno de CIÊNCIAS e vice-presidente da Google Deepmind: “A matemática é o meu superpoder”

Especialista em Inteligência Artificial passou por Lisboa

26-11-2025

HortaFCUL avança com instalação de dois jardins-compostores

Protótipos instalados com prémio de concurso de ideias

24-11-2025

Ranking de Shanghai 2025 coloca ULisboa na liderança nacional em 23 áreas científicas, e destaca 41 áreas entre as melhores do mundo

Ranking revela áreas científicas mais bem classificadas

24-11-2025

Prémio Ciência Viva reconhece projeto que dá voz à ciência feita em Portugal

O programa “90 Segundos de Ciência” conquistou o Prémio Ciência Viva Media 2025.

24-11-2025

Investigadores de CIÊNCIAS foram à Lisboa Games Week mostrar o futuro dos jogos acessíveis e cooperativos

Videoogos criados no LASIGE

20-11-2025

Feira da Matemática arranca esta sexta com rostos conhecidos de CIÊNCIAS

Evento tem lugar no Museu de História Nacional de História Natural e das Ciências

19-11-2025

“A estatística é uma mais-valia para quem estuda ou trabalha em ciências naturais”

Tiago A. Marques participou em artigo premiado pela Wildlife Society

18-11-2025

Web Summit. “Não faltaram pessoas a mostrar curiosidade quando passavam pela nossa banca”

Projetos de Ciências ULIsboa marcaram presença no evento

18-11-2025

Investigadoras de CIÊNCIAS ganham competição do evento Universe com solução para crianças com dor crónica

IMAGI ganhou concurso de "pitches"

14-11-2025

Direção da Associação dos Estudantes define "autossuficiência" como objetivo para o novo mandato

Tomada de posse decorreu esta quinta-feira

12-11-2025

Alunos do Secundário visitam CIÊNCIAS para conhecer dinossáurios da Bacia Lusitaniana

Aula abordou temas de paleontologia e geologia

Selecionados para as bolsas da Gulbenkian de 2025

12-11-2025

Bolsas Gulbenkian Novos Talentos. "Quero trabalhar em investigação e esta é uma porta que se abre"

Apoios financeiros abrangem nove alunos de Ciências ULisboa

12-11-2025

Associação dos Estudantes de CIÊNCIAS lança novo número da revista IMPROP

A IMPROP sempre foi uma revista irreverente produzida por estudantes – e é assim que o mais recente número deste histórico título começa a ser distribuído esta quarta feira pela comunidade académica.