IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Rita Eusébio e Ana Sofia Reboleira, nos laboratórios de Ciências ULisboa

Nova espécie descoberta no Parque Natural das Serras de Aire e Candeeiros

Cristina Branquinho, professora de CIÊNCIAS

Documento redigido em Manaus vai ser apresentado na Conferência das Nações Unidas

david macdonald dia da investigação

Investigador da Universidade de Oxford foi o convidado especial do Dia da Investigação e da Inovação

Margarida Santos-Reis no dia da Investigação e Inovação

Professora de CIÊNCIAS homenageada no Dia da Investigação e da Inovação

Passeio da Ciência

Novo Passeio da Ciência dá a conhecer centros de investigação e infraestruturas científicas

Nuno Garcia dos Santos durante a sessão

O Dia da Investigação e da Inovação da Faculdade de Ciências da Universidade de Lisboa (CIÊNCIAS) arrancou na manhã desta quarta-feira com uma sala bem concorrida de professores, cientistas e

observatório newathena

Nuno Covas lidera simulações relacionadas com o observatório NewAthena  

Palestra no Grande auditório de CIÊNCIAS

Núcleo de estudantes trouxe especialistas para ciclo de palestras 

salas de estudo

Evento da aliança Unite! teve lugar na Finlândia

O clima e a meteorologia serevem de tema ao prémio do IPMA

Prémio organizado pelo IPMA destina-se a jovens investigadores

Embaixadores de CIÊNCIAS

Ações de divulgação vão contar com 10 representantes de cursos de CIÊNCIAS 

Congresso Hub Connect

Congresso Connect Hub revelou detalhes da nova formação para profissionais de saúde

Catarina Guerreiro e Mário Cachão

Cocolitóforos têm um papel crucial na captação de dióxido de carbono

Doutoramento em Saúde Planetária

Novo doutoramento da Universidade de Lisboa arranca com sessão aberta ao público

Laureados do prémio Nobel da Química de 2025

Susumu Kitagawa, Richard Robson e Omar Yaghi são os laureados do Nobel da Química de 2025

Prémio Nobel da Química de 2025

O prémio Nobel foi atribuído esta terça-feira a John Clarke, Michel H. Devoret e John M. Martinis

Catarina Frazão-Santos tem trabalhado no planeamento dos oceanos

Investigadora do MARE lembra que planeamento do espaço marinho tem de ser flexível

Samuel Barata na prova de Brasov

Antigo aluno de química foi à Roménia tirar um segundo ao recorde nacional

Rui Malhó, no BioISI Day

O BioISI Day de 2025 ocupou apenas o dia de quinta-feira, mas permitiu antever o que reservam os próximos cinco anos de atividade do Instituto de Biossistemas e Ciências I

Investigadores de Ciências na Noite Europeia dos Investigadores

Investigadores de CIÊNCIAS marcaram presença no evento com demonstradores e palestras

Foto de grupo de grupos de estudantes internacionais

Visita à Serra de Grândola contou com 30 alunos internacionais

Jorge Relvas e Luís Ferreira

A Universidade de Lisboa iniciou ontem o novo ano académico com a cerimónia de Tomada de Posse do Reitor e da sua Equipa Reitoral, na Aula Magna.

Nuno Araújo, presidente do Departamento de Física de CIÊNCIAS

Evento revelou projetos de doutoramento a empresas

Páginas