IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Impressão artística da missão Euclides no espaço.

A 25 de maio (sábado), às 21h00, vamos ver e compreender as novas imagens de entre as maiores alguma vez feitas do Universo, no Grande Auditório de CIÊNCIAS (Edifício C3). A entrada é livre.

Redes Doutorais Marie Curie Projeto PROMOTE

CIÊNCIAS vai participar numa das propostas vencedoras do concurso 2023 das Redes Doutorais de Ações Marie Skłodowska-Curie (MSCA DN).

Foto de entrega de prémio aos vencedores

No âmbito do projeto Invasives e como atividade inserida na

Dia Nacional dos Cientistas - 16 de maio

O Dia Nacional dos Cientistas foi instituído em 2016 por Resolução da Assembleia da República com o objetivo de reconhecer e celebrar a contribuição vital dos cientistas para o progresso da sociedade.

CIÊNCIAS e OKEANOS em parceria para monitorizar biodiversidade e alterações dos ecossistemas marinhos

Projeto internacional SEAGHOSTS visa a monitorização e conservação das populações de painhos, as aves marinhas mais pequenas do planeta.

Reitoria da ULisboa

O CWUR 2024 avaliou de entre 20.966 instituições de ensino superior e atribuiu à ULisboa o 211.º lugar (top 1.1%) e a 80.ª posição no panorama europeu.

Fotografia de participantes na Training School

CLEANFOREST na vanguarda da compreensão dos efeitos dos extremos climáticos e poluição nas florestas Europeias

Participantes no Dia Aberto

O campus ganhou vida, cor e energia proveniente do entusiasmo dos cerca de 2000 alunos de 170 escolas de norte a sul do País.

CIÊNCIAS esteve presente nesta edição, com a participação dos docentes do Departamento de Física: Alexandre Cabral, no painel de abertura “À conversa sobre carreiras espaciais” e

Semana Internacional da Compostagem

Uma das transformações necessárias às entidades que querem progredir pelo caminho da sustentabilidade é fecharem os seus ciclos de materiais, nomeadamente o orgânico.

A VicenTuna - Tuna da Faculdade de Ciências da Universidade de Lisboa - completou 30 anos em janeiro de 2024. Para comemorar, realizou no dia 30 de abril de 2024, a Festa da Primavera, um espetáculo de música e divertimento dedicado à comunidade de CIÊNCIAS e ao público em geral.

Celebrações dos 50 anos do 25 de abril de 1974 da Academia das Ciências de Lisboa

A 9 de maio realiza-se a segunda de duas jornadas de debate académico e científico organizadas pela Academia das Ciências de Lisboa, que tem por objetivo ‘analisar e discutir a evolução do panorama científico português de forma prospetiv

Lançamento do projeto Barrocal-Cave marca um novo capítulo na Conservação da Biodiversidade em Portugal

O prestigiado Palácio Gama Lobo foi o cenário escolhido para o lançamento do projeto Barrocal-Cave, financiado pelo Prémio Fundação Belmiro de Azevedo 2023.

No passado dia 10 de abril, tivemos a honra de receber um grupo de estudantes e dois professores da Universidade de Leiden, na Holanda. Com um total de 40 estudantes, todos da área das bio farmacêuticas, a visita prometia ser entusiástica.

Miguel Pinto

No dia 29 de abril, Miguel Pinto visitou a Escola Básica Professora Aida Vieira, no Bairro Padre Cruz em Lisboa, para realizar oficinas de divulgação científica e atividades didáticas.

Fotografia de alguns dos oradores

O que é a sustentabilidade? Como podemos agir a nível local, procurando um impacto global? Estas e muitas outras questões marcaram a segunda edição da Semana da Sustentabilidade CIÊNCIAS, entre 15 e 19 de abril de 2024.

Grande Auditório durante a celebração do 113.º aniversário de CIÊNCIAS

Mais de 500 pessoas assistiram no Grande Auditório à celebração do 113.º aniversário de CIÊNCIAS, na passada terça-feira, 23 de abril, numa cerimónia marcada por distinções, homenagens e um balanço dos últimos meses, com os olhos postos no futuro. 

Buracos negros Gaia

Um grupo de cientistas descobriu um grande buraco negro, com uma massa quase 33 vezes superior à massa do Sol, escondido na constelação de Aquila, a menos de 2000 anos-luz da Terra, ao analisar a grande quantidade de dados da missão Gaia da ESA.

Alunos com mãoes no ar num sala de aula

É possível brincar com a Matemática e prova disso foram as várias atividades que se realizaram na Faculdade nos dias 13 e 14 de março de 2024. Março foi um mês dedicado a esta ciência, motor da sociedade. Leia a opinião de quem participou nestas atividades e ainda nas Jornadas de Matemática.

robot e criança

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio.

Participantes da 1.ª edição do JAB

A 1ª edição do JAB, um evento inovador destinado a jovens empreendedores, organizado pela JUST - Júnior Iniciativa de Ciências ocorreu nos dias 22 e 23 de março passado e teve como foco a Educação de Qualidade, quarto Objetivo de Desenvolvimento Sustentável.

Pessoas

Uma comitiva da Shanghai Ocean University (SHOU), cuja origem remonta à Escola de Pesca da Província de Jiangsu, fundada em 1912, visitou Ciências ULisboa no passado dia 25 de março. Wang Hongzhou, presidente do Conselho da universidade chinesa, elogiou o avanço da investigação realizada na Ciências ULisboa, destacando as boas práticas de gestão, interdisciplinaridade e foco na missão. Durante a ocasião, Luís Carriço, diretor da Ciências ULisboa, reconheceu a importância das relações bilaterais com a China.

Alunos dinarmarqueses junto à tabela periódica

Um grupo de 25 estudantes do ensino secundário do Egedal Gymnasium & HF, da Dinamarca, visitou a Ciências ULisboa no passado dia 21 de março.

Páginas