IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

O CVUniversitário é um curso teórico e prático de voluntariado universitário que pretende promover competências em voluntariado e contribuir para a implementação, disseminação e reconhecimento desta práti

A Exigo Consultores é uma empresa de consultoria em actividade desde 2001, focada na consultoria para o sector de saúde, principalmente a consultoria em economia da saúde, epidemiologia, análise matemática e esta

Se és Licenciado em Estatística Aplicada, Matemática Aplicada ou Matemática ou se és finalista de algum destes cursos, o Grupo Actualial pode ter a oferta de emprego que procuras.

Desvendado mistério com mais de meio século na atmosfera de Vénus.

Os painéis fotovoltaicos e a cobertura ecológica são dois exemplos de ações que visam a sustentabilidade do nosso campus e que podem ser replicadas noutros locais do país.

A Auchan Portugal Hipermercados pretende admitir Técnico de Reporting.

EU Joint Programme – Neurodegenerative Disease Research

A Unidade de Expressão Génica e Regulação do BioISI integra um dos dez consórcios europeus financiados pelo projeto “Common RNA-dependent pathways for motor-neuron degeneration in spinocerebellar muscular atrophy and amyotrophic lateral sclerosis”.

Dia 25 de Fevereiro, na Sala de Conferências da Reitoria da Universidade de Lisboa, das 10h00 às 12h30

A Bioenergetics, a equipa de Ciências da ULisboa, chegou à final do Leadership Tournament, venceu o desafio intermédio lançado pela SDG e prepara-se para participar na próxima edição do Global Management Challenge (GMC).

O Colégio Doutoral Mente-Cérebro tem como objetivo potenciar a capacidade organizacional, científica, formativa e técnica da Universidade de Lisboa (UL) no estudo da mente e do cérebro. O Colégio encontra-se aberto a todos os colegas com atividade nesta área que se proponham integrá-lo.

A. M. Galopim de Carvalho

2015 é o Ano Internacional dos Solos. O recurso fundamental à sobrevivência da humanidade surgiu no Silúrico superior, há cerca de 425 milhões de anos.

A Divisão de Ciências Físicas e Engenharia da King Abdullah University of Science and Technology (KAUST) está a oferecer oportunidades de estágios remunerados para estudantes, no seu campus da Arábia Saudita.

Pedro Veiga

Existem muitas tecnologias para aumentar a segurança no mundo dos computadores, mas muito mais importantes são os comportamentos de cada utilizador, em especial quando usam as populares e “gratuitas” aplicações.

SemEval 2015

André leal, aluno do mestrado em Engenharia Informática do Departamento de Informática (DI) de Ciências da ULisboa, obteve a segunda posição na SemEval-2015.

O "Enforcing Kids", projecto levado a cabo pelos alunos Cátia Raminhos e Jorge Santos, alunos de mestrado da FCUL, volta a

Bolsas LisMath

O Programa LisMath vai atribuir oito bolsas de doutoramento. As candidaturas terminam a 31 de março de 2015.

 

A Faculdade de Ciências da ULisboa, a Universidade Católica Portuguesa, o Fórum Empresarial da Economia do Mar e a Sociedade de Avaliação Estratégica e Risco assinaram a 3 de fevereiro de 2015 um protocolo de cooperação destinado a lançar a MARE STARTUP.

Candidaturas abertas para estudantes do ensino superior.

A MARE STARTUP conta com o suporte de mais de 600 investigadores do MARE – Centro de Ciências do Mar e Ambiente e da Universidade Católica Portuguesa (UCP).

No átrio do edifício C6 da Faculdade de Ciências da ULisboa encontram-se expostos os módulos da exposição "O Homem, O Cientista, O Professor" com informação relativa à vida e obra de José Sebasti&ati

“Os ensinamentos de Ciências foram fundamentais e imprescindíveis ao longo de todas as fases do projeto, uma vez que sem os mesmos teria sido muito mais difícil a execução dos diversos processos metodológicos, bem como o entendimento detalhado do background teórico que suporta o projeto em si”, declara a aluna do curso de Ciências da Saúde, Ana Margarida Drumond.

Activo até 19 de Março

Páginas