IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
16.º Encontro Nacional de Química-Física

O duplo evento decorreu entre 17 e 19 de julho e reuniu investigadores, docentes e outras personalidades ligadas à Química-Física.

Foto de grupo Ser Cientista 2024

Campus de CIÊNCIAS enche-se de curiosidade e boa disposição para receber alunos deste programa de Verão.

Formações C-Academy

É já em setembro que o campus de CIÊNCIAS vai ser palco de duas formações do programa ‘C-Academy - Formação Avançada em Cibersegurança’ do Centro Nacional de Cibersegurança.

Membros do Ciências em Harmonia (C-H), o projeto pioneiro de CIÊNCIAS para promoção do bem-estar entre alunos

O Ciências em Harmonia (C-H), projeto pioneiro de CIÊNCIAS, teve direito a destaque na edição de 23 de julho do jornal Público.

Ser Cientista 2024

Entre 22 e 26 de julho, 67 alunos do ensino secundário têm a oportunidade experienciar, durante uma semana, o que é ser cientista e como é o ambiente de investigação.

Licenciaturas CNA 2024

Vem definir o teu futuro e descobre o que temos preparado para ti. Candidata-te a CIÊNCIAS ULisboa!

Banner Prémio de Doutoramento em Ecologia - Fundação Amadeu Dias

Já são conhecidos os vencedores da edição 2024 do Prémio de Doutoramento em Ecologia - Fundação Amadeu Dias, organizado pela Sociedade Portuguesa de Ecologia (SPECO).

Jorge Buescu, professor do Departamento de Matemática (DM) de CIÊNCIAS, reeleito Vice-Presidente da European Mathematical Society (EMS)

Jorge Buescu, professor do Departamento de Matemática (DM) de CIÊNCIAS, foi reeleito Vice-Presidente da European Mathematical Society (EMS).

Verão na ULisboa em CIÊNCIAS

Foi com um sorriso na cara e com vontade de um dia regressarem, que os estudantes do programa Verão na ULisboa deixaram o campus de CIÊNCIAS, após as cerimónias de entrega de diplomas que decorreram nos dias 5 e 12 de julho.

Assinatura do Protocolo com a REDCORP

o passado dia 9 de julho a Direção de CIÊNCIAS assinou um protocolo de cooperação com a REDCORP, empresa de empreendimentos mineiros responsável pelo Projeto Lagoa Salgada.

CIÊNCIAS assinA um protocolo de colaboração com a Raiz Vertical Farms nas instalações de CIÊNCIAS, tendo sido assinado pelo Diretor da faculdade, Luís Carriço, e pela co-fundadora da startup Rede Vertical Farms, Inês Barros.

CIÊNCIAS assinou um protocolo de colaboração com a Raiz Vertical Farms, com o objetivo de instalar uma horta vertical no campus da faculdade.

Equipa do CSD Lab do BioISI

Uma equipa de investigadores do Laboratório de Estrutura e Dinâmica Celular (CSD Lab) do Instituto de Biossistemas e Ciências Integrativas (BioIS

Diogo Rodrigues Fernandes

Diogo Rodrigues Fernandes, doutorando de CIÊNCIAS e investigador no Centro de Ecologia, Evolução e Alterações Ambientais (

Banner O Planeta Vivo

“Temos este mundo, ou nada. E temos um grande problema se não entendermos o planeta que queremos salvar.” Esta citação de Carl Sagan é o mote do documentário ‘O Planeta Vivo’, que estreou no passado dia 3 de julho na RTP.

Vista Aérea do Observatório do Paranal

O Observatório do Paranal, no deserto do Atacama no Chile, que faz parte do Observatório Europeu do Sul (ESO), vai receber em 2025 um telescópio made in Portugal para observar o Sol.

Nuno Gonçalves e Inês Leite posam com os prémios junto aos restantes investigadores do Instituto de Astrofísica e Ciências do Espaço (IA)

Nuno Gonçalves e Inês Leite, estudantes de CIÊNCIAS, foram premiados na SPIE Astronomical Telescopes + Instrumentation, a maior conferência internacional sobre instrumentação para a Astronomia.

Ranking de Leiden: Há três áreas de investigação de CIÊNCIAS em que a ULisboa é líder nacional

A Universidade de Lisboa (ULisboa) está em primeiro lugar a nível nacional em três áreas de produção científica de CIÊNCIAS no reputado CWTS Leiden Ranking: Ciências da Vida e da Terra, Matemáti

Banner Curso PRODIGI

A partir de 2025 a Universidade de Lisboa em parceria com o Instituto Politécnico de Lisboa, vai disponibilizar uma nova formação online em competências digitais.

 

Inês Fragata, Margarida Matos, Sara Magalhães e Cristina Máguas.

CIÊNCIAS inaugura hoje oficialmente a infraestrutura laboratorial de investigação - Unidade de Evolução Experimental.

Imagem alusiva ao Deep Tech Talent Initiative (DTTI), um programa do European Institute of Innovation and Technology (EIT)

O Mestrado em Bioestatística de CIÊNCIAS foi acreditado pela Deep Tech Talent Initiative (DTTI), um programa do European Institute of Innovation and Technology (EIT).

Dois professores de CIÊNCIAS eleitos sócios da Academia das Ciências de Lisboa

Pedro Miguel Duarte e Luís Eduardo Neves Gouveia, professores de CIÊNCIAS, foram eleitos sócios da Academia das Ciências de Lisboa.

O Centro de Congressos da Alfândega do Porto é o palco da edição de 2024 do Encontro Ciência.

Luís Carriço (Diretor de CIÊNCIAS) e Carlos Martins (Presidente da EPAL) junto a um dos novos bebedouros.

A Faculdade de Ciências da Universidade de Lisboa aderiu ao desafio da EPAL - Empresa Portuguesa das Águas Livres de consumir Água da Torneira nas suas áreas comuns, representando mais um compromisso com o Ambiente e com

 Rodrigo Freitas, Francisco Graça e Diogo Ávila no Pódio dos 3000 metros obstáculos no Campeonato Nacional Universitário de Pista ao Ar Livre

Rodrigo Freitas, estudante de CIÊNCIAS, sagrou-se bicampeão no Campeonato Nacional Universitário (CNU) de Atletismo Pista Ar Livre.

Páginas