IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Talhões SUSBEAUTY

Estudo coordenado por Ana Duarte Rodrigues, investigadora do DHFC e do CIUHCT, demonstra que plantas autóctones do Algarve são mais sustentáveis do que as espécies exóticas introduzidas na paisagem e que esgotam os recursos hídricos da região.

Cristina Máguas

“A Federação Europeia de Ecologia (FEE) tem objetivos muito claros – um deles é o de alargar o conhecimento ecológico à Europa”, diz Cristina Máguas, primeira portuguesa a ser eleita presidente da rede europeia de ecólogos. A tomada de posse ocorre em janeiro de 2019.

Ana Subtil Simões

O que fazem e o que pensam alguns membros da comunidade de Ciências ULisboa? O Dictum et factum de novembro é com Ana Subtil Simões, técnica superior da Área de Comunicação e Imagem de Ciências ULisboa.

Campus Ciências ULisboa

Ciências ULisboa organiza no seu campus a competição internacional destinada a treinar equipas multidisciplinares de estudantes universitários para a inovação e o empreendedorismo na área da saúde. A equipa vencedora irá participar no EIT Health Winners Event, em Londres, nos próximos dias 11 e 12 de dezembro.

Diego Rubiera-Garcia

Aos 14 anos o investigador do polo de Ciências ULisboa do IA deslumbrou-se com um livro “A criação do Universo” e a teoria do big-bang. O que mais gosta de fazer é simples: pequenos cálculos sobre ideias que lhe vêm à mente!

líquenes

O 1.º Prémio de Doutoramento em Ecologia Fundação Amadeu Dias foi atribuído a Paula Matos. A investigadora do cE3c do polo de Ciências ULisboa irá apresentar a tese em Biologia e Ecologia das Alterações Globais no 17.º Encontro Nacional de Ecologia.

João Alexandre Medina Corte-Real, professor jubilado da Universidade de Évora, docente em Ciências ULisboa durante mais de 30 anos, faleceu a 31 de outubro. A Faculdade lamenta o triste acontecimento, apresentando as condolências aos familiares, amigos e colegas.

Burnout

Saiba mais sobre a síndrome de burnout, na rubrica habitual da psicóloga do GAPsi, Andreia Santos.

Pormenor de simulação de matéria a orbitar perto de um buraco negro

Há um buraco negro supermassivo, escondido, no centro da Via Láctea anunciou o ESO. O GRAVITY, que tornou possível esta observação, foi desenvolvido por um consórcio internacional, do qual fazem parte investigadores de Ciências ULisboa e da FEUP, integrados no CENTRA.

CCDesert

Ciências ULisboa, através do cE3c e do IDL, é um dos 37 membros fundadores do Centro de Competências na Luta contra a Desertificação criado pelo Governo este verão.

HortaFCUL

Contributo da HortaFCUL para a sustentabilidade do campus em 2017/2018.

Grande auditório de Ciências ULisboa

Novo ano escolar… Vida nova para muitos caloiros… Recorde a sessão de boas-vindas aos novos alunos de 2018/2019 e conheça as histórias de alguns deles.

Ciências da Sustentabilidade

O novo doutoramento da ULisboa foi concebido no âmbito do Colégio Food, Farming and Forestry e junta 42 professores de 17 faculdades e institutos da ULisboa. A primeira edição conta com 14 alunos.

navio James Clark Ross

Vanda Brotas, professora do DBV Ciências ULisboa e investigadora do MARE ULisboa, é a coordenadora do projeto Portwims, no âmbito do qual investigadores do MARE ULisboa participam em cruzeiros oceanográficos.

Anfiteatro da fCiências.ID

A ação COST CA 16118 ou Neuro-MIG visa o estabelecimento de uma rede de médicos e cientistas para o estudo das malformações do desenvolvimento cortical humano. Em setembro passado a comissão de gestão e os grupos de trabalho desta rede estiveram reunidos em Ciências ULisboa.

<i>Deep Learning</i>

A rubrica No Campus com Helder Coelho está de volta: “O que o homem tem necessidade, quando enfrenta o complexo, é de ‘agentes’ com um pouco de mais inteligência (estendida, aumentada) e de ajuda (cooperação, colaboração)”.

Paulo Motrena

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de outubro é com Paulo Motrena, técnico superior do Gabinete de Organização Pedagógica da Direção Académica de Ciências ULisboa.

Sala de aulas com crianças

Cerca de 90 alunos do Colégio S. João de Brito visitaram o DQB e DG Ciências ULisboa. O projeto educativo desta escola contempla a dinamização de atividades relacionadas com as ciências experimentais, destinadas a enriquecer as aulas de Estudo do Meio.

Campus de Ciências ULisboa

José Francisco Rodrigues, professor do DM e investigador do CMAFcIO de Ciências ULisboa, escreve sobre a interação profícua entre a Matemática e a Biologia, no Ano da Biologia Matemática, que celebra o extraordinário progresso das aplicações matemáticas na Biologia.

“Reportagem Especial - Adaptação às Alterações Climáticas em Portugal”

"Reportagem Especial - Adaptação às Alterações Climáticas em Portugal" está nomeada para o prémio internacional Best Climate Solutions 2018. É o único projeto ibérico a concurso.

Sara Magalhães

Nesta fotolegenda destacamos uma passagem da entrevista com Sara Magalhães, professora do Departamento de Biologia Animal, investigadora do cE3c, e que pode ser ouvida no canal YouTube e na área multimédia do site da Faculdade.

“Tomar consciência do tipo de relação que se tem connosco pode ser muito importante, na medida em que nos ajuda a perceber de que forma andamos ou não a cuidar de nós próprios”, escreve Andreia Santos, psicóloga do Gapsi, na sua rubrica habitual.

Átrio do C3

Este ano registaram-se mais de 6000 candidaturas aos cursos de Ciências ULisboa no âmbito do Concurso Nacional de Acesso. Em ambas as fases as vagas foram totalmente preenchidas. Durante a 1.ª fase de inscrições, matricularam-se 833 estudantes. A 2.ª fase de matrículas termina a 1 de outubro.

 Noite Europeia dos Investigadores

A Noite Europeia dos Investigadores foi lançada em 2005. “Ciência na cidade” é o tema desta edição que se realiza a 28 de setembro e conta com 22 iniciativas com o carimbo de Ciências ULisboa.

Ana Simões

É a primeira vez que uma cientista portuguesa preside à European Society for the History of Science. Ana Simões, professora do DHFC e cocoordenadora do CIUHCT, tomou posse como presidente desta sociedade científica, a 16 de setembro, durante o “8th ESHS Meeting”, ocorrido em Londres. O mandato de dois anos termina em 2020.

Páginas