IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Equipa HortaFCUL.

Depois da construção do anfiteatro da FCULresta com pedras de um aterro do Estádio Universitário, a HortaFCUL foi em outubro à Faculdade de Medicina de Lisboa (FMUL) em nova missão de resgate.

O Talent Bootcamp veio a CIÊNCIAS e não podia ter sido um sucesso maior!

Nos dias 6 e 7 de dezembro teve lugar em CIÊNCIAS, a 223.ª edição do Talent Bootcamp que contou com 195 bootcampers inscritos, 107 alunos de CIÊNCIAS e também 174 profissionais de 119 empresas.

O escalo-do-sado foi identificado como uma espécie endémica da bacia do Sado

Sofia Mendes, doutoranda de CIÊNCIAS, no Centro de Ecologia, Evolução e Alterações Ambientais (CE3C), é a principal autora do artigo científico publicado recentemente que revela a descoberta de uma nova espécie de peixe de água doce.

João Sequeira na oficina do Cientista Regressa à Escola.

No dia 5 de dezembro, João Sequeira visitou a Escola Básica São João de Brito, escola onde estudou, e uma outra, a Escola Básica Teixeira de Pascoais, para ensinar alunos de duas turmas do 4.º ano tudo sobre a magia de fazer simulações em computador.

Comissão Externa de Aconselhamento de CIÊNCIAS

Em 2024, CIÊNCIAS mantém-se no topo do desempenho científico nas suas áreas de atuação, com a investigação e ensino fundamentados no conhecimento científico.

Participantes do Nighttime Lettter Writing falam em círculo

No dia 21 de novembro, CIÊNCIAS acolheu a primeira edição portuguesa do Nighttime Letter Writing, um evento de escrita de cartas à mão a apelar a doações para alunos com carências económicas.

Foto Frederico Correia Cerqueira.

Frederico Correia Cerqueira, aluno do Mestrado em Engenharia Informática de CIÊNCIAS, e Manuel Santos, do Instituto Superior de Engenharia de Lisboa, desenvolveram o projeto BinBot: um robot alimentado por energia solar que pode ser a solução para revolucionar a limpeza urbana, de espaços comerciais, festivais de música e outros eventos.

Equipas do Health Crossing Borders e do Lotus.

Os pitches dos projetos Health Crossing Borders e Lotus foram distinguidos com o 1.º e o 2.º lugar, respetivamente, na categoria de estudantes da competição promovida pela H-INNOVA Health INNOVAtion HUB na Digital Health Summit 2024, que decorreu no Funchal na ilha da Madeira, nos dias 26 e 27 de novembro.

Cristina Branquinho, Sofia Augusto e Helena Cristina Serrano

Cristina Branquinho, Sofia Augusto e Helena Cristina Serrano, investigadoras de CIÊNCIAS no Centro de Ecologia, Evolução e Alterações Ambientais (CE3C), são 3 das autoras do capítulo “Drivers of change and their impacts on the WEFE nexus in the Mediterranean region”. 

Alan Phillips, investigador de Ciências, pelo sétimo ano consecutivo na lista de autores mais citados

Alan Phillips, investigador do Instituto de Biossistemas e Ciências Integrativas (BioISI), desenvolve o seu trabalho na área da Microbiologia e foi, este ano, reconhecido pela 7.ª vez consecutiva como um dos investigadores mais citados a nível mundial na categoria de Ciência Vegetal e Animal, na lista Highly Cited Researchers 2024 da Clarivate Analytics.

GEOxyz

No dia 6 de novembro, a GEOxyz, empresa de referência na área de hidrografia e serviços geofísicos e geotécnicos, abriu oficialmente um novo escritório em CIÊNCIAS.

Alunos do Colégio Moderno visitam CIÊNCIAS

Cerca de 200 alunos dos 3.º e 4.º anos participaram, nos dias 18 e 21 de novembro, em atividades de sensibilização no âmbito da Semana Europeia da Prevenção de Resíduos. Logo ao início da manhã, em ambos os dias, os mais pequeninos receberam as boas-vindas do Diretor de CIÊNCIAS, Luís Carriço.

Filipe Duarte Santos.

O Prémio Ciência Viva Media 2024 foi atribuído ao podcast 'A Escala do Clima' de Filipe Duarte Santos, geofísico e professor catedrático de CIÊNCIAS, em colaboração com o jornalista Francisco Sena Santos.

Professor Rui Agostinho

O percurso do professor Rui Agostinho foi celebrado numa sessão de homenagem com sala lotada, onde as cadeiras foram ocupadas por colegas de décadas e alunos de hoje, onde o carinho e a emoção pelo docente foram palpáveis.

Jorge Buescu

“Comunicar e divulgar Ciência de forma rigorosa é uma tarefa cada vez mais importante”. Quem o diz é o professor Jorge Buescu, matemático de CIÊNCIAS, hoje galardoado com o Grande Prémio Ciência Viva 2024.

Foto da equipa do projeto TaMuK a receber o prémio.

O projeto TaMuKTargeting Mutated KRAS, recebe o prémio Basinnov Innovation Award 2024, pelo desenvolvimento de um novo metalofármaco destinado ao tratamento de cancros com mutação na proteína KRAS, entre os quais se destacam os cancros colorretal e do pâncreas.

Semana Europeia da Prevenção de Resíduos em ciências

O programa inclui uma mini palestra com as Professoras Teresa Dias e Cristina Cruz do Departamento de Biologia Vegetal.

Logótipo da ULisboa, sobre um fundo em tons de vermelho e preto

A ULisboa destaca-se a nível mundial nas áreas de Engenharia Naval e Oceânica (4.º lugar), Engenharia Civil e Ciências Veterinárias (ambas em 44.º lugar), Engenharia Mecânica (50.º lugar), conforme divulgado pelo Global Ranking of Academic Subjects 2024 do Ranking de Shanghai.

Imagem de moléculas de CO2 e fotos dos investigadores.

A inovadora descoberta dos cientistas do Departamento de Química e Bioquímica (DQB) poderá contribuir para a diminuição das emissões de carbono da indústria e para a transição para um modelo de produção mais verde.

Foto de Maria Adelaide Ferreira a discursar na Ocean Summit

Lisboa foi palco da primeira edição da Ocean Summit, um evento que junta especialistas oriundos de quatro continentes, para falarem de inovação para a sustentabilidade do oceano.

Foto da sessão aberta ao público que decorreu em CIÊNCIAS

Entre os dias 28 e 30 de outubro o consórcio internacional responsável pela missão Ariel da Agência Espacial Europeia (ESA) reuniu-se em CIÊNCIAS e no Pavilhão do Conhecimento – Centro Ciência Viva.

Professores e Investigadores de CIÊNCIAS

Na passada quarta-feira, a região de Valência, em Espanha, foi assolada por cheias devastadoras: em 8 horas choveu o equivalente a um ano, num fenómeno provocado por uma gota fria, ou DANA - depresión aislada en niveles altos, na sigla em espanhol.

Foto de grupo dos bolseiros Gulbenkian Novos Talentos 2024 de CIÊNCIAS.

Este ano foram 13 os estudantes de CIÊNCIAS premiados com Bolsas Gulbenkian Novos Talentos, marcando uma subida em relação aos 11 do ano passado.

Imagem da Reitoria da Universidade de Lisboa com o logo do NTU Ranking.

A ULisboa continua a ser a melhor universidade portuguesa e uma das 200 melhores do mundo em várias áreas científicas investigadas em CIÊNCIAS, da Geociência à Física.

Nuno Garcia, Professor Auxiliar de CIÊNCIAS e investigador no LASIGE, foi o formador do curso.

Realizou-se hoje em CIÊNCIAS a primeira sessão de formação deste Programa, que contou com a presença da Ministra da Juventude e Modernização, Margarida Balseiro Lopes.

Páginas