IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
GEOxyz

No dia 6 de novembro, a GEOxyz, empresa de referência na área de hidrografia e serviços geofísicos e geotécnicos, abriu oficialmente um novo escritório em CIÊNCIAS.

Alunos do Colégio Moderno visitam CIÊNCIAS

Cerca de 200 alunos dos 3.º e 4.º anos participaram, nos dias 18 e 21 de novembro, em atividades de sensibilização no âmbito da Semana Europeia da Prevenção de Resíduos. Logo ao início da manhã, em ambos os dias, os mais pequeninos receberam as boas-vindas do Diretor de CIÊNCIAS, Luís Carriço.

Filipe Duarte Santos.

O Prémio Ciência Viva Media 2024 foi atribuído ao podcast 'A Escala do Clima' de Filipe Duarte Santos, geofísico e professor catedrático de CIÊNCIAS, em colaboração com o jornalista Francisco Sena Santos.

Professor Rui Agostinho

O percurso do professor Rui Agostinho foi celebrado numa sessão de homenagem com sala lotada, onde as cadeiras foram ocupadas por colegas de décadas e alunos de hoje, onde o carinho e a emoção pelo docente foram palpáveis.

Jorge Buescu

“Comunicar e divulgar Ciência de forma rigorosa é uma tarefa cada vez mais importante”. Quem o diz é o professor Jorge Buescu, matemático de CIÊNCIAS, hoje galardoado com o Grande Prémio Ciência Viva 2024.

Foto da equipa do projeto TaMuK a receber o prémio.

O projeto TaMuKTargeting Mutated KRAS, recebe o prémio Basinnov Innovation Award 2024, pelo desenvolvimento de um novo metalofármaco destinado ao tratamento de cancros com mutação na proteína KRAS, entre os quais se destacam os cancros colorretal e do pâncreas.

Semana Europeia da Prevenção de Resíduos em ciências

O programa inclui uma mini palestra com as Professoras Teresa Dias e Cristina Cruz do Departamento de Biologia Vegetal.

Logótipo da ULisboa, sobre um fundo em tons de vermelho e preto

A ULisboa destaca-se a nível mundial nas áreas de Engenharia Naval e Oceânica (4.º lugar), Engenharia Civil e Ciências Veterinárias (ambas em 44.º lugar), Engenharia Mecânica (50.º lugar), conforme divulgado pelo Global Ranking of Academic Subjects 2024 do Ranking de Shanghai.

Imagem de moléculas de CO2 e fotos dos investigadores.

A inovadora descoberta dos cientistas do Departamento de Química e Bioquímica (DQB) poderá contribuir para a diminuição das emissões de carbono da indústria e para a transição para um modelo de produção mais verde.

Foto de Maria Adelaide Ferreira a discursar na Ocean Summit

Lisboa foi palco da primeira edição da Ocean Summit, um evento que junta especialistas oriundos de quatro continentes, para falarem de inovação para a sustentabilidade do oceano.

Foto da sessão aberta ao público que decorreu em CIÊNCIAS

Entre os dias 28 e 30 de outubro o consórcio internacional responsável pela missão Ariel da Agência Espacial Europeia (ESA) reuniu-se em CIÊNCIAS e no Pavilhão do Conhecimento – Centro Ciência Viva.

Professores e Investigadores de CIÊNCIAS

Na passada quarta-feira, a região de Valência, em Espanha, foi assolada por cheias devastadoras: em 8 horas choveu o equivalente a um ano, num fenómeno provocado por uma gota fria, ou DANA - depresión aislada en niveles altos, na sigla em espanhol.

Foto de grupo dos bolseiros Gulbenkian Novos Talentos 2024 de CIÊNCIAS.

Este ano foram 13 os estudantes de CIÊNCIAS premiados com Bolsas Gulbenkian Novos Talentos, marcando uma subida em relação aos 11 do ano passado.

Imagem da Reitoria da Universidade de Lisboa com o logo do NTU Ranking.

A ULisboa continua a ser a melhor universidade portuguesa e uma das 200 melhores do mundo em várias áreas científicas investigadas em CIÊNCIAS, da Geociência à Física.

Nuno Garcia, Professor Auxiliar de CIÊNCIAS e investigador no LASIGE, foi o formador do curso.

Realizou-se hoje em CIÊNCIAS a primeira sessão de formação deste Programa, que contou com a presença da Ministra da Juventude e Modernização, Margarida Balseiro Lopes.

Primeira reunião do projeto Twinning 3BATwin

Nos dias 2 e 3 de outubro realizou-se, em CIÊNCIAS, a reunião de abertura do projeto ‘3BAtwin - Bone, Brain, Breast and Axillary Medical Microwave Imaging’, um projeto Twinning europeu coordenado pela FCiências.ID, com a coordenação científica da investigadora Raquel Conceição.

Foto de grupo da organização do evento

Terminou, no passado dia 19 de outubro, no Grande Auditório de Ciências ULisboa, a 16.ª edição do Workshop on BioMedical Engineering, um evento onde professores, investigadores e estudantes se juntam para construir um espaço “onde a Tecnologia encontra a Medicina”.

Sessão de Posters CIÊNCIAS Research & Innovation Day 2024

Centenas de participantes, entre investigadores e comunidade académica, juntaram-se no Grande Auditório para debater o tempo da Ciência e a Ciência do tempo. Salvatore Capozziello, keynote speaker, confirmou que as teorias sustentam a possibilidade de viagens no tempo.

Polvos e peixes caçam em equipa

Os investigadores Eduardo Sampaio e Rui Rosa, do MARE - Centro de Ciências do Mar e do Ambiente, provaram que os polvos e os peixes caçam em equipa de forma organizada.

Distribuição geográfica e afiliações institucionais dos membros do ERGA-Portugal

O Atlas Europeu de Genomas de Referência (ERGA) é um projeto-piloto que visa desvendar o património genómico de 98 espécies, contribuindo para o seu conhecimento e conservação.

Estação RAEGE Santa Maria, Açores. A estação alberga um conjunto de equipamentos que nos permite estudar o nosso planeta através de tecnologia espacial.

Pedro Martins, estudante de doutoramento de CIÊNCIAS e do Instituto de Astrofísica e Ciências do Espaço (IA), contribuiu para a inauguração do novo programa de observação em astrofísica RAEGE-Az, em colaboração com a Rede Atlântica de Estações Geodinâmicas e Espaciais (RAEGE), na ilha de Santa Maria, nos Açores.

Prémio Nobel da Física 2024 - John J. Hopfield e a Geoffrey E. Hinton | Prémio Nobel da Química 2024 - Demis Hassabis, John M. Jumper e David Baker

A Inteligência Artificial (IA) tem sido o grande destaque deste ano nos prémios Nobel dedicados à Ciência.

Sólveig Thorsteinsdóttir, Susana Martins e Ana Rita Carlos

Nos últimos três anos e meio, investigadores de dois laboratórios do Centro de Ecologia, Evolução a Alterações Ambientais (CE3C) desenvolveram um estudo inovador, que revela novas informações sobre a distrofia muscular congénita tipo 1A (MDC1A).

Tec Labs Demo Day 2024

O Tec Labs - Centro de Inovação de CIÊNCIAS, espaço de referência na promoção do empreendedorismo científico e tecnológico em Portugal, realizou mais uma edição do aguardado Demo Day.

Utilizador a interagir com ecrã, mostrando os logótipos associados ao PRR

CIÊNCIAS participa nesta nova formação, oferecida pela Universidade de Lisboa e pelo Instituto Politécnico de Lisboa.

Páginas