IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Participantes do simpósio no grande auditório da Faculdade

O primeiro Simpósio Internacional de Catálise Homogénea aconteceu nos EUA há 44 anos. A vigésima segunda edição ocorreu este ano em Portugal, na Ciências ULisboa. A próxima edição está marcada para 2024, em Itália. Este importante acontecimento tem contribuído para o desenvolvimento da Catálise Homogénea.

graficos, lupa e oculos numa mesa

Maria Zacarias, investigadora do Centro de Estatística e Aplicações da Universidade de Lisboa, escreve uma crónica sobre a última edição do “Sê Investigador por Três Semanas”, na qual dá a conhecer a opinião de quem participou na iniciativa que durante três semanas, possibilitou que alunos de licenciatura e de mestrado pudessem trabalhar de perto com investigadores e observar a transversalidade da Estatística.

coelho-bravo

A equipa do projeto do Livro Vermelho dos Mamíferos, que está a trabalhar na revisão do estatuto de ameaça e estado de conservação destas espécies em Portugal, realizou uma “compilação inédita” de dados de ocorrências georreferenciados de mamíferos em Portugal Continental e nos Açores e Madeira.

pessoas sentadas a escrever ao computador e em post its

Decorreu de 11 a 15 de julho na Ciências ULisboa a WideHealth Summer School sob o tema “Human Factors in Pervasive Health”. O evento foi organizado pelo LASIGE, tendo acolhido participantes de toda a Europa.

rapariga no laboratorio

Já são conhecidos os resultados do Concurso de Projetos de I&D em Todos os Domínios Científicos de 2022, da FCT. Do total de projetos aprovados para financiamento, 33 contam com a participação da Ciências ULisboa.

grupo de alunos do programa

"Na Ciências ULisboa temo-nos esforçado ao longo dos anos para desenvolver um programa que trará uma semana inesquecível a estes jovens", escreve Ana Sofia Santos, monitora central do Verão na ULisboa, no artigo de opinião sobre o programa.

rapariga a rir

"A ideia de que o sentido de humor pode facilitar o ajustamento, a gestão e a regulação emocional parece ter bastante fundamento. Mas, como, onde e como entram os limites do humor nesta questão?", escreve Samuel Silva, psicólogo no GAPsi Ciências ULisboa.

Instalações do Quake

Os cientistas Susana Custódio e Luís Matias escrevem sobre o Centro do Terramoto de Lisboa, que nasceu de uma vontade de contar a fascinante história do sismo de 1755. A Faculdade e o IDL Ciências ULisboa são parceiros do Quake. 

mar

Novo artigo científico publicado na Frontiers in Marine Science alerta para a necessidade de uma visão global para o oceano no acordo internacional atualmente em elaboração no quadro das Nações Unidas. Artigo conta com a participação de dois professores e investigadores da Ciências ULisboa.

imagem ilustrativa do prémio

O Prémio DHFC 2021 foi atribuído a Daniele Molinini, investigador do CFCUL, membro do grupo de investigação Filosofia das Ciências Formais, Metodologia e Epistemologia.

Hugo Duminil-Copin

"Hugo Duminil-Copin é um físico-matemático que trabalha em teoria das probabilidades. Um daqueles que, durante os vinte últimos anos, regressou à fonte histórica de inspiração das matemáticas, a física teórica", escreve Jean-Claude Zambrini, professor do DM Ciências ULisboa, no ensaio dedicado ao matemático galardoado com a medalha Fields.

posters afixados

“Jovens investigadores” é o projeto da EBS Alfredo da Silva, no Barreiro, que permite aos alunos estabelecerem uma relação de proximidade com professores e investigadores do ensino superior, nomeadamente da Ciências ULisboa.

Pessoa a trabalhar na FCULresta

Já existem mais três miniflorestas plantadas na AML e muitas outras estão a germinar. “A FCULresta cumpre assim um outro objetivo, o de inspirar e apoiar a plantação de mais florestas urbanas biodiversas”, escrevem David Avelar, António Alexandre e Diogo Mendes.

June Huh

"O que motiva June Huh é a busca da beleza na Matemática, e a descoberta de ligações entre diferentes áreas desta disciplina", escreve Carlos A. A. Florentino, professor do DM Ciências ULisboa, no ensaio dedicado ao matemático galardoado com a medalha Fields.

Alina Shchepetkina com outra investigadora

A expedição South Atlantic Transect II (IODP 393) zarpou a 11 de junho de 2022 da Cidade do Cabo, na África do Sul, e tem uma duração de 61 dias. A equipa a bordo tem cientistas de várias partes do globo na expectativa de obter respostas para algumas questões apaixonantes e relacionadas com alterações nos ambientes da Terra durante os últimos 61 milhões de anos. Uma dessas cientistas é Alina Shchepetkina, investigadora do Instituto Dom Luiz da Ciências ULisboa.

Membros da direção da Faculdade, Conselho de Escola e Reitor da ULisboa

Luís Carriço, professor do Departamento de Informática e investigador do LASIGE, tomou posse como diretor da Ciências ULisboa, esta quarta-feira, dia 20 de julho, numa cerimónia que juntou vários membros da Faculdade e Universidade, na sala de atos, sita no edifício C6. A boa disposição imperou no ato solene, durante o qual os professores Margarida Santos-Reis, Hugo Miranda, Jorge Relvas, Maria João Gouveia e Pedro Almeida foram indigitados subdiretores da Faculdade.

ímanes moleculares

Nuno A. G. Bandeira, investigador do DQB e do BioISI Ciências ULisboa, escreve sobre um estudo, que constitui um marco na evolução do conhecimento e na busca de melhores materiais para aplicação na spintrónica e computação à escala quântica.

Foto do instrumento NIRPS

O espectrógrafo NIRPS, a sigla inglesa para Near-Infrared high resolution spectrograph, ou espectrógrafo no infravermelho próximo de alta resolução, cujo desenvolvimento e construção contou com a participação do Instituto de Astrofísica e Ciências do Espaço (IA), observa na banda do infravermelho, no Telescópio ESO de 3,6 metros do Observatório de La Silla, no Chile, complementando assim espectrógrafos como o HARPS e o ESPRESSO. 

fundo marinho

Novo artigo publicado na Nature Ecology and Evolution, por uma equipa de 30 investigadores de todo o mundo, da qual fazem parte dois investigadores portugueses com ligação à Ciências ULisboa, resulta da consulta prévia de cerca de 680 especialistas e outros profissionais ligados ao meio marinho.

Anfiteatro no C8 e paryicipantes do evento

"A Conferência Internacional Hi-Phi teve um sucesso muito para além do expectável e mostrou a vitalidade do diálogo entre a História e a Filosofia das Ciências", escrevem Ana Duarte Rodrigues e João L. Cordovil, coordenadores científicos respetivamente do CIUHCT e do CFCUL, na crónica sobre o importante acontecimento.

3 alunos no labotarório

Dois anos depois de um interregno, “Ser Cientista” está de volta de 25 a 29 de julho e propõe a jovens alunos que experimentem a “vida” de um investigador.

saída de campo da Geologia

A Faculdade tem um novo ciclo de estudos acreditado pela  Agência e Avaliação e Acreditação do Ensino Superior (A3ES), para substituição dos mestrados na área da Geologia com 90 ECTS. O novo mestrado em Geologia tem a duração de dois anos, com 120 ECTS.

Pedreira

O mestrado em Geologia tem como objetivo formar profissionais com uma formação sólida em áreas chave das Ciências da Terra e que possam responder aos desafios da sociedade do século XXI. Artigo de opinião do Departamento de Geologia a propósito deste novo plano de estudos.

Mesa com vários oradores no grande auditório da Faculdade

A sessão de abertura do 30th International Carbohydrate Symposium foi antecipada e presencial, tendo sido gravada em Ciências ULisboa, para ser apresentada internacionalmente a 10 de julho, primeiro dia do simpósio. A cientista Amélia Pilar Rauter, nesta crónica, descreve o que aconteceu nessa sessão, o antes e depois… O simpósio termina a 15 de julho e segundo a presidente da International Carbohydrate Organisation  serão apresentadas as invenções e descobertas mais recentes, muitas delas relevantes para a sociedade.

dois alunos no laboratório

Doze alunos do Clube Ciência Viva da Escola Secundária Padre António Vieira visitaram um dos laboratórios da Faculdade. A visita foi organizada pelo professor Octávio Paulo, orientada por dois alunos da Faculdade.

Páginas