IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
uvas com a doença oídio

Estudo liderado por Ana Margarida Fortes, professora do DBV Ciências ULisboa e coordenadora de um dos grupos do BioISI Ciências ULisboa, está entre os cinco melhores artigos da Journal of Experimental Botany, uma prestigiada revista de investigação em plantas.

Maria Helena Carvalho de Sousa Andrade e Silva, professora aposentada da Ciências ULisboa, faleceu aos 94 anos, no passado dia 31 de outubro. A Faculdade apresenta sentidas condolências aos seus familiares, amigos e colegas.

Estrutura 3D da proteína S100B

Uma equipa internacional liderada pelo cientista Cláudio M. Gomes, professor do DQB Ciências ULisboa e coordenador do laboratório PMAB do BioISI, descobriu uma nova função para uma proteína do cérebro, que atrasa a formação de depósitos proteicos causadores de demências como a doença de Alzheimer. Guilherme Moreira, estudante de doutoramento em Bioquímica na Ciências ULisboa, orientado por Cláudio M. Gomes, é o primeiro autor do estudo.

 

Flores, livro e ampulheta

"Apesar de tudo, outubro foi um rico mês e novembro promete ser igual (...) O dia de amanhã, ainda que não esteja garantido, é uma série ininterrupta e eterna de instantes e é nosso". Mais uma rubrica em jeito de editorial, da autoria de Ana Subtil Simões, editora da Newsletter de Ciências.

Cérebro

"Para cada uma destas operações interessa estudar como nos vamos conduzir, e em que direção vamos prosseguir, logo quais são os princípios das coisas especulativas e os da imaginação",  in No Campus com Helder Coelho.

crianças numa visita ao laboratório

Ciências ULisboa recebeu, no passado dia 6 de outubro, 47 alunos do 4º ano, da Escola Básica Mestre Querubim Lapa, no âmbito do programa Escola Ciência Viva do Pavilhão do Conhecimento. A visita realizou-se no âmbito da atividade “Encontro com o cientista” e teve como anfitrião o professor do Departamento de Física, Rui Agostinho.

Campus da Faculdade

A Faculdade dá a conhecer uma vez mais a melhor ciência que se faz nesta centenária instituição. O Dia da Investigação da Ciências ULisboa realiza-se a 27 de outubro, no grande auditório, sito no edifício C3 e conta com uma sessão especial dedicada às Alterações Climáticas, área de investigação onde Ciências ULisboa é líder.

Luis Carriço, diretor da Ciências ULisboa e Maria de Jesus Fernandes, bastonária da Ordem dos Biólogos, assinaram no passado mês de setembro um protocolo de colaboração que visa a conceção, criação e desenvolvimento de cursos de especialização nas áreas de especialidade da Ordem, nomeadamente: Ambiente, Biotecnologia, Educação e Saúde.

Folha em destaque

Vanessa Mata, Miguel Baptista e Tiago Morais são os vencedores da edição 2021 do Prémio de Doutoramento em Ecologia - Fundação Amadeu Dias, organizado pela Sociedade Portuguesa de Ecologia (Speco). A entrega dos galardões deve ocorrer no próximo mês de dezembro, durante o 20º Encontro Nacional de Ecologia, na Escola Superior Agrária do Instituto Politécnico de Viana do Castelo, em Ponte de Lima.

codigo html

“OS Diversity for Intrusion Tolerance: Myth or Reality?”, com coautoria de três investigadores da Ciências ULisboa, é um dos artigos distinguidos com o prémio Test-of-Time, atribuído em junho de 2021 pela DSN.

Logotipo da iniciativa - banner promocional

Entre 12 e 17 de outubro de 2021 realiza-se a primeira edição do FIC.A - Festival Internacional de Ciência, no Palácio e Jardins do Marquês de Pombal, em Oeiras. Ciências ULisboa está representada neste evento com dezenas de atividades.

logotipo das comemorações do centenário da licenciatura em engenharia geográfica/geoespacial

Este ano assinala-se o centenário da criação da licenciatura em Engenharia Geográfica/Geoespacial. Para comemorar a efeméride realiza-se a 22 de outubro de 2021, pelas 15h00, no grande auditório da Ciências ULisboa, uma Sessão Solene Comemorativa, organizada pela Faculdade em parceria com a Ordem dos Engenheiros.

Lagoa nos Açores

Um estudo multidisciplinar, da autoria de vários cientistas europeus e norte-americanos, reconstrói as condições em que os Açores foram habitados pela primeira vez e o impacto da presença humana nos ecossistemas.

mapas e dispositivos moveis

"A informação geográfica contextualiza um povo, uma comunidade ou um indivíduo no espaço que o envolve", escreve Cristina Catita, professora do DEGGE Ciências ULisboa, por ocasião das comemorações do centenário do curso de Engenharia Geográfica/Geoespacial.

banda desenhada

“O jogo das alterações climáticas” é o novo livro da autoria de Bruno Pinto (argumento), Quico Nogueira (desenho) e Nuno Duarte (cor). O lançamento do livro vai ter lugar na Ciências ULisboa, já no próximo dia 7 de outubro.

Logotipo Radar

Décima oitava rubrica Radar Tec Labs, dedicada às atividades do Centro de Inovação da Faculdade. A empresa em destaque é a Sowé.

"É mais uma vez com uma enorme alegria que constatamos que Ciências ULisboa foi reconhecida como faculdade de excelência, sendo escolhida por mais de nove centenas de alunos na 1.ª fase do Concurso Nacional de Acesso (CNA) ao ensino superior", escreve Pedro Almeida, subdiretor da Faculdade.

trevo

Todos os dias são bons para serendipidades. Todos os dias também são bons para ocasiões previstas e que produzem factos.

Clara Grilo

Clara Grilo é bióloga e tem desenvolvido estudos sobre o impacto das estradas na fauna silvestre, nomeadamente na abundância relativa, comportamento, mortalidade por atropelamento e risco de extinção em aves e mamíferos. É investigadora no CESAM Ciências ULisboa, mas também é uma alumna da Faculdade. Fique a par de como foi estudar nesta faculdade e o que a levou a ir para o estrangeiro.

Um lince Ibérico sub-adulto

Mais de 120 espécies de mamíferos terrestres são particularmente vulneráveis à mortalidade por atropelamento e várias populações podem extinguir-se em 50 anos se persistirem os níveis de atropelamentos observados. A declaração é de Clara Grilo, investigadora do CESAM Ciências ULisboa, que lidera a investigação e que resultou na publicação de um artigo na prestigiada revista científica Global Ecology and Biogeography.

A missão Sentinel marca uma nova era na observação da Terra com o Copernicus

"A deteção remota veio revolucionar a forma de observação da Terra (...) desde as câmaras acopladas a aviões (...) aos mais variados sensores a bordo dos diversos satélites que orbitam a Terra, estes equipamentos têm permitido a aquisição sistemática de grandes volumes de imagens da superfície terrestre, possibilitando a sua monitorização a um nível global, regional e local de modo a uma gestão mais sustentável", escreve Ana Cristina Navarro Ferreira, professora do DEGGE Ciências ULisboa, por ocasião das comemorações do centenário do curso de Engenharia Geográfica/Geoespacial.

Estrutura molecular do óxido aniónico [Mo7O24]<sup>6-</sup>, cuja dissolução apresenta propriedades oncocidas

Investigação conjunta entre o BioISI Ciências ULisboa, a CIC NanoGUNE e a Universidade de Glasgow permite um avanço no conhecimento sobre quimioterapias com óxidos de molibdénio e realça as nuances pelas quais os sucessivos equilíbrios de pH controlam a ação oncocida aparente do {Mo7}.

Cratera inativa em Cabo Verde

António Morais Romão Serralheiro, professor catedrático jubilado da Ciências ULisboas, faleceu no passado dia 25 de agosto. A Faculdade apresenta as sinceras e sentidas condolências aos seus familiares, amigos e colegas. Leia a homenagem de um dos seus antigos alunos, atualmente professor e investigador da Faculdade, José Madeira.

Ricardo Simões no laboratório

Ricardo Simões, antigo aluno da Ciências ULisboa e investigador pós-doutorado do Centro de Química Estrutural da ULisboa, é um dos vencedores do Prémio Franzosini 2020, e o primeiro cientista português a receber este galardão internacional, que devido à situação pandémica foi entregue este verão.

Aula Magna

Os Prémios Científicos ULisboa/ CGD 2020 existem desde 2016. Até 2020 já foram concedidos 83 prémios e 87 menções honrosas a cientistas da Universidade. Desses, 14 prémios e 16 menções honrosas foram entregues a cientistas da Ciências ULisboa. Este ano na Faculdade estão de parabéns oito personalidades.

Páginas