IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
IMSF

A decorrer de 24-29 de Agosto na Suíça.

Consulte o evento em http://www.imsc2014.ch/

Encontram-se abertas candidaturas para 77 estágios profissionais para o grupo Portucel Soporcel, com a duração máxima de 12 meses, remunerados com uma bolsa de est&aac

A Companhia de Seguros Generali , procura Actuário Júnior para integrar na sua equipa.

Pela primeira vez o Departamento de Matemática de Ciências realiza ações de formação parcialmente à distância.

Príncipe de Girona

O objetivo do meu trabalho é entender alguns dos processos moleculares e celulares que ocorrem durante o desenvolvimento de novos vasos sanguíneos”, explicou o antigo aluno de Ciências.

Príncipe Girona - Rui Benetido

Rui Benedito já trabalhou com estudantes de Biologia vindos de Portugal, Espanha, Inglaterra e Alemanha, a avaliação que faz é a de que “os estudantes saem muito bem preparados da FCUL. Os alunos de Ciências portugueses são muito apreciados no estrangeiro”. Por isso, deixa o convite: “tenho posições disponíveis no meu laboratório para estudantes portugueses!”.

Candidatura GeoFCUL ao X CNG 2018

O Departamento de Geologia da Faculdade de Ciências da ULisboa organizou a segunda sessão do CNG, em 1986, e candidatou-se a organizar o X CNG em 2018, durante o IX Congresso Nacional de Geologia, que decorreu em julho no Porto.

Cinquenta e cinco jovens experimentam a realidade da investigação científica na Faculdade de Ciências da ULisboa. O desafio começa esta segunda-feira, dia 21 de julho e prolonga-se até quinta-feira, dia 24.

Biologia 2014/2015

Para Ana Rita Ruivo, do 12.º ano da Escola Secundária Quinta do Marquês, passar alguns dias do seu verão em Ciências foi importante porque a ajudou a “clarificar que [assuntos] correspondem aos [diferentes] cursos” e também porque lhe permitiu “[ter contacto com] experiências que nunca tinha feito”.

António Branco, professor do Departamento de Informática de Ciências, é o coordenador do QTLeap, um projeto europeu de investigação para a tradução automática.

“É a primeira vez que tenho contacto com este ambiente. Gosto de programação e o curso que quero seguir é Engenharia Informática. Aqui, vou ganhar alguns conhecimentos”, referiu o aluno do 11.º ano da Escola Secundária da Amadora, Miguel Almeida, um dos participantes do FCUL Rally Pro.

Coleção de culturas

Este é um exemplo de como as coleções biológicas, enquanto infraestruturas científicas, podem ser instrumentais para o avanço da ciência e no potenciar e estreitar de parcerias transversais.

 A Exigo Consultores, empresa de consultoria em actividade desde 2001, focada na consultoria para o sector de saúde, principalmente a consultoria em economia da saúde, epidemiologia, análise matemática e estatística, procura

Parabéns ao aluno Pedro Lencastre, da edição de 2012/2013 do mestrado em Matemática Financeira da Faculdade de Ciências da ULisboa e do ISCTE-IUL, que ganhou uma bolsa da Global Association of Risk Professionals (GARP) para a elaboração da sua tese de mestrado na área de riscos financeiros.

alumna de Ciências e investigadora da ULisboa, galardoada este ano com o Portuguese Young Chemists Award, procura descobrir um fármaco que venha a ser útil à sociedade.

No âmbito de uma parceria estabelecida entre a Faculdade de Ciências da Universidade Agostinho Neto (FCUAN) e a Faculdade de Ciências da Universidade de Lisboa (FCUL), teve início em abril de 2014 o Mestrado em Microbiologia Aplicada da FCUAN

No âmbito de uma parceria estabelecida entre a Faculdade de Ciências da Universidade Agostinho Neto (FCUAN) e a Faculdade de Ciências da Universidade de Lisboa (FCUL), teve início em abril de 2014 o Mestrado em Microbiologia Aplicada da FCUAN

A segunda edição do FCUL Rally Pro realizou-se na tarde de 2 de julho.

De 7 de julho a 5 de setembro de 2014 as bibliotecas do C4 e do C8 têm alteração no horário de funcionamento.

Pedro Garret, Investigador de Ciências

A informação com possíveis cenários climáticos até ao final do século já está disponível para consulta de autarquias, responsáveis por licenciamentos de obras, proprietários que queiram construir e autoridades de proteção civil.

Alunos no campus de Ciências

“Quem não gostaria de gerir uma empresa sem o verdadeiro risco mas, ainda assim, de uma forma bastante realista?”, questiona João Guilherme Rodrigues, aluno de Ciências e um dos 21 concorrentes da Faculdade ao Global Management Challenge (GMC).

Qual é a maior alegria de um professor? Para a maioria é com certeza o bem-estar e o sucesso dos seus alunos.

Escolha de Ramo em Geologia / 2014

Listas definitivas divulgadas em 23 de Julho de 2014.

Páginas