IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Imagem editada pelo DI

O projeto "Lusica - Artistas musicais lusófonos", desenvolvido pelos alunos de mestrado do Departamento de Informática de Ciências -  Carlos Barata, Farah Mussa, Gabriel Marques, Mónica Abreu e Rafael Oliveira - , no âmbito das di

Campus Solar de Ciências já tem uma página online! Quantos são os que passam todos os dias por ele e não sabem o que é?…

Energias renováveis

O Departamento de Engenharia Geográfica, Geofísica e Energia organiza a 27 de março, entre as 12h00 e as 13h00, na sala 8.2.47, no campus de Ciências, o seminário "Energias fósseis, o que temos e para onde vamos", proferido por Nuno Pimentel, docente do Departamento de Geologia de Ciências e investigador do Centro de Geologia da Universidade de Lisboa, desde 1989.

Ensino da Paleontologia: Novas abordagens

Candidaturas online abertas até 31 de Março!

No Dia do Patrono da Escola Secundária Stuart Carvalhais, Ciências participou nas atividades científicas da instituição com a presença de elementos dos Departamentos de Física e de Química e Bioquímica.

Pode a eficiência energética induzir práticas que levam a um aumento do consumo de energia por parte das famílias?

Henrique Costa

Henrique Regateiro Machado e Costa faleceu no passado dia 14 de Fevereiro.

Secção Autonoma de História e Filosofia das Ciências da FCUL

Hasok Chang, Prémio Fernando Gil

A RIGC – Rede de Informação da Indústria do Grande Consumo, empresa de consultores especializada na realização de trabalhos de consultoria n

Consulte as ofertas de emprego do Departamento de Estatística e Investigação Operacional.

A empresa Grupo Actuarial oferece estágios remunerados na área da Estatística/Probabilidades ou Matemática.

Para mais informações consultar:

RIGC – Rede de Informação da Indústria do Grande Consumo, empresa de consultores especializada na realização de trabalhos de consultoria na área de do Grande Consumo procura Analista de Dados Júnior(m/f).

Maksen é uma multinacional organizada em unidades de negócios, a fim de prestar serviços de consultoria em estratégia e redes de negócios, sistemas de informação, engenharia e comunicação e neste momento procura

Das 121 candidaturas admitidas para avaliação no âmbito do concurso para a criação do Rnie, somente 54 foram recomendadas a integrar o roteiro, dez delas incluem a presença de Ciências, sendo que cinco são lideradas por investigadores da faculdade.

Maria Helena Florêncio, Jorge Miguel Miranda, Henrique Cabral e António Branco apresentam infraestruturas de investigação de interesse estratégico para Portugal.

Gonçalo Costa Gomes Amaral

"Não se deve deixar que a sua memória seja esquecida, pois é através de tudo o que ele passou e viveu entre nós que vai continuar a viver e a iluminar tudo aquilo que fizermos", declararam em comunicado a AEFCL e o Conselho de Veteranos de Biologia.

A empresa Grupo Actuarial oferece estágios remunerados na área da Estatística/Probabilidades ou Matemática.

Mapa

A recomendação de inclusão da Clarin Portugal no Roteiro Nacional de Infraestruturas de Investigação de Interesse Estratégico (Rnie) representa um passo da maior importância para a internacionalização da língua portuguesa e para a sua preparação para a era digital. 

O Seminário Diagonal realiza-se dia 17 de março, pelas 18h00, na FCUL, no anfiteatro 6.2.53.

Henrique Cabral

Investigadores de seis universidades portuguesas criam novo centro de investigação em ciências marinhas: o Mare.

Candidaturas decorrem até 21 de março de 2014.

Após as audiências pública e privada dos candidatos a diretor, o Conselho de Escola elegeu com maioria absoluta, no dia 26 de fevereiro, a candidatura do professor do Departamento de Química e Bioquímica, frisando na ocasião “o empenho de ambos os candidatos no enriquecimento da discussão e definição dos problemas e desafios que a FCUL enfrenta”.

Jornadas e-Planning

“O objetivo das jornadas é refletir e debater as grandes prioridades e desafios societais que enfrentamos”, diz Pedro Ferraz de Abreu, dinamizador da iniciativa.

Filipe Duarte Santos aceitou coordenar a equipa que vai avaliar a estratégia de gestão da zona costeira nacional, “porque é um serviço para o meu país numa área em que tenho algum conhecimento e experiência”, na sequência do convite feito pelo ministro do Ambiente, Jorge Moreira da Silva.

Páginas