IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Carlos Miguel Farinha, bioquímico docente do DQB e investigador do BioFIG , foi premiado em junho com o Romain Pauwels Research Award, atribuído pela European Respiratory Society.

 

2ª fase de candidaturas:  15 a 22 de Julho.

O mestrado em Matemática para Professores é uma excelente oportunidade para consolidar,  recordar e aprender muitos temas relacionados com a matemática escolar.

No dia 12 de Julho foram feitas as apresentações de quatro trabalhos feitos no âmbito da disciplina de Projecto em Matemática para o Ensino do Mestrado em Matemática para Professores.

A Universidade de Lisboa e a Fundação Amadeu Dias estão a atribuir bolsas aos alunos de 1º Ciclo de qualquer área do saber, leccionado na Universidade de Lisboa e que já tenham concluído o 1.º ano curricular, ou alunos que frequentem&n

Em 18 anos, o Programa de Estímulo à Investigação premiou 34 jovens investigadores e 19 instituições da Universidade de Lisboa. Na última edição, dos oito premiados, três são jovens cientistas da FCUL. As candidaturas à próxima edição decorrem até 21 de setembro.

Cartaz do Seminário

No dia dia 16 de Julho, pelas 11H00, na sala 6.4.30, realizar-se-á um Seminário organizado pelo Centro de Investigação Operacional com o título 'Lagrangian-Based Branch-and-Bound for Two-Echelon Uncapacitated Facility Location with Single Assignment Cons

Os resultados das experiências ATLAS e CMS divulgados recentemente pelo CERN, também foram apresentados publicamente na FCUL, numa sessão organizada pela professora do Departamento de Física Amélia Maio, a responsável pela participação portuguesa na experiência ATLAS.

Apresentações dos Projectos de Física dia 19 de Julho, às 10h, na sala 8.2.17:

O que faz o profissional que passa os seus dias no laboratório? E quem se dedica a resolver equações ou a estudar animais e plantas? Cinquenta alunos da associação EPIS descobriram as respostas a estas e a outras questões.

Servidor da FCUL

O projeto de reestruturação do Centro de Dados da FCUL, iniciado em junho, deverá estar concluído no próximo mês de setembro.

Duas pessoas fazem uma experiência no laboratório

A Faculdade de Ciências abre as portas dos seus laboratórios a 50 jovens, vindos de diferentes pontos do País, para mais uma edição da “Rota das Vocações de Futuro” da EPIS.

Apesar de ser uma das áreas mais recentes da FCUL, atualmente é uma vertente da ciência portuguesa em franca expansão.

“Um trabalho que reflita sobre o passado de uma instituição, ou o passado da ciência em Lisboa ou em Portugal, é sempre algo de muito importante para repensarmos o nosso trajeto”. A afirmação feita pela historiadora das ciências, Ana Simões, a propósito de um dos muitos projetos em curso é reveladora da importância, que a preservação do património científico tem na sua vida.

Kostas Gavroglu e Ana Simões assinam o primeiro livro “Neither Physics nor Chemistry: A History of Quantum Chemistry” sobre a emergência da disciplina Química Quântica, o pretexto ideal para conversar com a autora portuguesa.

O Grupo Azevedos oferece estágio profissional remunerado a recém licenciado na área da Estatística ou Matemática. Os interessados devem enviar a candidatura para

A edição deste ano d´O Botânico, uma revista propriedade da Associação Íbero-Macaronésica de Jardins Botânicos já se encontra online.

O Centro de Informática migrou todo o sítio antigo para o novo Portal da FCUL.

O Centro de Informática colocou em produção, durante a ultima semana de Maio, um equipamento de rede central na arquitectura de comunicações da FCUL.

Na Licenciatura em Matemática (LM) da FCUL, o leque de opções do 3º ano da LM foi alargado e passou a incluir as seguintes disciplinas, que estarão já disponíveis no ano lectivo de 2012/13:

 

 

Em exibição no:

MUSEU NACIONAL DE HISTÓRIA NATURAL E DA CIÊNCIA

1 de Junho de 2012 a 28 de Abril de 2013

 

 

Os cadernos e as comissões eleitorais estão publicitados no portal da FCUL, assim como o Despacho D/101/2012, que integra o calendário de eleições.

A eleição do Presidente do Departamento de Física  terá lugar de 3 a 5 de Julho de 2012

Comissão Eleitoral

Informações úteis:

Constituição da Comissão Eleitoral

Páginas