IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Os 12 princípios propostos por David Holmgren, no livro “Permaculture Principles & Pathways Beyond Sustainability” (2002), resultam da análise das dinâmicas energéticas em sistemas ecológicos, bem como da observação e réplica de padrões e processos naturais.

Encontram-se abertas as candidaturas para Estágios Curriculares na Siemens Portugal.

BioMimetx

A spin-off BioMimetx produz novos biocidas, mais baratos e ecológicos, amenizando um problema com grandes consequências económicas e ambientais – a bioincrustação. A ideia já foi distinguida com três prémios.

Já está a decorrer a 2ª edição do Jumping Talent!

Encontram-se abertas as candidaturas para estágios de verão no CERN, para estudantes com o 3&or

As inscrições nas Oficinas de Matemática estão abertas até 20 de janeiro. A iniciativa tem como público-alvo os candidatos aos Maiores de 23 Anos e visa desenvolver as competências indispensáveis ao ingresso e progress

Ana Prata e Helena Vieira na final da 3.ª edição do Lisbon Challenge

O projeto vencedor da 3.ª edição do Lisbon Challenge é da autoria de Helena Vieira, professora convidada do Departamento de Estatística e Investigação Operacional (DEIO) de Ciências da ULisboa e de Ana Prata, aluna do mestrado em Microbiologia Aplicada.

No 1st BioSys PhD Day foi dado a conhecer o trabalho de 11 estudantes de doutoramento, através de apresentações e sessões de discussão de posters.

A investigação em processamento da Linguagem e em Tradução Automática feita no Departamento de Informática, em notícia na última edição do expresso, a

Ao fim de um ano, o projeto cumpriu uma das metas estabelecidas: a aplicação de um sistema de tradução automática em cenário de uso real, num serviço de helpdesk informático fornecido pela Higher Functions - Sistemas Informáticos Inteligentes, Lda..

No passado dia 6 de janeiro, o Departamento de Matemática celebrou o aniversário do Professor Armando Machado com um lanche.

 

As inscrições decorrem até 11 de fevereiro.

Entre os dias 3 e 31 de janeiro de 2015 a biblioteca do C4 também está aberta aos sáb

Na sequência da avaliação das unidades de investigação promovida em 2014 pela FCT, o CCMM passou a integrar o Centro de Química Estrutural da Universidade de Lisboa.

In the very recent international evaluation that FCT (Foundation for Science and Technology) has carried out of Portuguese scientific R&D units, BioISI was assessed as Excellent (classification: 24/25)

Santander Top Training 2015

Através do Santander Top Training, o Banco Santander Totta desenvolve jovens talentos promovendo o seu crescimento profissional enquadrado numa equipa inovadora e de prestigio. 

Entrevista com... Pedro Raposo, curador Adler

“Haverá sempre altos e baixos, mas estou em crer que se soubermos muito bem o que queremos, se procurarmos estudar e trabalhar com os melhores na área que nos interessa, se formos persistentes, e se mantivermos uma atitude cosmopolita, colheremos sempre algum fruto do nosso esforço”, declara Pedro Raposo.

Universidad de Las Fuerzas Armadas na ULisboa

Cinco alunos equatorianos estudam na ULisboa. Em Ciências, a comitiva visitou o Centro de Sistemas de Energia Sustentáveis (SESUL) e o Laboratório de Sistemas, Instrumentação e Modelação em Ciências e Tecnologias do Ambiente e do Espaço (SIM).

Pedro Raposo -  próximo Curador do Planetário Adler, em Chicago

Pedro Raposo, pós-doc do Centro Interuniversitário de História das Ciências e Tecnologia (CIUHCT), vai ser o próximo curador do Planetário Adler, em Chicago, o mais importante planetário dos Estados Unidos da América, e uma das instituições científico-culturais líderes neste país.

Encontrar fármacos mais eficazes é um dos principais objetivos de quem estuda esta doença genética.

Entre os dias 22 de dezembro de 2014 5 de janeiro de 2015 a biblioteca do C4 está aberta todos os dias úteis entre as 9h00 e as 17h00.

Um modelo de previsão desenvolvido na União Europeia, mostrou que a doença por vírus Ébola terá infetado na África Ocidental entre 14.000 e 22.000 pessoas no final de novembro.

“Este Prémio traz em si o incentivo de que é preciso continuar [a fazer] mais e melhor. Embora este Prémio tenha o meu nome, dedico-o e só o reconheço como sendo de um grupo de pessoas com quem trabalho, do meu centro de investigação e da Faculdade”, declarou Henrique Leitão.

Prémio Pessoa 2014

Henrique Leitão, investigador principal da Secção Autónoma de História e Filosofia das Ciências e membro do Centro Interuniversitário de História das Ciências e da Tecnologia, é o vencedor do Prémio Pessoa 2014.

Encontram-se abertas as inscrições para o "Management Trainee Programme" do Grupo Jerónimo Martins até ao final de Janeiro de 2015.

Páginas