IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Anfiteatro da FCUL

Miguel Yus, professor da Universidade de Alicante, recebe o galardão na primeira de cinco conferências proferidas pelo premiado em Portugal.

A Direção de Marketing e Comunicação da RTP oferece estágio remunerado na Área de Audiências e Estudo de Mercado a alunos recém licenciados ou mestrandos em Matemática A

A exposição "O Cálculo de Ontem e de Hoje" está, agora, disponível em versão itinerante.

De 3 a 28 de Maio está patente na "Academia Sénior da Cruz Vermelha Portuguesa-Delegação de Lisboa".

Seminário "Serendipity and The Ups and Downs of Synthesis", apresentado pelo Prof.

Olho verde

Palestras, visitas, exposições e muitas experiências são algumas das atividades previstas.

Pormenor da capa do livro

O livro está à venda pelo valor de €18,40, no Atendimento Geral, sito no edifício C5, piso 3.

Anfiteatro

"As Jornadas tiveram um balanço bastante positivo (...) elucidaram e esclareceram algumas dúvidas importantes para os estudantes (...) ", conclui a Comissão de Curso de Engenharia Geográfica.

Museu do Quartzo é inaugurado e recebe o nome de Galopim de Carvalho, professor jubilado do Departamento de Geologia.

Céu com nuvens escuras

As candidaturas à oficina de formação terminam a 21 de maio. As sessões realizam-se às terças e quintas-feiras, entre as 17h30 e as 20h30.

A exposição “O Cálculo de ontem e de hoje”, elaborada pelo Departamento de Matemática em colabora&

Lâmpada

Estudantes de Engenharia Biomédica e Biofísica da FCUL promovem reunião especializada. O Ne2b2 existe desde outubro de 2008.

Luzes

Pela primeira vez a Reitoria da UL abre as suas portas aos estudantes da cidade, organizando um evento noturno para alunos dos ensinos universitário e secundário.

A exposição está a partir de 26 de Abril no Museu Nacional de História Natural e da Ciência.

As provas de doutoramento em Biologia, especialidade de Microbiologia, da Mestre Egídia Maria Valente de Azevedo realizam-se no próximo dia 26 de Abril, pelas 10h:30 na Sala de Actos da

O grande momento do dia é a sessão solene, que inclui este ano o lançamento do segundo volume dos Professores Cientistas e a inauguração do Quadro de Honra.

Sobre Namoros e Casamentos

Jorge Buescu

Quinta-feira, dia 12 de Abril de 2012, às 18h30, na sala 6.1.36

Vela

Ricardo Leandro é o vencedor da Competição Europeia. O estudante da FCUL apresentou a melhor ideia: um coletor solar térmico de baixo custo, acoplável a um módulo fotovoltaico.

A palestra "O Princípio do Tempo" proferida por Pedro Gil Ferreira é uma das iniciativas do “VII Encontro Ibérico de Cosmologia”, que decorre em abril nas instalações da FCUL.

Jovem usa microscópio

A FCUL estimula a abertura permanente à sociedade civil, promovendo acontecimentos que visam a disseminação de conhecimentos e a interligação com diferentes agentes sociais.

Os vários objectivos do DEGGE: Tudo o que nos define, e tudo o que apoiamos

O ENEI'12 vai realizar-se na FCUL.

ESTRUTURA E GESTÃO DO DEPARTAMENTO DE BIOLOGIA ANIMAL (DBA)

Apresentação do Departamento

Paleontólogos do MNHN da UL e do GeoFCUL em foco na revista TVmais.

A FCUL participa em "Programa de Estudos Avançados" com mais quatro instituições universitárias portuguesas e brasileiras.

Páginas