Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

O evento é uma organização conjunta da Norton/Symantec e do mestrado em Segurança Informática do DI-FCUL.

O DM está na Futurália

Para Duarte Flor, presidente da associação académica e aluno do 12.º ano em Ciências, é importante que os candidatos ao ensino superior visitem as instalações de uma faculdade.

Desenho de uma figura masculina

“Existe um espaço onde o sentimento de pertença a uma escola pode ser reavivado", afirma Miguel Ramos.

Aluna junto a uma das colunas do átrio do C6

A mostra pictórica da atividade científica da FCUL é inaugurada a 13 de março. Conheça as razões pelas quais deve visitar a exposição.

O que são líquidos iónicos? Num dos primeiros programas do ano, o Com Ciência entrevistou o professor e investigador da FCUL, Carlos Nieto de Castro sobre esta classe de solventes.

Desenho de uma figura masculina

A data de lançamento do livro ainda não é pública, mas o evento deverá ocorrer brevemente, na Faculdade de Belas-Artes da UL.

Ontem evocou-se o Dia das Doenças Raras. A fibrose quística é um desses males incomuns. A investigação científica é importante em todos os setores, mas ganha especial sentido em áreas como esta.

Cerca de 20 professores de Ciências da Natureza e Ciências Naturais de nove concelhos portugueses participam na atividade promovida pelo MNHNC-UL a decorrer até abril.

Imagem de um folheto promocional

A FCUL volta a marcar presença no evento, juntamente com outras unidades orgânicas da UL.

Fotografia com pontos de interrogação

Alunos finalistas aconselham Engenharia da Energia e do Ambiente. Testemunhos de Guilherme Gaspar e Ricardo Leandro.

Fotografia de mesa com cinco pessoas sentadas, na Reitoria da UL

A rede pretende formalizar colégios doutorais em áreas transversais. Opinião de Maria Amélia Martins-Loução.

Fotografia de pessoas sentadas num dos anfiteatros da FCUL

A iniciativa acontece a 17 de março e é organizada pelos Departamentos de Física e de Informática.

Fotografia de Dois voluntários, sentados junto a uma banca no átrio do C5

Em fevereiro estão abertas inscrições para a admissão de novos voluntários.

A FCUL participa em "Programa de Estudos Avançados" com mais quatro instituições universitárias portuguesas e brasileiras.

Vale a pena recordar a iniciativa do Gabinete de Mobilidade, Estágios e Inserção Profissional da FCUL.

Fotografia de alunos a andarem, junto ao C8

A primeira edição do curso realiza-se já em 2012.

Outra forma de fazer turismo.

Artigo de investigadores do CeGUL e docentes do GeoFCUL no Top 25.Artigo de investigadores do CeGUL e docentes do GeoFCUL no Top 25

O Encontro decorreu em Junho no GeoFCUL.

Páginas