Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

 

Estão abertas as inscrições para o ‘Mestrado em Matemática para Professores’ (1ª fase de candidaturas até dia 15 de Junho)

 

No âmbito do nº 3 do artigo 9º do Regulamento Eleitoral, e de acordo com o calendário de eleições para Presidentes dos Departamentos, já se encontra disponível o 

A Eleição do Presidente do Departamento de Biologia Animal terá lugar de 3 a 5 de Julho de 2012 na Secretaria do Departamento

A inscrição nos exames dos dias 4 e 5 de junho podem ser excecionalmente realizadas até às 23h59m de 1 de junho.

A eleição do Presidente do DBV  terá lugar de 3 a 5 de Julho de 2012

Matéria escura

Um grupo de 19 cientistas, 14 deles investigadores do Centro de Física Nuclear da UL e do Instituto Tecnológico e Nuclear da UTL, publicaram recentemente novos resultados que contrariam as alegadas descobertas sobre a matéria escura.

PSMR2012 Conference

Estudante de doutoramento no IBEB ganha prémio para o melhor Poster

Tomás Aquino

Bolseiro do CFMC distinguido pela Fundação Calouste Gulbenkian

Imagem de Kairos em pedra

O próximo e quinto número da revista do Centro de Filosofia das Ciências da UL é lançado em novembro. A submissão de textos termina a 30 de setembro.

Encontra-se aberto concurso para bolsa de estágio na área de suporte aos laboratórios letivos e de investigação do Departamento de Informática da Faculdade de Ciências.

Simulação de uma proteína

Quatro lições sobre proteínas.  As investigadoras Maria José R. Gomes e Patrícia Faísca apresentam quatro razões para não faltar à quinta iniciativa do projeto Ciência na UL.

O Dr. Rui Lopes ex-aluno do Departamento de Informática e investigador no LASIGE, actualmente a trabalhar na Google, foi um dos responsáveis da equipa de desenvolvimento do doodle de hoje (23 de Maio).

A Investigação dos Doutores de Amanhã

Lâmpada

"O objetivo é partilhar com os colegas das outras faculdades a experiência que tivemos, e estamos a ter, com a implementação do modelo de gestão por objetivos, assente na identificação dos processos", diz Ana Rocha, secretária-coordenadora da FCUL.

Vários círculos com várias cores

A reunião de entrada livre e sujeita a prévia inscrição inclui sessões plenárias e workshops sob o tema genérico “Prosseguir a excelência, promovendo as competências da UL”.

Produtos alimentares

“Partilhar o que se tem pode ser um convite a algum sacrifício – mas a solidariedade não pode ser só um sentimento, tem de ser um compromisso de ação”, refere Graça Vieira, professora aposentada da FCUL, a propósito da campanha "Vamos dar com o coração".

Plantas em vasos

Hoje é um dia fascinante. Dia de nos fascinarmos com as plantas, com a sua beleza, com o que nos dão, e nos possibilitam – a vida tal como a conhecemos.

Flor sujeita a tratamento para expressão de um gene

Nesta época do ano, não há nada que mais nos descanse o espírito como um campo repleto de cores: branco, amarelo, lilás, vermelho, com flores de diferentes tamanhos e odores.

Seminário do DF

Anúncio de Seminário do DF

Encontra-se aberto concurso para a atribuição de 1 (uma) Bolsa de Investigação, no âmbito do projecto de investigação “Erro de não-resposta nas sondagens telefónicas com telemóveis: causas, efeitos e correcçã

Para marcar uma visita ao novo lugar destinado ao estudos das ciências e das artes basta telefonar ou enviar um email.

Fascination of Plants Day - 18 de maio de 2012.

A reportagem multimédia realizada no âmbito da UL Open Night inclui declarações de Sofia Cruz, coordenadora do Núcleo de Comunicação da Reitoria da Universidade de Lisboa (RUL), Isabel Tadeu, coordenadora do Núcleo

A ação de voluntariado acontece entre 26 e 27 de maio. Inscreva-se até dia 18 de maio, através do site UL Alimenta esta Ideia.

 

Páginas