Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

Na sequência do Concurso para o desenvolvimento de uma aplicação para sistemas móveis (App), no âmbito da Iniciativa “iGEO– Mentes Criativas”, promovido pela Direção-Geral do Território (DGT) e pela Fundação Lus

De 6 de junho a 4 de julho de 2015 a Biblioteca do C4 vai estar aberta aos sábados das 9h00 às 17h00, à exceção do Dia de Santo António.

O Professor Armando Machado vai dar uma lição intitulada ‘A perspectiva em geometria’ na próxima quinta-feira dia 4 de Junho pelas 14h na sala 6.2.45.

A Unidade de Epidemiologia do Instituto de Medicina Preventiva e Saúde Pública da Faculdade de Medicina da Universidade de Lisboa encontra-se a recrutar candidatos para a função de

A Nortempo empresa multinacional ibérica que aposta num portefólio de serviços de recursos humanos alargado, está a recrutar um Técnico de Risco (M/F)  para empresa na áre

A Nortempo empresa multinacional ibérica que aposta num portefólio de serviços de recursos humanos alargado, está a recrutar um Técnico de Risco (M/F)  para empresa na área da Banca.

As Noites de Ciências, Noites de Luz propõem atividades gratuitas e interativas - com sessões de perguntas/respostas após cada palestra -, transmitidas em direto pela Internet. O ciclo iniciado em abril, continua em maio e nos meses seguintes.

No âmbito das acções de divulgação científica e de promoção do DI-FCUL, os professores visitaram a 28 de Maio a Escola Secundária D. Dinis, em Lisboa, para dias palestras intituladas respectivamente  "Robôs Móveis, por fora e por dentro" e "Quem roubou a minha identidade digital?".

O curso decorrerá entre 8 de Junho a 9 de Julho, de segunda a quinta feiras, 4h por dia, 4 dias por semana. 

Imagina que era possível experimentar um curso universitário antes de concorreres ao ensino superior?

O curso decorrerá entre o dia 13 e 25 de julho de segunda a sexta-feira das 17h às 20h e sábados das 09h às 17h. O objetivo principal deste curso será dar a conhecer as tecnologias de produção e armazenamento utilizadas em micro-redes de energia elétrica e respetiva formação em HOMER Pro (v.

As eleições dos membros dos Conselhos Científico e Pedagógico da Faculdade de Ciências da ULisboa ocorrem nos dias 26 e 27 de maio, entre as 9h00 e as 20h00, no átrio do edifício C3.

Ciências tem paixão pelas coisas do mar. A sua multidisciplinaridade fê-la receber o Prémio Scientia Mare 2015.

O seminário "Emergências Radiológicas" realiza-se a 28 de maio de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

Seminário Informal em Matemática no próximo dia 25 de Maio, 2ªfeira, às 14h na sala 6.2.44.

 

Tema: Teoria de super-caracteres do grupo unitriangular infinito", apresentado por Jocelyn Lochon.

A UNBABEL, start-up de antigo aluno do DI-FCUL, o Vasco Pedro, licenciado em Engenharia da Linguagem e do Conhecimento, é uma d

O seminário "Machine Learning: Introduction and selected applications" realiza-se a 21 de maio de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

O Departamento de Informática da Faculdade de Ciências da ULisboa organiza este ano a terceira edição do FCUL Rally Pro.

Aula aberta: Solos. Prof. Galopim de Carvalho

O Núcleo de Estudantes de Geologia (NEG FCUL), em colaboração com o Departamento de Geologia da Faculdade de Ciências da Universidade de Lisboa, tem o privilégio de receber o nosso tão acarinhado Professor Doutor António Galopim de Carvalho para uma

O evento inclui testemunhos. Os alunos de Ciências da ULisboa interessados em participar na sessão de esclarecimento devem inscrever-se.

No âmbito do Erasmus + strategic partnership ParIS (Partnership in Information Security), estudantes da Polónia, do Luxemburgo e de Portugal, nomeadamente do Departamento de Informática da Faculdade de Ciências da ULisboa, participaram recentemente no primeiro programa

A UNBABEL, start-up de antigo aluno do DI-FCUL, o Vasco Pedro, licenciado em Engenharia da Linguagem e do Conhecimento, é uma d

Mestrados do DBA de 2014 a 2016

Páginas