Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

Ciências ULisboa pretende continuar a colaborar na formação académica, bem como no desenvolvimento de programas de investigação comuns e no estabelecimento de equipas que possam concorrer a fundos internacionais.

Entre os dias 9 e 30 de janeiro de 2016 inclusivé, a biblioteca do C4 também está aberta aos sábados das 9h00 às 17h00.

A área que mais gosta são as alterações climáticas e os seus efeitos. Durante estes anos em Ciências ULisboa sente que cresceu como pessoa e cientista. Carlos da Camara e Ana Bastos orientaram o projeto de licenciatura e ficaram surpreendidos com o talento da jovem estudante.

Encontra-se aberto concurso para atribuição de uma bolsa de Gestão Ciência e Tecnologia para licenciados em Estatística ou Matemática.

“Ciência, Prestígio e Devoção: os Jesuítas e a Ciência em Portugal”, editado pela Lucerna, no início de 2015, é a primeira abordagem à história científica dos jesuítas em Portugal nos séculos XIX e XX.

Para Ismael Tereno, investigador do IA e de Ciências ULisboa, é possível rastrear mais de um terço do céu, obtendo dados astronómicos com a qualidade adequada ao sucesso dos objetivos científicos da missão Euclid.

O Piloto 2 veio acrescentar mais informação léxico-semântica aos sistemas de tradução automática para todas as línguas do projeto: português, alemão, checo, búlgaro, espanhol, basco, holandês e inglês.

A última sessão deste ano acontece esta sexta-feira, dia 18 de dezembro, a partir das 20h00, no Grande Auditório da Faculdade, sito no edifício C3, no Campo Grande.

Através da iniciativa os alunos de Ciências ULisboa ficam a conhecer o processo de recrutamento e seleção da Galp Energia.

Através da iniciativa os alunos de Ciências ULisboa ficam a conhecer o processo de recrutamento e seleção da Galp Energia.

"Reflexões sobre a neurobiologia da consciência" foi o tema da palestra de António Damásio.

Nos dias 26 e 27 de novembro de 2015 decorreu em Ciências ULisboa, a reunião anual do projeto europeu QTLeap – Quality Translation by Deep Language Engineering Approaches. Nesta reunião geral do segundo ano do projeto, os parceiros avaliaram os resultados obtidos com o protótipo 2 (Piloto 2)

Amélia Pilar Rauter e Catarina Dias

O website Nutriageing é destinado ao público em geral e já está disponível em nutriageing.fc.ul.pt.

New workstation computers for image analysis have been added to the C8 node of the FCUL Microscopy Facility, under BioISI management.

Sandra Nascimento Ferreira

É preciso pensar e realizar iniciativas que despertem os consumidores, ou seja, os diversos cidadãos, para a necessidade de reduzir a produção de resíduos, aumentado a consciência ambiental e a participação informada, crítica e reflexiva.

A Faculdade de Ciências da ULisboa realiza, pelo segundo ano consecutivo, a reunião anual do projeto QTLeap, que conta com a presença de todos os parceiros do consórcio e de outros investigadores, especialistas em processamento profundo de linguagem e em tradução automática.

A partir de janeiro de 2016, a ULisboa disponibiliza um espaço de apoio

O aluno do Mestrado em Matemática e colaborador do CEMAT (Centro de Matemática Computacional e Estocástica) Bernardo Hipólito Fernandes, ganhou uma bolsa de estímulo à investiga&cc

Joint Oney Intelligent Analytics Services, empresa satélite que apoia a actividade do Jumbo e que é especializada em estudos de mercado e projectos de consultoria na área do Grande Consumo, pretende recrutar

O Professor António Branco, do Departamento de Informática da FCUL, é o representante de Portugal, na Assembleia Geral da Infraestrutura Europeia CLARIN, que se realiza em Copenhaga, na Dinamarca, esta quinta e sexta-feira, 1

O curso deverá começar a 12 de fevereiro de 2016.

Na manhã da passada quinta-feira dia 12 de novembro, alunos do 4.º, 5.º e 6.º ano do Externato Santa Catarina e do

Páginas