Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

Galopim de Carvalho, um dos geólogos mais famosos de Portugal, natural de Évora, com quase 85 anos, regressa à Faculdade de Ciências da Universidade de Lisboa no próximo dia 27 de junho.

2016 está a ser um ano em cheio para alguns estudantes empreendedores e é essa a essência de que é feita a Júnior Empresa Ciências, que está agora a dar os primeiros passos.

Crónica de Fernando Barriga e Sofia Martins, investigadores do IDL Ciências, em missão oceanográfica no Atlântico - TAG hydrothermal field.

Em Londres, junto a St. Pancras´s International, está próximo de nascer um polo que agrupa a Google (e a DeepMind), o Francis Crick Institute, o Alan Turing Institute e a British Library (…) O arquiteto visa promover interações com serendipidade entre investigadores de terrenos divergentes.

Crónica de Fernando Barriga e Sofia Martins, investigadores do IDL Ciências, em missão oceanográfica no Atlântico - TAG hydrothermal field.

Inês Andrade

O que fazem e o que pensam alguns membros da comunidade de Ciências? O sexto Dictum et factum é com Inês Andrade, assistente técnico do Departamento de Biologia Animal de Ciências.

Um estudo publicado na revista internacional de conservação Oryx indica que a legislação e a proteção nas praias são insuficientes para travar a captura e o consumo ilegal de tartarugas marinhas em Cabo Verde.

Crónica de Fernando Barriga e Sofia Martins, investigadores do IDL- Ciências, em missão oceanográfica no Atlântico - TAG hydrothermal field.

A missão oceanográfica M127 iniciada a 25 de maio, em Bridgetown, Barbados, acontece a bordo do navio oceanográfico alemão RV METEOR e deverá terminar a 28 de junho de 2016, em Ponta Delgada.

José Guerreiro, professor da Faculdade de Ciências da Universidade de Lisboa e coordenador da MARE STARTUP e Sónia Ribeiro, professora da Universidade Católica Portuguesa, apresentam o programa de apoio ao empreendedorismo na área do mar durante a Oceans Business Week.

InovCarbon, Janus e o BreatheBio são os vencedores da segunda edição da Call for Projects do ScienceIN2Business.

Nos últimos anos a saída de quadros superiores seniores e de cientistas de Portugal acompanhou uma grande vaga de emigração, sobretudo para a Europa.

O tema deste ano é “A ciência não é só dos cientistas”.

Se a última Noite de Ciências foi dedicada ao Trânsito de Mercúrio e ao sistema solar, em maio é a vez do bosão de Higgs ganhar destaque.

Alunos da Faculdade agitam no ar fitas de fim de curso

A Alameda da Universidade de Lisboa voltou a encher-se de finalistas de Ciências e de tantas outras faculdades e universidades. Este ano a cerimónia ocorreu no dia 21 de maio de 2016. Para alguns este é um acontecimento especial - é que "há momentos que marcam a vida", por isso mesmo merecem ser recordados.

“A poor international standard for trap selectivity threatens carnivore conservation” - um estudo publicado online a 2 de maio de 2016 na revista “Biodiversity and Conservation” - revela falhas graves nas normas que regulam a legalidade de armadilhas para captura de carnívoros.

A 2.º edição da Escola de Verão de Energia da Faculdade de Ciências da Universidade de Lisboa acontece entre 27 de junho e 1 de julho de 2016. As candidaturas já abriram e terminam a 31 de maio.

Recentemente, a Google anunciou o SmartReply para diminuirmos a carga que muitos de nós têm com o serviço de correio (emails), as dezenas de mensagens que se vão acumulando enquanto as horas passam. Quem está interessado nesta facilidade? É segura, não invasiva, e quem ganha no fim?

Estão prestes a ser divulgados pela Reitoria da Universidade de Lisboa os resultados do inquérito à empregabilidade dos estudantes da Universidade. Estes indicadores passarão a ter cada vez mais importância, seja ao nível da Universidade como das políticas públicas. O tema da empregabilidade passa pois a ser crítico, e a Jobshop anual um instrumento prioritário para a acção de Ciências.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O quinto Dictum et factum é com Andreia Rezende, técnica superior do Gabinete Jurídico de Ciências.

Trinta e três pessoas submeteram até ao final do passado mês de março mais de 200 fotografias no âmbito do Concurso de Fotografia de Ciências 2016. Durante o Dia de Ciências – a 19 de abril de 2016 – foram atribuídos os prémios e as menções honrosas às melhores imagens do concurso.

Um grupo de investigadores do Centro de Química e Bioquímica de Ciências, da Osaka Prefecture University (OPU), no Japão, do Rutherford Appleton Laboratory, no Reino Unido e de duas instituições francesas - o Institut de Chimie de Clermont-Ferrande e o CNRS - sintetizou um novo nanomaterial considerado como catalisador verde de nova geração. 

O Dia de Ciências 2016 foi celebrado no dia do aniversário da Faculdade – 19 de abril – e juntou, como em anos anteriores, alunos, professores, investigadores, outros funcionários desta faculdade, seus familiares e amigos.

António Branco, professor do Departamento de Informática de Ciências, participa na cerimónia “CPLP 20 anos - A Diversidade Cultural que Nos Une”, cujo objetivo é comemorar o Dia da Língua Portuguesa e da Cultura da CPLP, celebrado a 5 de maio de 2016, no Palácio Conde de Penafiel, em Lisboa.

Diz-se que nem sempre pensamos por linhas direitas, quase sempre seguimos por curvas, em ziguezagues, corrigindo o que estava confuso, unindo e simplificando, recorrendo a imagens e metáforas, para ajudar os outros a capturarem a essência das coisas.

Páginas