Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt
SemEval 2015

André leal, aluno do mestrado em Engenharia Informática do Departamento de Informática (DI) de Ciências da ULisboa, obteve a segunda posição na SemEval-2015.

O "Enforcing Kids", projecto levado a cabo pelos alunos Cátia Raminhos e Jorge Santos, alunos de mestrado da FCUL, volta a

Bolsas LisMath

O Programa LisMath vai atribuir oito bolsas de doutoramento. As candidaturas terminam a 31 de março de 2015.

 

A Faculdade de Ciências da ULisboa, a Universidade Católica Portuguesa, o Fórum Empresarial da Economia do Mar e a Sociedade de Avaliação Estratégica e Risco assinaram a 3 de fevereiro de 2015 um protocolo de cooperação destinado a lançar a MARE STARTUP.

Candidaturas abertas para estudantes do ensino superior.

A MARE STARTUP conta com o suporte de mais de 600 investigadores do MARE – Centro de Ciências do Mar e Ambiente e da Universidade Católica Portuguesa (UCP).

No átrio do edifício C6 da Faculdade de Ciências da ULisboa encontram-se expostos os módulos da exposição "O Homem, O Cientista, O Professor" com informação relativa à vida e obra de José Sebasti&ati

“Os ensinamentos de Ciências foram fundamentais e imprescindíveis ao longo de todas as fases do projeto, uma vez que sem os mesmos teria sido muito mais difícil a execução dos diversos processos metodológicos, bem como o entendimento detalhado do background teórico que suporta o projeto em si”, declara a aluna do curso de Ciências da Saúde, Ana Margarida Drumond.

Activo até 19 de Março

Os 12 princípios propostos por David Holmgren, no livro “Permaculture Principles & Pathways Beyond Sustainability” (2002), resultam da análise das dinâmicas energéticas em sistemas ecológicos, bem como da observação e réplica de padrões e processos naturais.

Encontram-se abertas as candidaturas para Estágios Curriculares na Siemens Portugal.

BioMimetx

A spin-off BioMimetx produz novos biocidas, mais baratos e ecológicos, amenizando um problema com grandes consequências económicas e ambientais – a bioincrustação. A ideia já foi distinguida com três prémios.

Já está a decorrer a 2ª edição do Jumping Talent!

Encontram-se abertas as candidaturas para estágios de verão no CERN, para estudantes com o 3&or

As inscrições nas Oficinas de Matemática estão abertas até 20 de janeiro. A iniciativa tem como público-alvo os candidatos aos Maiores de 23 Anos e visa desenvolver as competências indispensáveis ao ingresso e progress

Ana Prata e Helena Vieira na final da 3.ª edição do Lisbon Challenge

O projeto vencedor da 3.ª edição do Lisbon Challenge é da autoria de Helena Vieira, professora convidada do Departamento de Estatística e Investigação Operacional (DEIO) de Ciências da ULisboa e de Ana Prata, aluna do mestrado em Microbiologia Aplicada.

No 1st BioSys PhD Day foi dado a conhecer o trabalho de 11 estudantes de doutoramento, através de apresentações e sessões de discussão de posters.

A investigação em processamento da Linguagem e em Tradução Automática feita no Departamento de Informática, em notícia na última edição do expresso, a

Ao fim de um ano, o projeto cumpriu uma das metas estabelecidas: a aplicação de um sistema de tradução automática em cenário de uso real, num serviço de helpdesk informático fornecido pela Higher Functions - Sistemas Informáticos Inteligentes, Lda..

No passado dia 6 de janeiro, o Departamento de Matemática celebrou o aniversário do Professor Armando Machado com um lanche.

 

As inscrições decorrem até 11 de fevereiro.

Entre os dias 3 e 31 de janeiro de 2015 a biblioteca do C4 também está aberta aos sáb

Na sequência da avaliação das unidades de investigação promovida em 2014 pela FCT, o CCMM passou a integrar o Centro de Química Estrutural da Universidade de Lisboa.

In the very recent international evaluation that FCT (Foundation for Science and Technology) has carried out of Portuguese scientific R&D units, BioISI was assessed as Excellent (classification: 24/25)

Santander Top Training 2015

Através do Santander Top Training, o Banco Santander Totta desenvolve jovens talentos promovendo o seu crescimento profissional enquadrado numa equipa inovadora e de prestigio. 

Páginas