Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

O Grupo Azevedos oferece estágio profissional remunerado a recém licenciado na área da Estatística ou Matemática. Os interessados devem enviar a candidatura para

A edição deste ano d´O Botânico, uma revista propriedade da Associação Íbero-Macaronésica de Jardins Botânicos já se encontra online.

O Centro de Informática migrou todo o sítio antigo para o novo Portal da FCUL.

O Centro de Informática colocou em produção, durante a ultima semana de Maio, um equipamento de rede central na arquitectura de comunicações da FCUL.

Na Licenciatura em Matemática (LM) da FCUL, o leque de opções do 3º ano da LM foi alargado e passou a incluir as seguintes disciplinas, que estarão já disponíveis no ano lectivo de 2012/13:

 

 

Em exibição no:

MUSEU NACIONAL DE HISTÓRIA NATURAL E DA CIÊNCIA

1 de Junho de 2012 a 28 de Abril de 2013

 

 

Os cadernos e as comissões eleitorais estão publicitados no portal da FCUL, assim como o Despacho D/101/2012, que integra o calendário de eleições.

A eleição do Presidente do Departamento de Física  terá lugar de 3 a 5 de Julho de 2012

Comissão Eleitoral

Informações úteis:

Constituição da Comissão Eleitoral

A festa dos finalistas de Geologia juntou familiares, amigos, colegas e professores.

Conforme o despacho D/101/2012,  as eleições para a Presidência do Departamento de Informática, irão decorrer entre 3 e 5 de Julho de 2012 na secretaria do departamento.

 

Estão abertas as inscrições para o ‘Mestrado em Matemática para Professores’ (1ª fase de candidaturas até dia 15 de Junho)

 

No âmbito do nº 3 do artigo 9º do Regulamento Eleitoral, e de acordo com o calendário de eleições para Presidentes dos Departamentos, já se encontra disponível o 

A Eleição do Presidente do Departamento de Biologia Animal terá lugar de 3 a 5 de Julho de 2012 na Secretaria do Departamento

A inscrição nos exames dos dias 4 e 5 de junho podem ser excecionalmente realizadas até às 23h59m de 1 de junho.

A eleição do Presidente do DBV  terá lugar de 3 a 5 de Julho de 2012

Matéria escura

Um grupo de 19 cientistas, 14 deles investigadores do Centro de Física Nuclear da UL e do Instituto Tecnológico e Nuclear da UTL, publicaram recentemente novos resultados que contrariam as alegadas descobertas sobre a matéria escura.

PSMR2012 Conference

Estudante de doutoramento no IBEB ganha prémio para o melhor Poster

Tomás Aquino

Bolseiro do CFMC distinguido pela Fundação Calouste Gulbenkian

Imagem de Kairos em pedra

O próximo e quinto número da revista do Centro de Filosofia das Ciências da UL é lançado em novembro. A submissão de textos termina a 30 de setembro.

Encontra-se aberto concurso para bolsa de estágio na área de suporte aos laboratórios letivos e de investigação do Departamento de Informática da Faculdade de Ciências.

Simulação de uma proteína

Quatro lições sobre proteínas.  As investigadoras Maria José R. Gomes e Patrícia Faísca apresentam quatro razões para não faltar à quinta iniciativa do projeto Ciência na UL.

O Dr. Rui Lopes ex-aluno do Departamento de Informática e investigador no LASIGE, actualmente a trabalhar na Google, foi um dos responsáveis da equipa de desenvolvimento do doodle de hoje (23 de Maio).

A Investigação dos Doutores de Amanhã

Lâmpada

"O objetivo é partilhar com os colegas das outras faculdades a experiência que tivemos, e estamos a ter, com a implementação do modelo de gestão por objetivos, assente na identificação dos processos", diz Ana Rocha, secretária-coordenadora da FCUL.

Páginas