Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

“Para além da importância no contexto científico, este trabalho também tem uma forte importância no contexto industrial, pois permite otimizar os gastos de energia domésticos e industriais”, explica o investigador do Centro de Química Estrutural de Ciências, Francisco Bioucas.

Mais de 100 cientistas reúnem-se em Lisboa, na Faculdade de Ciências, para abordar a temática dos nanofluidos.

A origem dos raios cósmicos de elevada energia foi desvendada. O LIP, do qual Ciências faz parte, colaborou na obtenção dos resultados.

O minhocário será usado para investigar o processo de vermicompostagem, numa experiência piloto em parceria com o Gabinete de Segurança, Saúde e Sustentabilidade da Área de Serviços Técnicos de Ciências e com o Centro de Ecologia, Evolução e Alterações Ambientais (cE3c).

Há um mineral peculiar que pode ajudar a desvendar o contributo do vulcanismo de Decão sobre a extinção em massa e a morte dos dinossauros: a akaganéite. Os resultados do estudo foram publicados na Nature Scientific Reports.

Ciências participa com mais de 30 de atividades de divulgação de ciência, espalhadas por Lisboa, Lousal e até na ilha Terceira.

O primeiro Dia Internacional do Microrganismo foi celebrado a 17 de setembro, no Pavilhão do Conhecimento, em Lisboa, numa iniciativa conjunta da Sociedade Portuguesa de Microbiologia, Ordem dos Biólogos, Ciência Viva e Comissão Nacional da UNESCO.

Desde 1971 que a guerra está aberta, mas o combate tem sido difícil. Por um lado, não temos só uma doença, e o que já conhecemos não tem chegado para estarmos contentes.

Um novo estudo liderado por Ciências encontrou grandes quantidades de fibras artificiais no estuário do Tejo e em zonas costeiras da África Ocidental, segundo comunicado de imprensa emitido pela Faculdade esta segunda-feira.

Falta pouco para a Faculdade voltar a ser homenageada com a atribuição de mais duas insígnias de professores eméritos a dois dos seus docentes aposentados.

Zbigniew Kotowicz, investigador e membro integrado do Centro de Filosofia das Ciências da Universidade de Lisboa, faleceu aos 67 anos, no dia 21 de setembro de 2017.

Ciências integra um consórcio europeu que vai receber do programa Horizon 2020 cinco milhões de euros para desenvolver, entre 2018 e 2021, a mais avançada tecnologia de espectrometria de massa.

Agora que terminaste o ensino secundário e estás prestes a iniciar esta nova etapa, vários vão ser os desafios pessoais e académicos que vais enfrentar.

O "MOONS Science Consortium Meeting" termina esta quarta-feira, dia 13 de setembro, após dois dias de reuniões. O encontro "à porta fechada" decorre no campus de Ciências e visa consolidar os casos científicos e discutir as estratégias de observação do espectrógrafo, cuja fase de construção arranca agora.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de setembro é com Sandra Crespo, assistente técnico do Departamento de Informática de Ciências.

Ciências preencheu 99,9% das suas vagas na 1.ª fase do Concurso Nacional de Acesso (CNA) ao ensino superior, a taxa mais elevada desde que há registo.

No dia 14 de setembro, pelas 17h30, a arqueóloga Lídia Fernandes vai falar sobre o chão, no MUHNAC-ULisboa, em mais uma sessão de 60 Minutos de Ciência.

Maria de Deus Carvalho, professora do Departamento de Química e Bioquímica (DQB) e investigadora do Centro de Química e Bioquímica de Ciências, faleceu aos 53 anos, no dia 5 de setembro de 2017.

As Olimpíadas Internacionais de Ciências da Terra ocorreram nos dias 29 e 30 de agosto, em Nice, na Côte d'Azur, em França. Pelo terceiro ano consecutivo, os estudantes do ensino secundário português voltaram a conquistar medalhas.

Depois de ter passado pela Austrália, África do Sul, EUA e Reino Unido, entre outros países, a EMAPI chega a Portugal.

Valiant acredita que a ciência da aprendizagem permanece apenas explorada parcialmente, e que o uso das previsões (via a Aprendizagem) no mundo atual, tão sujeito às mudanças e às surpresas, é particularmente interessante. Por exemplo, os sistemas biológicos são altamente adaptativos, e compreender o que eles fazem, passo a passo, e porquê tem êxito, levaram-no a considerá-los como tópicos ideais para uma teoria da aprendizagem e da ciência da computação.

O “5th International Tsunami Field Symposium” realiza-se de 3 a 7 de setembro de 2017, em Lisboa e no Algarve e reúne a elite mundial no estudo de depósitos de tsunami, destaque para os dois oradores convidados - Alastair Dawson e Raphael Paris.

O projeto “Caixa Sismológica”, do Agrupamento D. Maria II, com sede na Escola Básica e Secundária Gama Barros, no Cacém, venceu o concurso internacional “Ciência na Escola”, 1.º escalão – Educação Pré-escolar, promovido pela Fundação Ilídio Pinho. Neste escalão do concurso, participaram 48 projetos, dos quais só 12 chegaram à fase final, em Coimbra.

Após perto de dez anos de planeamento e construção, o espectrógrafo ESPRESSO vai ser instalado no Very Large Telescope, do ESO, no Chile. O Instituto de Astrofísica e Ciências do Espaço é um dos membros do consórcio, pelo que terá acesso a 273 noites de observação com o VLT.

Cerca de 360 pessoas estiveram presentes na sessão Ignite IAstro e que integrou o programa do XXVII Encontro Nacional de Astronomia e Astrofísica. Em outubro a digressão ruma até à Ribeira Grande, nos Açores.

Páginas