Já conhece o Albertina PT?

Primeiro grande modelo aberto de IA para a língua portuguesa

cérebro

O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou

Unsplash+ com Getty Images
António Branco
“Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina", diz António Branco
Fonte GICD DCI Ciências ULisboa

O primeiro grande modelo de Inteligência Artificial generativa para a língua portuguesa, para cada uma das variantes, do Brasil e de Portugal, gratuito, em código aberto e com acesso universal está disponível desde este mês e tem 900 milhões de parâmetros.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital."
António Branco

O Albertina PT destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos. No momento da sua publicação, o seu desempenho estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos. É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que estão a fazer furor, desde chatbots até tradução automática.

"Trata-se de um marco histórico muito importante na preparação tecnológica da língua portuguesa para a era digital", diz em comunicado de imprensa, António Branco, professor do Departamento de Informática da Ciências ULisboa, coordenador do NLX | Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP).

O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.

Para António Branco, o Albertina “constitui um passo crucial para democratizar esta tecnologia, que deixa de estar confinada às bigtechs e aos laboratórios de investigação, e vê todo o seu potencial disponível para alavancar a criação de valor e a melhoria da vida das pessoas”.
O desenvolvimento de grandes modelos neuronais de IA generativa para a língua portuguesa ainda agora começou. “Vamos continuar a desenvolver novas versões do Albertina, e também vamos desenvolver outros modelos de linguagem com arquiteturas neuronais diferentes da arquitetura da Albertina, uma vez que cada um à sua maneira é mais apropriado para diferentes finalidades e condições de utilização”, acrescenta António Branco.

Os investigadores do NLX Ciências ULisboa - João Rodrigues, Luís Gomes, João Silva, António Branco e Rodrigo Santos - e os investigadores do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP - Henrique Lopes Cardoso e Tomás Osório - apresentam os resultados deste trabalho no artigo "Advancing Neural Encoding of Portuguese with Transformer Albertina PT*", submetido recentemente na arXiv.

“Este primeiro resultado e as reações que estamos a receber são muito encorajadores, e o balanço é muito positivo”, conclui António Branco.

O Albertina nos media
Expresso, Economia dia a dia, Human Resources, RTP, Correio da Manhã, Pplware Online.

Ana Subtil Simões, Gabinete de Jornalismo Ciências ULisboa
info.ciencias@ciencias.ulisboa.pt

Bruno Carreira, doutorado em Biologia por Ciências e atualmente investigador de pós-doutoramento no cE3c - Centro de Ecologia, Evolução e Alterações Ambientais, é o vencedor da edição de 2016 do Prémio Fluviário de Mora - Jovem Cientista do Ano.

Quando Leibniz e Newton se enfrentaram no século XVII, sobre a origem do Cálculo, criaram um espaço para exercerem o contraditório, argumentando e criticando, em defesa dos seus argumentos. Esse exercício chama-se controvérsia (debate ou polémica), considerada por muitos como a máquina do progresso intelectual e prático. Cada um dos lados apresenta a sua explicação (causa) das suas razões, como factos (pro ou contra), e os quais sustentam e justificam a sua posição.

Ciências participou no Google Hashcode 2017. Das 12 equipas concorrentes, cinco resolveram corretamente os desafios de programação, numa maratona marcada, segundo os participantes, pela aquisição de competências e boa disposição.

Maria Amélia Martins-Loução, investigadora do cE3c e professora do DBV Ciências, é a nova presidente da Sociedade Portuguesa de Ecologia.

A 3.ª corrida de carros movidos a energia solar conta com a participação de 30 pilotos e dez carros construídos por alunos dos ensinos secundário e universitário.

“Estou a adorar a minha experiência académica. Ao estar no ramo da Matemática, consegui desenvolver algumas softskills, tais como a organização, a atenção ao detalhe, a capacidade para questionar e o rigor”, declara Diogo Ramalho, campeão nacional universitário de Taekwondo e aluno de Matemática de Ciências.

“Chocolate – do laboratório à fábrica” é uma das 159 palestras apresentadas por professores, cientistas a pedido das escolas secundárias.

No programa Novos Talentos em Matemática, edição 2016/2017, da Fundação Calouste Gulbenkian, foram distinguidos três alunos de Ciências. Desta vez, entrevistamos a aluna do 3.º ano do curso de Matemática de Ciências, Isabel Nobre.

Uma circulação de vento entre o equador e os polos foi detetada em ambos os hemisférios de Vénus pela primeira vez, e poderá contribuir para explicar a superrotação da atmosfera deste planeta, segundo estudo liderado por Pedro Machado, investigador do Instituto de Astrofísica e Ciências do Espaçoe professor do Departamento de Física de Ciências.

No filme “The man who knew infinity” (sobre a colaboração de Ramanujan com Hardy em Cambridge, Reino Unido) aborda-se a resolução de problemas e a discussão do recurso à intuição. O terreno da Matemática é o escolhido, tal como no problema de Kadinson-Singer (sem resolução durante 50 anos), e onde se trata da reconciliação da Física Quântica com a Matemática (Marcus, Spielman e Srivastava, 2015).

Filipe Duarte Santos foi designado presidente do Conselho Nacional do Ambiente e do Desenvolvimento Sustentável (CNADS), segundo comunicado do Conselho de Ministros de 9 de março.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de março é com Rui Batista, especialista em Informática da Área de Sistemas de Informação e Desenvolvimento da Direção de Serviços Informáticos de Ciências.

Proteger a biodiversidade. Engane-se quem pensa que só os biólogos participam nesta árdua tarefa. 

Um estudo publicado na revista “Quaternary Science Reviews”, fruto de cinco anos de trabalho de investigadores portugueses e espanhóis, permitiu reconstruir a evolução da vegetação, paisagem e clima da ilha de São Miguel nos últimos 700 anos, através da análise dos sedimentos da Lagoa Azul.

A American Physical Society (APS) já anunciou a lista de homenageados pelo "Outstanding Referee Program" em 2017 e José Pedro Mimoso, professor do Departamento de Física e investigador do Instituto de Astrofísica e Ciências do Espaço, é um deles.

As populações de várias espécies de anfíbios na Serra da Estrela estão a diminuir drasticamente, devido a uma infeção por uma nova estirpe de vírus, também já detetado noutras partes de Espanha e da Europa, segundo comunicado de imprensa emitido recentemente pelo cE3c – Centro de Ecologia, Evolução e Alterações Ambientais.

Durante o Green Day ocorrido esta segunda-feira no campus de Ciências foi apresentado o Ecokart Twin, o primeiro kart elétrico português de dois lugares.

“Pequenas ações fazem a diferença, não tenham medo de sair da zona de conforto”. João Paulo Silva, um dos membros do projeto Movetech Telemetry, “apaixonado pela natureza”, dedicado ao estudo da ecologia das aves dos meios agrícolas, nomeadamente em projetos de seguimento remoto de vida selvagem como o Lince ou a Águia Imperial, deixa este conselho aos jovens que se interessam por esta área da Biologia. Saiba mais sobre este cientista, antigo aluno de Ciências e coordenador da componente científica e de desenvolvimento de software do Movetech Telemetry.

João Paulo Silva, doutorado em Ecologia por Ciências, investigador do Centro de Investigação em Biodiversidade e Recursos Genéticos e do cE3c, é um dos membros da equipa do Movetech Telemetry, no âmbito do qual estão a ser desenvolvidos equipamentos ultraleves e de grande autonomia para monitorização eficaz da vida selvagem.

O mercado do processamento da língua natural (PLN), segmentado em codificação automatizada, análise de textos, reconhecimento de carateres óticos, resposta interativa em voz, reconhecimento de padrões e imagens, e analítica da voz, tenderá a aumentar muito nos próximos dez anos.

O “XV Encontro de Jovens Investigadores em Paleontologia (EJIP)” realiza-se de 19 a 22 de abril de 2017, na cidade de Pombal, um concelho cuja riqueza paleontológica é salientada pela comissão organizadora desta 15.ª edição. Carlos Marques da Silva e Mário Cachão, professores do Departamento de Geologia e investigadores do Instituto Dom Luiz, são oradores convidados do encontro, cujas inscrições decorrem até ao final de março.

“Este programa dá-nos acesso a artigos, livros e outros materiais propostos pelos nossos tutores que nos dão uma grande ajuda a compreender melhor o gigante mundo que é a Matemática”, diz Rodrigo Duarte, estudante de Ciências, galardoado com uma bolsa Novos Talentos em Matemática 2016/2017.

Anny Caroline Muniz, aluna do mestrado em Bioestatística de Ciências, participou no estudo “Perfil Tabágico dos Estudantes dos 2.º e 3.º ciclos das Escolas do ACES Arco Ribeirinho”, dos concelhos de Alcochete, Barreiro, Moita e Montijo, desenvolvendo igualmente um modelo matemático para a previsão do adolescente/tipo com maior probabilidade de começar a fumar precocemente.

Qual o principal fator que provocou o crescimento das regiões exteriores das galáxias elípticas na época mais recente do Universo? Esta pergunta motivou a investigação liderada por Fernando Buitrago, investigador do Instituto de Astrofísica e Ciências do Espaço e professor convidado do Departamento de Física de Ciências, dando origem ao mais detalhado estudo publicado online em janeiro na Monthly Notices of the Royal Astronomical Society.

Jardim

O inquérito desenvolvido pelo cE3c - no âmbito do projeto europeu “Green Surge - Green Infrastructure and Urban Biodiversity for Sustainable Urban Development and the Green Economy” -, pode ser respondido até 15 de abril de 2017.

Páginas