IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Estudantes a trabalhar

Nuno Silva termina a bolsa Erasmus+ em julho. O programa de mobilidade tem sido na sua opinião uma ótima experiência. Recentemente o aluno de Engenharia Biomédica e Biofísica foi um dos vencedores do Innovation Award da Explore Competition.

Martin O'Halloran, Eoghan Dunne, Nuno Silva e Laura Farina

Nuno Silva, aluno do mestrado integrado em Engenharia Biomédica e Biofísica de Ciências ULisboa a estudar no Translational Medical Device Lab, da National University of Ireland,em Galway, no âmbito de uma bolsa Erasmus+, venceu juntamente com o colega Eoghan Dunne, o Innovation Award da Explore Competition.

João Duarte

Investigadores de Ciências ULisboa propõem um novo mecanismo que permite explicar a existência de uma anomalia tectónica a SW do Cabo de São Vicente.

O neurocientista português Fernando Lopes da Silva nascido em Lisboa a 24 de Janeiro de 1935, faleceu no passado dia 7 de maio, na Holanda, onde vivia há mais de 50 anos. Ciências ULisboa lamenta o triste acontecimento, apresentando as condolências aos familiares, amigos e colegas de Fernando Lopes da Silva.

Permacultura

A rede europeia ECOLISE publicou este mês um novo relatório sobre a eficácia das ações de sustentabilidade e mudança climática realizadas pelas comunidades locais. O investigador de Ciências ULisboa, Gil Penha-Lopes, líder deste projeto, espera que daqui a dois anos haja um novo relatório e que a plataforma online - wiki.ecolise.eu - suporte uma comunidade ainda mais dinâmica e saudável.

"A presença de um 'devias' é muitas vezes uma barreira à congruência entre o eu real e o eu ideal", escreve a psicóloga do Gapsi, Andreia Santos, na rubrica habitual.

Uma equipa internacional constituída por 121 cientistas reconstruiu a complexa história dos cavalos domésticos. O estudo divulgado este mês na revista Cell inclui a participação de Maria do Mar Oom, investigadora do polo de Ciências do cE3c e de Cristina Luís, investigadora do polo de Ciências do CIUHCT, MUHNAC e CIES-ISCTE-IUL, que coordenou o desenvolvimento do trabalho da equipa portuguesa.

O naturalista entomólogo do Museu Bocage desde 1957 até 1975 faleceu no dia 29 de abril de 2019. José Alberto Quartau presta homenagem "a quem lhe abriu as portas" da Entomologia.

ETAPS 2019

Vasco T. Vasconcelos, professor do Departamento de Informática de Ciências ULisboa, Kohei Honda, professor da Queen Mary University of London, no Reino Unido, entretanto falecido e Makoto Kubo, professor da Chiba University of Commerce, no Japão, autores do artigo “Language primitives and type discipline for structured communication-based programming”, apresentado durante o European Symposium on Programming, em 1998, foram galardoados com o ETAPS 2019 Test of Time Award.

Mar

Carlos Antunes, Cristina Catita e Carolina Rocha são os vencedores do Prémio "Engenheiro Empreendedor 2018 - Ano OE das Alterações Climáticas”. Os investigadores de Ciências ULisboa criaram uma aplicação web, suportada por um serviço de mapas na web para a visualização dos cenários de subida do nível do mar em Portugal continental e respetiva cartografia de inundação e de vulnerabilidade física costeira para 2025, 2050 e 2100.

Campus Ciências ULisboa

"Se quisermos conhecer agora o que se passa na Ciência da Computação, do ponto de vista científico e tecnológico, devemos consultar, mensalmente, a revista CACM - Communications of the Association of Computing Machinery, dos EUA", in no Campus com Helder Coelho.

auditório ISCTE-IUL

“Mostramos que estamos no bom caminho e que já temos muitas ações desenvolvidas e que temos potencial para ir muito mais longe”, comenta Margarida Santos-Reis, uma das oradoras do seminário “Integrating the Sustainable Development Goals into Higher Education”.

Fadhil Musa, Rita Maçorano, Ana Faísca, Filipa Tomé e Francisca Canais

A Faculdade participou nos “Encontros com a Inovação em Saúde – 8.ª Edição” e na 4.ª Edição do “Mercado de Inovação em Saúde”.

Esquema

“Gostaria de continuar envolvida em projetos ligados às tecnologias médicas, que sejam inovadores e que procuram ter impacto e melhorar o bem-estar das pessoas”, conta Daniela Marques Godinho, a aluna de doutoramento em Engenharia Biomédica e Biofísica de Ciências ULisboa, distinguida com o 3.ª lugar do Best Student Paper, edição de 2018, durante o 12.º Congresso do Comité Português da URSI.

Biblioteca do IDL

A visita de Sang-Mook Lee a Portugal tem como objetivo científico a magnetometria em furos de sondagens e contempla passagens pelo campus de Aljustrel do Laboratório Nacional de Energia e Geologia, Almina, Minas de Aljustrel e Mina de Ciência - Centro Ciência Viva do Lousal.

Primeira imagem de um buraco negro, localizado no centro da galáxia Messier 87

A primeira imagem direta de um buraco negro foi divulgada esta quarta-feira, dia 10 de abril, em sete conferências de imprensa simultâneas, pela iniciativa internacional Event Horizon Telescope.

Grupo de Transição Energética do IDL Ciências ULisboa

Raquel Figueiredo, estudante de doutoramento em Sistemas Sustentáveis de Energia, é a primeira autora do artigo que será publicado na edição de junho do Journal of Cleaner Production e que avalia alternativas renováveis às centrais de carvão em Portugal.

"Torna-se urgente e imperativo travar e reverter todo este processo de destruição. Amemos ou odiemos os insetos, o certo é que será difícil sobrevivermos sem eles", escreve o cientista José Alberto Quartau.

Edição 2018 da Jobshop Ciências

A feira de emprego de Ciências já vai na X edição e todos os anos mais empresas estão presentes assim como mais estudantes participam na iniciativa.

livros

Henrique Leitão, investigador do Departamento de História e Filosofia das Ciências e do Centro Interuniversitário de História das Ciências e da Tecnologia de Ciências ULisboa ganhou uma European Research Council (ERC) Advanced Grant 2018, no valor de dois milhões de euros, no âmbito do projeto “Making the Earth Global: Early Modern Nautical Rutters and the Construction of a Global Concept of the Earth”.

Cérebro

Cláudio Gomes, professor no Departamento de Química e Bioquímica de Ciências ULisboa e investigador no BioISI, apresenta dia 28 de março o mais recente trabalho do seu laboratório sobre um novo mecanismo bioquímico nas células nervosas que retarda a formação de agregados de proteína no cérebro, causadores da doença de Alzheimer, na 14ª Edição daAD/PDTM - Conferência Internacional de Doença de Alzheimer e Parkinson.

Maria José calhorda

O Prémio Ferreira da Silva 2018 da Sociedade Portuguesa de Química (SPQ) é atribuído a Maria José Calhorda, professora do Departamento de Química e Bioquímica de Ciências ULisboa, e será entregue durante o XXVI Encontro Nacional da SPQ, a ocorrer no Porto, de 24 a 26 de julho de 2019.

Participantes da missão oceanográfica a bordo do RV METEOR

Resultados preliminares da missão oceanográfica a bordo do RV METEOR parecem confirmar a presença de eventos catastróficos e que afetaram a costa portuguesa ao longo dos últimos 12 mil anos.

ASSISIbf

"Robots mediating interactions between animals for interspecies collective behaviors" da autoria de Frank Bonnet, Rob Mills, Martina Szopek, Sarah Schönwetter-Fuchs, José Halloy, Stjepan Bogdan, Luís Correia, Francesco Mondada e Thomas Schmickl é um dos artigos da Science Robotics, publicado a 20 de março de 2019.

Direção Ciências ULisboa

A Direção da Faculdade visitou em fevereiro e março os dez departamentos de Ciências ULisboa. “Acho que foi muito positivo”, comenta Luís Carriço, diretor de Ciências ULisboa mencionando ainda que as reuniões permitiram a apresentação e discussão de ideias muito interessantes.

Páginas