IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

O recente falecimento abre mais uma lacuna na geração dos cientistas e professores que muito contribuíram para o desenvolvimento da Química em Portugal.

Maria Inês Correia Gonçalves Macias Marques, professora aposentada da Faculdade de Ciências da Universidade de Lisboa, faleceu aos 79 anos, no dia 1 de janeiro de 2017. A Faculdade lamenta o triste acontecimento, apresentando as condolências aos seus familiares, amigos e colegas.

Inseridos no Programa de Atividades Conjuntas, do Programa Operacional Competitividade e Internacionalização , o IBEB e o BioISI de Ciências – em conjunto com outros grupos nacionais -, vão explorar o conhecimento acerca do cérebro.

O grupo de investigadores da Masaryk University, na República Checa; da Mykolas Romeris University, na Lituânia; das universidades Politécnica de Madrid e de Oviedo, em Espanha; do Centro de Estudos Geográficos do Instituto de Geografia e Ordenamento do Território e do Instituto Dom Luiz analisaram a evolução da temperatura nas dez estações da Península Antártica desde o início da década de 1950 até 2015.

Através de trabalho de campo detalhado na ilha de Santa Maria, nos Açores, investigadores descobriram elementos importantes para a compreensão da origem e evolução de ilhas vulcânicas.

O projeto RESISTIR iniciou-se em abril deste ano e visa criar até abril de 2019 um sistema de informação - inovador, modular, inteligente e adaptável - para apoiar a tomada de decisão clínica no domínio da vigilância epidemiológica, resistência aos antimicrobianos, controlo de infeção e gestão hospitalar.

O ClimAdaPT.Local coordenado pelo grupo CCIAM do cE3c chegou ao fim.

Ciências é oficialmente membro associado do Laboratório de Instrumentação e Física Experimental de Partículas. Para além disso, em 2017 a sede vai ficar mais próxima dos cientistas desta instituição.

No ensino universitário normal o aproveitamento/rendimento escolar é também motivo de preocupação em muitos países europeus, embora existam países onde esse rendimento se aproxima dos 100%. Em termos económicos, facilmente se percebe que quanto maior for a taxa de aprovação dos alunos, menor a desistência e a reprovação, mais justificadas estão as verbas públicas  (provenientes dos impostos) que o Estado investiu no sector da educação.

“Os valores associados ao desporto são complementares aos que são necessários para o sucesso académico”, diz Matilde Fidalgo, aluna de Ciências e jogadora de futebol da seleção feminina portuguesa.

Antes de se aposentar em 2014 a Ana Monteiro trabalhou na Biblioteca da FCUL durante alguns anos. Ontem, dia 15 de dezembro, faleceu.

Teve lugar a 27 de outubro no Salão Nobre da Reitoria da Universidade de Lisboa (ULisboa) o lançamento oficial do Colégio de Química, o primeiro colégio da ULisboa aprovado na área das Ciências Exatas.

O aumento da temperatura da água leva anfíbios omnívoros a adotar uma dieta mais herbívora. De acordo com o comunicado de imprensa emitido pelo cE3c – Centro de Ecologia, Evolução e Alterações Climáticas, “esta é a primeira vez que é estudada em vertebrados a assimilação de dietas mais ou menos ricas em proteínas em função da temperatura”.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O último Dictum et factum de 2016 é com Paulo Silva, técnico superior do Departamento de Física de Ciências.

O QTLeap—Quality Translation by Deep Language Engineering Approaches chega ao fim, mas a investigação em tradução automática continua. Leia a curta entrevista com António Branco, professor do Departamento de Informática de Ciências e coordenador deste projeto, iniciado em novembro de 2013.

“A Onda da Nazaré: um estímulo para a aprendizagem” é financiado pelo Mecanismo Financeiro do Espaço Económico Europeu (EEA Grants) e explica de forma simples e recorrendo a curtas animações os processos associados à existência da maior onda surfada em todo o mundo. 

O curso de Química Tecnológica celebra em 2017 os 35 anos da saída dos seus primeiros licenciados pelo que as próximas “Jornadas QT” realçarão esta efeméride.

Nos últimos anos da troika (2011-2015), a importância da Filosofia foi bastante apreciada, em particular a nível internacional. Este período não foi bom para Portugal, sobretudo porque os jovens licenciados foram colocados de lado e sem trabalho, os sem emprego (ou bolsa), os precários (com vencimento à hora de ocupação, os temporários, sem férias, direitos de saúde...), e os que estavam a mais (e, forçados a emigrar) juntaram a sua indignação e protestaram. Nem sempre com resultados bem visíveis e de pressão real sobre o poder.

A União Europeia das Geociências atribui anualmente um prémio que reconhece atividade científica de exceção a nível mundial, realizada por cientistas desta área na fase inicial da carreira. Este galardão foi atribuído pela primeira vez a um investigador a trabalhar em Portugal. João Duarte é investigador do Instituto Dom Luiz e do Departamento de Geologia da Faculdade de Ciências da Universidade de Lisboa e recebeu este prémio pelo seu trabalho na área da Geologia Marinha e Tectónica, bem como pela sua atividade na área da divulgação científica. 

Nos próximos cinco anos, Sara Magalhães vai explorar um sistema biológico composto por duas espécies de ácaro-aranha, Tetranychus urticae Tetranychus ludeni, que competem por um alimento - a planta do tomate, no âmbito do projeto “COMPCON - Competição sob construção do nicho”, com início previsto para maio de 2017 e desenvolvido em colaboração com investigadores da Universidade de Montpellier, em França.

Aplicações médicas e industriais a partir de organismos que produzem bioadesivos... Sim, é possível. No âmbito de uma Ação COST, a Rede Europeia de Especialistas em Bioadesão, trabalha para criar novos produtos.

O tempo tem demonstrado ser possível avançar na criação de mais e melhores condições de equidade para os alunos com Necessidades Educativas Especiais. Mas este é um desafio permanente para as instituições de ensino, como também o é para cada um de nós e a cada momento, num permanente processo de implicação pessoal em prol de algo que tanto prezamos: a igualdade de oportunidades.

Num desporto o treino é comum e faz parte de um plano para conseguir os melhores resultados, estimulando as capacidades físicas a superarem os desempenhos. Mas, também se podem treinar as mentes para fazer ciência.

O dia-a-dia de Luis Filipe Lages Martins divide-se entre a atividade de investigação em Metrologia com aplicação na Engenharia Civil e a gestão laboratorial da Unidade de Metrologia Aplicada do LNEC – Laboratório Nacional de Engenharia Civil. O primeiro estudante a obter o grau de doutor em Engenharia Física pela Faculdade de Ciências da Universidade de Lisboa nasceu em Lisboa e aos 34 anos acaba de ser distinguido com o Prémio Inovação em Metrologia.

Luís Filipe Lages Martins, bolseiro de pós-doutoramento do LNEC – Laboratório Nacional de Engenharia Civil, é o vencedor da 1.ª edição do Prémio Inovação em Metrologia da Sociedade Portuguesa de Metrologia (SPMet).

Páginas