IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Teve lugar a 27 de outubro no Salão Nobre da Reitoria da Universidade de Lisboa (ULisboa) o lançamento oficial do Colégio de Química, o primeiro colégio da ULisboa aprovado na área das Ciências Exatas.

O aumento da temperatura da água leva anfíbios omnívoros a adotar uma dieta mais herbívora. De acordo com o comunicado de imprensa emitido pelo cE3c – Centro de Ecologia, Evolução e Alterações Climáticas, “esta é a primeira vez que é estudada em vertebrados a assimilação de dietas mais ou menos ricas em proteínas em função da temperatura”.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O último Dictum et factum de 2016 é com Paulo Silva, técnico superior do Departamento de Física de Ciências.

O QTLeap—Quality Translation by Deep Language Engineering Approaches chega ao fim, mas a investigação em tradução automática continua. Leia a curta entrevista com António Branco, professor do Departamento de Informática de Ciências e coordenador deste projeto, iniciado em novembro de 2013.

“A Onda da Nazaré: um estímulo para a aprendizagem” é financiado pelo Mecanismo Financeiro do Espaço Económico Europeu (EEA Grants) e explica de forma simples e recorrendo a curtas animações os processos associados à existência da maior onda surfada em todo o mundo. 

O curso de Química Tecnológica celebra em 2017 os 35 anos da saída dos seus primeiros licenciados pelo que as próximas “Jornadas QT” realçarão esta efeméride.

Nos últimos anos da troika (2011-2015), a importância da Filosofia foi bastante apreciada, em particular a nível internacional. Este período não foi bom para Portugal, sobretudo porque os jovens licenciados foram colocados de lado e sem trabalho, os sem emprego (ou bolsa), os precários (com vencimento à hora de ocupação, os temporários, sem férias, direitos de saúde...), e os que estavam a mais (e, forçados a emigrar) juntaram a sua indignação e protestaram. Nem sempre com resultados bem visíveis e de pressão real sobre o poder.

A União Europeia das Geociências atribui anualmente um prémio que reconhece atividade científica de exceção a nível mundial, realizada por cientistas desta área na fase inicial da carreira. Este galardão foi atribuído pela primeira vez a um investigador a trabalhar em Portugal. João Duarte é investigador do Instituto Dom Luiz e do Departamento de Geologia da Faculdade de Ciências da Universidade de Lisboa e recebeu este prémio pelo seu trabalho na área da Geologia Marinha e Tectónica, bem como pela sua atividade na área da divulgação científica. 

Nos próximos cinco anos, Sara Magalhães vai explorar um sistema biológico composto por duas espécies de ácaro-aranha, Tetranychus urticae Tetranychus ludeni, que competem por um alimento - a planta do tomate, no âmbito do projeto “COMPCON - Competição sob construção do nicho”, com início previsto para maio de 2017 e desenvolvido em colaboração com investigadores da Universidade de Montpellier, em França.

Aplicações médicas e industriais a partir de organismos que produzem bioadesivos... Sim, é possível. No âmbito de uma Ação COST, a Rede Europeia de Especialistas em Bioadesão, trabalha para criar novos produtos.

O tempo tem demonstrado ser possível avançar na criação de mais e melhores condições de equidade para os alunos com Necessidades Educativas Especiais. Mas este é um desafio permanente para as instituições de ensino, como também o é para cada um de nós e a cada momento, num permanente processo de implicação pessoal em prol de algo que tanto prezamos: a igualdade de oportunidades.

Num desporto o treino é comum e faz parte de um plano para conseguir os melhores resultados, estimulando as capacidades físicas a superarem os desempenhos. Mas, também se podem treinar as mentes para fazer ciência.

O dia-a-dia de Luis Filipe Lages Martins divide-se entre a atividade de investigação em Metrologia com aplicação na Engenharia Civil e a gestão laboratorial da Unidade de Metrologia Aplicada do LNEC – Laboratório Nacional de Engenharia Civil. O primeiro estudante a obter o grau de doutor em Engenharia Física pela Faculdade de Ciências da Universidade de Lisboa nasceu em Lisboa e aos 34 anos acaba de ser distinguido com o Prémio Inovação em Metrologia.

Luís Filipe Lages Martins, bolseiro de pós-doutoramento do LNEC – Laboratório Nacional de Engenharia Civil, é o vencedor da 1.ª edição do Prémio Inovação em Metrologia da Sociedade Portuguesa de Metrologia (SPMet).

Em parceria com a Universidade de Lisboa e outras instituições que lecionam o curso de Química, a Sociedade Portuguesa de Química atribui prémios de mérito aos alunos com melhores resultados alcançados nesta área científica.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O 11.º Dictum et factum é com Aurora Sardinha, assistente técnica do Tec Labs – Centro de Inovação de Ciências.

Já só faltam dois eventos para a digressão Ignite IAstro terminar. Amanhã acontece um deles, na Covilhã, o último irá ocorrer na Guarda, a 3 de dezembro.

Onde estou? Para onde vou? As células do lugar ajudam-nos a cartografar (guiar) as nossas viagens no mundo, e constituem uma espécie de andaime espaço/temporal/cerebral que suporta a memória autobiográfica. Como o cérebro computa? Não é com Java, mas com um outro tipo de linguagem ainda a descobrir. O caminho para a compreensão dos códigos neuronais da cognição está aberto, e o desafio está lançado simultaneamente à Biologia, à Ciência da Computação e à Filosofia.

capa do livro

A banda desenhada "Reportagem Especial - Adaptação às Alterações Climáticas em Portugal" é lançada em Ciências esta segunda-feira, 7 de novembro de 2016, pelas 17h00, no auditório da Fundação da Faculdade, sito edifício C1, piso 3.

A ciência contemporânea enfrenta um conjunto de novos desafios que podem limitar a sua legitimidade, o seu valor e alcance. Estas notas abordam alguns destes riscos tentando apontar possíveis caminhos para os ultrapassar.

O ESPRESSO vai permitir descobrir planetas semelhantes à Terra, estudar a variabilidade das constantes fundamentais da Física e será essencial para complementar os dados da missão espacial PLATO.

Faleceu recentemente, com 95 anos, Ricardo Augusto Quadrado. Foi um professor de Cristalografia e Mineralogia da FCUL, e da Universidade da Madeira, extremamente marcante para quantos tiveram o privilégio de com ele privar. 

“Ainda há muito para fazer”, responde Nuno Araújo, quando questionado quanto ao futuro desta investigação, que dá um passo significativo num dos maiores desafios da Física da Matéria Condensada e que diz respeito ao desenvolvimento de técnicas experimentais, económicas e eficazes, capazes de sintetizar as estruturas desejadas de forma espontânea.

“O mergulho científico não se reduz à Biologia (…). Se estás interessado em fazer mergulho científico, esta é uma ótima oportunidade para dares os primeiros passos”, esta é a mensagem em jeito de convite do Núcleo de Mergulho Científico de Ciências ULisboa para alunos, professores, investigadores e outros funcionários de Ciências.

Os cientistas João C. Duarte, Filipe M. Rosas e Wouter P. Schellart apresentam o novo supercontinente chamado Aurica.

Páginas