IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Nos últimos anos, a UNESCO financiou o projeto internacional - "Complex Systems Digital Campus (UniTwin)" - recorrendo a uma plataforma de e-Meeting, e esse exercício mostrou o caminho certo (alternativo aos massive open online courses ou MOOC) para esta nova experiência pedagógica da informática na educação. Quer isto dizer que a tecnologia, quando bem explorada, pode ser mesmo benéfica.

Em junho deste ano Alice Nunes terminou o programa doutoral em Biologia e Ecologia das Alterações Globais. Esta quinta-feira, durante o 16.º Encontro Nacional de Ecologia, a decorrer até amanhã no Salão Nobre da Reitoria da ULisboa, apresenta esse trabalho – “Plant functional trait response to climate in Mediterranean drylands: contribution to restoration and combat of desertification”, classificado em segundo lugar nesta primeira edição do Prémio da SPECO.

O prémio Nobel da Química foi atribuído em 2017, em partes iguais, a três investigadores, Jacques Dubochet (Universidade de Lausana, Suiça), Joachim Frank (Universidade de Columbia, Nova Iorque, EUA) e Richard Henderson (Laboratório MRC de Biologia Molecular, Cambridge, UK) pelo desenvolvimento da microscopia crioelectrónica que permite a resolução da estrutura de biomoléculas em solução com alta resolução.

Em 2017 a “Medalha Dr. Janusz Pawliszyn” foi atribuída a José Manuel Florêncio Nogueira, professor do Departamento de Química e Bioquímica, coordenador do grupo de Ciência e Tecnologia de Separação do Centro de Química e Bioquímica de Ciências e representante português na European Society for Separation Science.

Em 2017 o Centro Interuniversitário de História das Ciências e da Tecnologia celebra dez anos. Para comemorar a efeméride, a unidade de I&D realiza no próximo dia 8 de novembro, a partir das 18h00, no anfiteatro da FCiências.ID, sito no edifício C1, piso 3, a primeira distinguished lecture com Jürgen Renn, prestigiado historiador das ciências e diretor do Max Planck Institute for the History of Science.

A representação do campus da Faculdade de Ciências da Universidade de Lisboa em 3D utilizando tecnologias inovadoras fornece dados de apoio à gestão e utilização de recursos.

“Nos meus projetos lido diariamente com a Biologia, a que aprendi na faculdade e ao longo da minha vida, e com o desenho que me acompanha como forma de olhar, entender e comunicar”, declara o ilustrador científico Pedro Salgado, antigo aluno de Ciências.

.

Cerca de 39 alunos do BioSys participaram no segundo encontro de estudantes deste programa doutoral. O evento ocorreu em Beja este mês. Também em outubro terminam as candidaturas a 11 bolsas de doutoramento da próxima edição do BioSys.

Uma vez mais Ciências participou na Maratona Interuniversitária de Programação (MIUP), este ano organizada pela Universidade do Minho. A equipa de Ciências - Caracóis Hipocondríacos -, composta pelos alunos Nuno Burnay, Robin Vassantlal e Guilherme Espada, ficou em 3.º lugar, ao resolver quatro dos nove problemas da competição.

Imagina que tens um jarro vazio e um conjunto de pedras grandes, seixos, gravilha e areia. Agora, imagina que para encher o jarro, vais colocando primeiro a areia e a gravilha e só no fim, as pedras maiores... O que achas que acontece? Será que vai caber tudo e de que forma?... E se colocássemos as pedras grandes primeiro?

As alterações climáticas podem mudar a natureza do impacto do lagostim-vermelho-da-Louisiana (Procambarus clarkii) nos ecossistemas.

Recentemente, dois estudos sobre como pensamos, um do Instituto Max Planck (para a História da Ciência, Alemanha) e outro da Escola de Medicina de Harvard (EUA), de maio de 2017 (revista NeuroImage, de Elinor Amit e Evelina Fedorenko), clarificaram as diferenças que nós temos quando refletimos sobre alguma matéria, fazemos coisas, ou emulamos a realidade.

Ciências participa na KIC EIT Health que visa promover o empreendedorismo para o desenvolvimento de uma vida saudável e de um envelhecimento ativo. Os alunos podem inscrever-se na unidade curricular que lhes permite participar no projeto, sendo que uma parte é feita na Dinamarca.

A experiência ATLAS acontece há 25 anos e a data será celebrada com palestras, bem como com uma homenagem à responsável pela participação portuguesa na experiência, a cientista Amélia Maio.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de outubro é com Francisco Oliveira, assistente técnico do Núcleo de Manutenção do Gabinete de Obras, Manutenção e Espaços da Área de Serviços Técnicos de Ciências.

O Prémio Nobel da Física de 2017 foi atribuído a Rainer Weiss, Barry Barish e Kip Thorne. Francisco Lobo, investigador do Departamento de Física de Ciências e do Instituto de Astrofísica e Ciências do Espaço, comenta o tema.

Há cinco anos o biólogo marinho Pedro M. Lourenço encontrou microfibras em dejetos de aves. Foi nessa ocasião que surgiu a ideia de avaliar a abundância de microplásticos nos estuários, iniciando assim um estudo sobre a poluição por plásticos.

“Para além da importância no contexto científico, este trabalho também tem uma forte importância no contexto industrial, pois permite otimizar os gastos de energia domésticos e industriais”, explica o investigador do Centro de Química Estrutural de Ciências, Francisco Bioucas.

Mais de 100 cientistas reúnem-se em Lisboa, na Faculdade de Ciências, para abordar a temática dos nanofluidos.

A origem dos raios cósmicos de elevada energia foi desvendada. O LIP, do qual Ciências faz parte, colaborou na obtenção dos resultados.

O minhocário será usado para investigar o processo de vermicompostagem, numa experiência piloto em parceria com o Gabinete de Segurança, Saúde e Sustentabilidade da Área de Serviços Técnicos de Ciências e com o Centro de Ecologia, Evolução e Alterações Ambientais (cE3c).

Há um mineral peculiar que pode ajudar a desvendar o contributo do vulcanismo de Decão sobre a extinção em massa e a morte dos dinossauros: a akaganéite. Os resultados do estudo foram publicados na Nature Scientific Reports.

Ciências participa com mais de 30 de atividades de divulgação de ciência, espalhadas por Lisboa, Lousal e até na ilha Terceira.

O primeiro Dia Internacional do Microrganismo foi celebrado a 17 de setembro, no Pavilhão do Conhecimento, em Lisboa, numa iniciativa conjunta da Sociedade Portuguesa de Microbiologia, Ordem dos Biólogos, Ciência Viva e Comissão Nacional da UNESCO.

Desde 1971 que a guerra está aberta, mas o combate tem sido difícil. Por um lado, não temos só uma doença, e o que já conhecemos não tem chegado para estarmos contentes.

Páginas