IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

A representação do campus da Faculdade de Ciências da Universidade de Lisboa em 3D utilizando tecnologias inovadoras fornece dados de apoio à gestão e utilização de recursos.

“Nos meus projetos lido diariamente com a Biologia, a que aprendi na faculdade e ao longo da minha vida, e com o desenho que me acompanha como forma de olhar, entender e comunicar”, declara o ilustrador científico Pedro Salgado, antigo aluno de Ciências.

.

Cerca de 39 alunos do BioSys participaram no segundo encontro de estudantes deste programa doutoral. O evento ocorreu em Beja este mês. Também em outubro terminam as candidaturas a 11 bolsas de doutoramento da próxima edição do BioSys.

Uma vez mais Ciências participou na Maratona Interuniversitária de Programação (MIUP), este ano organizada pela Universidade do Minho. A equipa de Ciências - Caracóis Hipocondríacos -, composta pelos alunos Nuno Burnay, Robin Vassantlal e Guilherme Espada, ficou em 3.º lugar, ao resolver quatro dos nove problemas da competição.

Imagina que tens um jarro vazio e um conjunto de pedras grandes, seixos, gravilha e areia. Agora, imagina que para encher o jarro, vais colocando primeiro a areia e a gravilha e só no fim, as pedras maiores... O que achas que acontece? Será que vai caber tudo e de que forma?... E se colocássemos as pedras grandes primeiro?

As alterações climáticas podem mudar a natureza do impacto do lagostim-vermelho-da-Louisiana (Procambarus clarkii) nos ecossistemas.

Recentemente, dois estudos sobre como pensamos, um do Instituto Max Planck (para a História da Ciência, Alemanha) e outro da Escola de Medicina de Harvard (EUA), de maio de 2017 (revista NeuroImage, de Elinor Amit e Evelina Fedorenko), clarificaram as diferenças que nós temos quando refletimos sobre alguma matéria, fazemos coisas, ou emulamos a realidade.

Ciências participa na KIC EIT Health que visa promover o empreendedorismo para o desenvolvimento de uma vida saudável e de um envelhecimento ativo. Os alunos podem inscrever-se na unidade curricular que lhes permite participar no projeto, sendo que uma parte é feita na Dinamarca.

A experiência ATLAS acontece há 25 anos e a data será celebrada com palestras, bem como com uma homenagem à responsável pela participação portuguesa na experiência, a cientista Amélia Maio.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de outubro é com Francisco Oliveira, assistente técnico do Núcleo de Manutenção do Gabinete de Obras, Manutenção e Espaços da Área de Serviços Técnicos de Ciências.

O Prémio Nobel da Física de 2017 foi atribuído a Rainer Weiss, Barry Barish e Kip Thorne. Francisco Lobo, investigador do Departamento de Física de Ciências e do Instituto de Astrofísica e Ciências do Espaço, comenta o tema.

Há cinco anos o biólogo marinho Pedro M. Lourenço encontrou microfibras em dejetos de aves. Foi nessa ocasião que surgiu a ideia de avaliar a abundância de microplásticos nos estuários, iniciando assim um estudo sobre a poluição por plásticos.

“Para além da importância no contexto científico, este trabalho também tem uma forte importância no contexto industrial, pois permite otimizar os gastos de energia domésticos e industriais”, explica o investigador do Centro de Química Estrutural de Ciências, Francisco Bioucas.

Mais de 100 cientistas reúnem-se em Lisboa, na Faculdade de Ciências, para abordar a temática dos nanofluidos.

A origem dos raios cósmicos de elevada energia foi desvendada. O LIP, do qual Ciências faz parte, colaborou na obtenção dos resultados.

O minhocário será usado para investigar o processo de vermicompostagem, numa experiência piloto em parceria com o Gabinete de Segurança, Saúde e Sustentabilidade da Área de Serviços Técnicos de Ciências e com o Centro de Ecologia, Evolução e Alterações Ambientais (cE3c).

Há um mineral peculiar que pode ajudar a desvendar o contributo do vulcanismo de Decão sobre a extinção em massa e a morte dos dinossauros: a akaganéite. Os resultados do estudo foram publicados na Nature Scientific Reports.

Ciências participa com mais de 30 de atividades de divulgação de ciência, espalhadas por Lisboa, Lousal e até na ilha Terceira.

O primeiro Dia Internacional do Microrganismo foi celebrado a 17 de setembro, no Pavilhão do Conhecimento, em Lisboa, numa iniciativa conjunta da Sociedade Portuguesa de Microbiologia, Ordem dos Biólogos, Ciência Viva e Comissão Nacional da UNESCO.

Desde 1971 que a guerra está aberta, mas o combate tem sido difícil. Por um lado, não temos só uma doença, e o que já conhecemos não tem chegado para estarmos contentes.

Um novo estudo liderado por Ciências encontrou grandes quantidades de fibras artificiais no estuário do Tejo e em zonas costeiras da África Ocidental, segundo comunicado de imprensa emitido pela Faculdade esta segunda-feira.

Falta pouco para a Faculdade voltar a ser homenageada com a atribuição de mais duas insígnias de professores eméritos a dois dos seus docentes aposentados.

Zbigniew Kotowicz, investigador e membro integrado do Centro de Filosofia das Ciências da Universidade de Lisboa, faleceu aos 67 anos, no dia 21 de setembro de 2017.

Ciências integra um consórcio europeu que vai receber do programa Horizon 2020 cinco milhões de euros para desenvolver, entre 2018 e 2021, a mais avançada tecnologia de espectrometria de massa.

Agora que terminaste o ensino secundário e estás prestes a iniciar esta nova etapa, vários vão ser os desafios pessoais e académicos que vais enfrentar.

Páginas