IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Jaime A. S. Coelho, professor convidado do Departamento de Química e Bioquímica e investigador do polo desta faculdade do Centro de Química Estrutural, foi distinguido pela Sociedade Portuguesa de Química (SPQ) com o Prémio para Melhor Químico Orgânico Jovem 2021.

Alunos na biblioteca do C8

Os artigos da revista Astronomy & Astrophysics (A&A), uma das principais revistas científicas de Astronomia do mundo, já são publicados em acesso aberto, através do subscribe-to-open (S2O), um modelo de ciência aberta por assinatura.

5 quitones

Artigo científico publicado no Journal of Paleontology dá conta da descoberta em Portugal de duas novas espécies de moluscos marinhos do Pliocénico (há cerca de 3,6 Ma) . O cientista Carlos Marques da Silva é um dos autores deste trabalho.

pessoa a ver uma fotografia da exposição

Crónica sobre a exposição “De Lisboa para os Trópicos”, da autoria de Rúben Oliveira e Teresa Vaz, curadores da mostra e que a partir de 21 de abril e até 21 de junho vai estar em exibição no átrio do edifício C6, no campus da Faculdade.

Cinco oradores e vários alunos a assistir

A Matemática une. O tema das comemorações do Dia Internacional da Matemática 2022 reflete o espírito de quem organiza atividades de divulgação científica, na Faculdade e fora dela, e também de quem participa. Fique a par das atividades do IDM, e conheça a opinião de estudantes e professores.

Logotipo das comemorações do Dia da Faculdade

Após dois anos a comemorar um aniversário de forma remota, em 2022, a comunidade da Faculdade volta a reunir-se no grande auditório da Ciências ULisboa para celebrar os 111 anos da instituição, criada por decreto a 19 de abril de 1911. A cerimónia comemorativa acontece no próximo dia 27 de abril, a partir das 14h00.

Logotipo da olimpíadas

A semifinal das Olimpíadas de Química Mais (OQ+) e a semifinal das Olimpíadas de Química (OQ) Júnior acontecem, respetivamente, nos próximos dias 30 de abril e 7 de maio, no campus da Faculdade. Professores e estudantes do Departamento de Química e Bioquímica colaboram em ambos os eventos.

Mercado de Santa Clara

"A sustentabilidade económica e escalabilidade dos sistemas agroecológicos é um objetivo difícil de atingir, mas sem dúvida necessário", escreve Inês Costa Pereira, da equipa da Caravana AgroEcológica, a propósito do 4.ª Dia Aberto de Produtores.

Unidade de colimação

O grupo de Instrumentação do Instituto de Astrofísica e Ciências do Espaço  produziu nos laboratórios da Ciências ULisboa uma peça essencial para o sucesso da missão espacial PLATO, designada unidade de colimação. Segundo notícia publicada no site do IA, duas delas já estavam previstas no âmbito do consórcio, a terceira acontece por encomenda direta da Agência Espacial Europeia.

Barco

Eduardo Sampaio, aluno de doutoramento da Faculdade, participou num documentário em Cabo Verde a bordo de um barco chamado Captain Darwin, como conta nesta crónica. Este mês a Science também publica uma carta da sua autoria, a propósito de uma das aventuras vividas durante parte desta viagem.

José Ribeiro, Pedro Machado e João Dias

Um estudo do IA Ciências ULisboa analisa observações da luz infravermelha dos planetas Vénus, Marte e Júpiter comparando-as com simulações do Planetary Spectrum Generator. Artigo inclui entrevista com o autor principal do artigo, alumnus da Faculdade.

Musaranho

O musaranho-de-dentes-brancos (Crocidura russula) está em expansão na Europa e foi identificado como tendo um carácter invasor em algumas ilhas, nomeadamente na Irlanda.Segundo comunicado de imprensa pulicado esta segunda-feira no EurekAlert!, a descoberta é feita por um grupo de investigadores do CESAM Ciências ULisboa e do Institute of Environmental Biology da Adam Mickiewicz University, na Polónia.

Mesa de trabalho com computador e utilizador

O redesenho do portal é um projeto da responsabilidade da Direção, Direção de Serviços Informáticos, Gabinete de Gestão de Informação e Departamento de Informática (DI). No âmbito desta iniciativa, Carlos Duarte, professor do DI Ciências ULisboa e membro da equipa, convida os utilizadores do portal a participar num breve estudo.
 

ETAR

A eficiência de remoção da carga do vírus responsável pela COVID-19 nos processos de tratamento das águas residuais em Estações de Tratamento de Águas Residuais (ETAR) é uma das conclusões mais relevantes do projeto de investigação SARS Control.

microscópio

Ciências ULisboa participou na Semana Internacional do Cérebro com palestras e demonstrações em laboratório. A cientista Diana Cunha-Reis destaca a importância da atividade no que diz respeito à partilha da interdisciplinaridade existente na Faculdade junto de alunos do ensino secundário.

Sara Carvalhal no laboratório

Sara Carvalhal, investigadora no Algarve Biomedical Center Research Institute, na Universidade do Algarve, e alumna da Ciências ULisboa, é uma das quatro jovens cientistas portuguesas distinguidas na 18.ª edição das Medalhas de Honra L’Oréal Portugal para as Mulheres na Ciência.

painel de oradores e participantes

Ciências ULisboa recebeu a visita de uma delegação de representantes do ISIS Neutron & Muon Source, um laboratório pertencente ao Science and Technology Facilities Council, localizado em Oxfordshirek, no Reino Unido, e considerado de excelência a nível mundial.

Fotografia do edifício C2 Ciências ULisboa

Os membros do Conselho de Escola e do Conselho Científico da Ciências ULisboa tomaram posse esta quarta-feira, dia 23 de março, na sequência do processo eleitoral ocorrido em fevereiro e março deste ano. Para mais informações sobre as competências destes órgãos, sugere-se a consulta dos estatutos da Faculdade.

Edna Correia com uns binóculos a olhar para o horizonte

Edna Correia, investigadora do Centro de Estudos do Ambiente e do Mar (CESAM), doutorada em Biologia e Ecologia das Alterações Globais pela Ciências ULisboa, é uma das quatro jovens cientistas portuguesas distinguidas na 18.ª edição das Medalhas de Honra L’Oréal Portugal para as Mulheres na Ciência.

Tubarão

A iniciativa de cidadania europeia “Stop Finning – Stop the Trade” tem como objetivo o término da União Europeia como uma importante plataforma de trânsito para o comércio mundial de barbatanas. "Face à atual legislação, o finning foi vetado em 2003. Porém, o massacre continua", escreve Madalena Sottomayor, aluna de mestrado em Biologia da Conservação da Ciências ULisboa.

trevos-brancos

Um estudo - colaborativo e sem precedentes -, liderado por biólogos evolucionistas da Universidade de Toronto Mississauga, no Canadá, capa da Science esta sexta-feira, dia 18 de março, mostra como a urbanização está a influenciar a evolução de plantas no mundo. A investigação desenvolveu-se no âmbito do Global Urban Evolution Project e contou com a participação de quase 300 investigadores e estudantes universitários, entre eles membros da Ciências ULisboa e do Centro de Ecologia, Evolução e Alterações Ambientais.

planta e ácaros

Inês Fragata, investigadora do Departamento de Biologia Animal da Ciências ULisboa e do grupo de Ecologia Evolutiva do Centro de Ecologia, Evolução e Alterações Ambientais, é uma das cientistas distinguidas com uma bolsa do European Research Council (ERC) Starting, no valor de cerca de 2M€, no âmbito do projeto “Feedback entre a dinâmica populacional e a evolução das interações num sistema tritrófico” (DYNAMICTRIO).

João Vieira e Ivo Canela

Na Póvoa, no Cadaval, distrito de Lisboa, João Vieira, octogenário, emigrante, técnico agrícola e um entusiasta da Agroecologia, lidera um grupo informal que promove variedades crioulas de sementes, que têm vindo a desaparecer desde a sua juventude. Ivo Canelas com Rebeca Mateus, da HortaFCUL, escrevem sobre a necessidade de adotar técnicas agrícolas mais eficientes, combatendo a monopolização da agricultura.

Participantes na EVT 2013, que também tinham participado no Encontro do Vimeiro em 1983

"Ross Leadbetter era amigo verdadeiro dos seus amigos, entre os quais me encontro, e é um dos gigantes da área de Valores Extremos (...)", escreve Maria Ivette Leal de Carvalho Gomes, professora emérita do DEIO Ciências ULisboa, na sequência do falecimento do professor emérito da University of North Carolina at Chapel Hill e doutor honoris causa da ULisboa.

Formação da zona de subducção de Vanuatu

Uma equipa de investigadores do Instituto Dom Luiz da Ciências ULisboa em parceria com cientistas da Universidade Johannes Gutenberg (JGU), em Mainz, na Alemanha, apresenta uma nova perspetiva para o início das zonas de subducção, contribuindo dessa forma para um maior conhecimento da teoria da tectónica de placas.

Páginas