IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
José Artur Martinho Simões

A ideia para esta entrevista surgiu na sequência da publicação do livro "A Anatomia das Moléculas", de José Artur Martinho Simões, pela Imprensa da ULisboa. É um livro curto que numa linguagem simples, precisa e atraente, acompanhada de muitas imagens, nos dá a conhecer o admirável mundo das moléculas, as suas propriedades, ligações e reações.

Pessoa a tomar notas num caderno

Desde que o atual site da Faculdade foi lançado, há cerca de nove anos, foram publicados 1800 géneros jornalísticos relacionados com o ensino, a investigação e a transferência do conhecimento e da inovação nas áreas das ciências exatas e naturais e das tecnociências. Em 2020 publicamos 144 géneros jornalísticos, no ano anterior 121. Este mês demos visibilidade a mais de uma mão cheia de assuntos diferentes.

Monitor com gráfico

Um artigo da autoria de investigadores do Centro de Estatística e Aplicações da Universidade de Lisboa - Luzia Gonçalves, Maria Antónia Amaral Turkman, Carlos Geraldes, Tiago A. Marques e Lisete Sousa - chama a atenção para o uso de forma incorreta de modelos estatísticos, evidenciado durante a pandemia da COVID-19. 

Campus Ciências ULisboa

A Universidade de Stanford divulgou uma lista com os principais cientistas mais citados do mundo em várias áreas científicas. Portugal está representado com 385 cientistas afiliados a instituições portuguesas, 104 são profissionais afiliados a faculdades ou institutos da ULisboa.Ciências ULisboa está representada nesta lista com 14 cientistas.

CGD/MATHFCUL vai participar na final nacional do GMC 2020

A CGD/MATHFCUL participa na final nacional do Global Management Challenge 2020. A 41.ª final nacional do GMC decorre a 15 de março, os resultados serão anunciados a 16 de março de 2021. A equipa vencedora nacional da edição 2020 vai representar Portugal na final internacional.

Pormenor da radiogaláxia gigante MGTC J095959.63+024608.6, detetada com o radiotelescópio MeerKAT

A descoberta de duas novas galáxias gigantes na emissão no rádio sugere que muitas mais destas estruturas impressionantes estarão prestes a revelar-se, segundo um estudo internacional que contou com a colaboração do Instituto de Astrofísica e Ciências do Espaço.

Agregação amilóide na doença de Alzheimer e mecanismos neuronais de proteção

“Estou muito grato por este reconhecimento que nos impele a fazer mais e melhor”, conta Cláudio M. Gomes, a propósito da menção honrosa que recebeu no âmbito dos Prémios Científicos Universidade de Lisboa/Caixa Geral de Depósitos 2019.

Reunião de coconstrução das Rotas da Caravana AgroEcológica no Instituto Politécnico de Viseu, em janeiro de 2020

A Caravana AgroEcológica é um projeto participativo criado pelo grupo de investigação MITE2 do cE3c, Ciências ULisboa com o objetivo de aproximar produtores, consumidores e investigadores através da agroecologia. A CA desenvolve atualmente cinco iniciativas paralelas.

European Mathematical Society

Jorge Buescu, professor do Departamento de Matemática da Ciências ULisboa, é vice-presidente da European Mathematical Society (EMS). É a primeira vez que um português é eleito vice-presidente da EMS. O mandato de Jorge Buescu começa em janeiro deste ano e termina no final de 2024.

Oceano

A redução de oxigénio nos oceanos é o fator com mais impacto negativo nos organismos marinhos. Esta é a principal conclusão de um estudo publicado na revista Nature Ecology and Evolution, liderado por membros do Laboratório Marítimo da Guia do Centro de Ciências do Mar e do Ambiente, polo da Ciências ULisboa, segundo comunicado de imprensa emitido esta segunda-feira.

Modelo digital de superfície da duna de Porto Santo, com evidência da perturbação da duna frontal atualmente sujeita a deflação eólica

Ciências ULisboa integra o consórcio do projeto LIFE DUNAS que prevê a requalificação e restauro da morfologia dunar na praia do Porto Santo, Madeira, no âmbito do programa LIFE Climate Change Adaptation. Ana Nobre Silva é responsável deste projeto na Faculdade.

Polvo e peixes

Um grupo de investigadores do Laboratório Marítimo da Guia do Centro de Ciências do Mar e do Ambiente (MARE), polo da Ciências ULisboa e do Max Planck Institute of Animal Behavior relatam vários eventos de diferentes polvos (Octopus cyanea) deslocando peixes com um “soco” ou “murro”, isto é, um movimento explosivo e direto com um braço.

Jovem a ler um livro perto de uma janela

Conhece a Técnica do Pomodoro? Esta prática monitoriza o estudo, garantindo períodos de alta produtividade e concentração. Leia as dicas de João Oliveira, estagiário no GAPsi Ciências ULisboa, sobre como gerir as distrações e manter a organização.

Logotipo Radar

Décima primeira rubrica Radar Tec Labs, dedicada às atividades do Centro de Inovação da Faculdade.

Vídeochamada com membros do ATP no complexo interdisciplinar a partir do KITP, na Califórnia, em abril de 2014

Alumnus Vítor V. Vasconcelos: Galardoado com Prémio Bragança Gil pretende aplicar conceitos e métodos da Física aos sistemas sociais.

O Instituto de Biossistemas e Ciências integrativas (BioISI), unidade de investigação sediada na Faculdade, promoveu no passado dia 26 de novembro um encontro científico para apresentar e partilhar os seus últimos projetos, resultados científicos e colaborações.

Telemóvel e teclado

Uma mudança cultural e a criação de uma nova mentalidade na conceção de ferramentas para atividades profissionais e privadas para todos os cidadãos europeus, na posse das suas totais capacidades ou com alguma limitação, é o objetivo da ação LEAD-ME COST, que tem Carlos Duarte, professor do Departamento de Informática, investigador do LASIGE Ciências ULisboa, como membro do comité de gestão desta ação.

Crianças invisuais, a interagir com adaptações e novos ambientes de programação

Professores, investigadores e alunos da Ciências ULisboa estão a estudar e desenvolver novos ambientes de programação inclusiva para crianças no LASIGE.

Oceano e costa

O Conselho Europeu de Investigação atribuiu recentemente uma bolsa Synergy no valor de 10,4 milhões de euros ao projeto 4-OCEANS, liderado por Cristina Brito, professora do Departamento de História e investigadora do Centro de Humanidades da Faculdade de Ciências Sociais Humanas da Universidade Nova de Lisboa, antiga aluna da Ciências ULisboa.

Biblioteca e livros

2020 é um ano que ficará para a história por muitas razões relacionadas com a pandemia, mas também pelos avanços registados na ciência que estuda os fotões, particularmente na fotónica linear e não linear e cujos estudos foram publicados na Nature, Nature Photonics e Science e contaram com a colaboração teórica de Vladimir Konotop, professor do Departamento de Física e investigador do Centro de Física Teórica e Computacional da Ciências ULisboa.

Pormenor da capa do livro

O livro “Alterações Climáticas Desafios para Portugal depois do Acordo de Paris” pretende mostrar a diversidade temática associada ao problema das alterações climáticas, e fornecer ao leitor interessado uma fonte acessível e em português, que lhe permita ficar a par dos desenvolvimentos mais recentes nas diferentes áreas abordadas.

Telhados fotovoltaicos

Definir um modelo genérico de laboratório vivo para as universidades - Living Lab Universitário -, adaptável ao resto da sociedade, é o grande objetivo do projeto europeu TR @ NSNET, que junta em consórcio a Ciências ULisboa, a Universidade da Beira Interior, a Université Toulouse III Paul Sabatier (UT3), a Université de La Rochelle, ambas em França e a Universidad Politecnica de Madrid, em Espanha.

Portátil e pessoas

No ano letivo 2020/2021, todos os estudantes da Ciências ULisboa que tenham interesse e dúvidas sobre as carreiras da União Europeia poderão contactar Beatriz Rocha por email eucareers.fcul@gmail.com ou via Instagram! A aluna da Ciências ULisboa do 2.º ano de Biologia está disponível para aconselhar e explicar todo o processo de recrutamento na UE.

Simulação de marés oceânicas

“Weak tides during Cryogenian glaciations” da autoria de J. A. Mattias Green, Hannah S. Davies, João C. Duarte, Jessica R. Creveling e Christopher Scotese foi publicado esta sexta-feira, 4 de dezembro, na revista científica Nature Communications.

ULisboa

Em Portugal a ULisboa continua a liderar o US News 2021 Best Global Universities Rankings. Na edição de 2021 foram avaliadas 1748 instituições.  "Não é com certeza estranho a esta subida o empenho de todos os que trabalham na nossa Faculdade em particular durante este ano pejado de tantas dificuldades”, comenta Pedro Almeida, subdiretor da Ciências ULisboa.

Páginas