IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Bombeiro apaga fogo

Era madrugada e o edifício da Faculdade de Ciências de Lisboa, na rua da Escola Politécnica, ardia. Dezoito de março, seriam duas horas da madrugada. Um salto da cama, um vestir rápido e uma fuga apressada ao encontro das labaredas.

Mar

Qual o impacto das poeiras provenientes do Sahara na produtividade marinha do Oceano Atlântico tropical, particularmente nos coccolitóforos (fitoplâncton calcário)? Esta é a principal questão que irá marcar o trabalho de Catarina Guerreiro, investigadora do MARE.

pilhas de compostagem

O compostor da FCUL foi inaugurado há pouco mais de um ano, em 27 de novembro de 2016, numa parceria entre a HortaFCUL, o Gabinete de Segurança, Saúde e Sustentabilidade da FCUL e o cE3c - Centro de Ecologia, Evolução e Alterações Ambientais.

Gabriella Gilli

Gabriella Gilli, investigadora do Instituto de Astrofísica e Ciências do Espaço, pretende usar um novo modelo teórico tridimensional, análogo ao que é usado para descrever a atmosfera de Vénus, para antecipar as futuras observações de exoplanetas quentes de tipo terrestre.

Vladimir Konotop

Nesta fotolegenda destacamos uma passagem da entrevista com o físico Vladimir Konotop e que pode ser ouvida no canal YouTube e na área multimédia deste site.

Bernadette Bensaude-Vincent

A ULisboa atribui a 2 de março o título de doutor honoris causa a Bernadette Bensaude-Vincent, por proposta da Faculdade de Ciências, homenageando uma personalidade de grande relevo cientifico com relações estreitas com o contexto científico português, demonstrando publicamente quanto lhe deve e quanto se sente honrada por lhe poder conceder este titulo.

Biblioteca com alunos

A entrada na faculdade é muito mais do que a transição para uma nova etapa académica, é o início de uma aventura no próprio desenvolvimento, onde se passa de jovem a adulto. Esta fase acarreta desafios para o próprio e nas relações com os outros, ficando este jovem adulto entre o medo e o desejo de crescer com tarefas académicas, sociais, pessoais e vocacionais para fazer face, simultaneamente.

Campus de Ciências

Dois investigadores do cE3c – Centro de Ecologia, Evolução e Alterações Ambientais receberam bolsas europeias Marie Sklodowska-Curie para desenvolver investigação nos próximos dois anos.

Concorrentes

A semifinal aconteceu a 17 de fevereiro, a final nacional a 12 de abril e a final internacional entre 5 e 10 de junho. Em Ciências foram apurados quatro finalistas, estudantes da ULisboa nos cursos de Física, Biologia, Engenharia Química e Matemática Aplicada e Computação.

Carlos Mateus Romariz Monteiro

Faleceu a 9 de fevereiro de 2018, com 97 anos, Carlos Mateus Romariz Monteiro.

Pessoa sentada junto a uma mesa

Passamos, quer no trabalho como em momentos de lazer, longos períodos sentados. Estar sentado é um descanso! Mas, será mesmo assim?

João Martins

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de fevereiro de 2018 é com João Martins, técnico superior do Departamento de Física de Ciências.

A cooperação (e colaboração) científica apoia-se sempre em ensinar e aprender (dar e receber), num registo de amizade e humildade, de motivação e de empolgamento. A paridade é fundamental, tal como o “foco e simplicidade”, a relevância e a utilidade (Steve Jobs).

João Carlos Marques, professor da Faculdade de Ciências e Tecnologia da Universidade de Coimbra é o novo diretor do MARE, sucedendo no cargo Henrique Cabral, professor do Departamento de Biologia Animal de Ciências.

A iniciativa possibilita aos estudantes a recolha de informação sobre diversas áreas do saber das 18 escolas da Universidade de Lisboa.

Ciências presta homenagem a Dmitri Ivanovich Mendeleev a 8 de fevereiro de 2018, data em que se assinala o 184º aniversário do seu nascimento. Nesse dia, 118 alunos do 9.º ano do Colégio de Santa Doroteia, em Lisboa, visitam a tabela periódica existente neste campus universitário.

O artigo “The Little Ice Age in Iberian mountains” publicado em fevereiro de 2018 na Earth-Science Reviews caracteriza com maior precisão o último grande evento frio do hemisfério norte, de acordo com comunicado de imprensa emitido esta quinta-feira.
A Little Ice Age (LIA) ou a Pequena Idade do Gelo ocorreu aproximadamente entre 1300 e 1850 e afetou as comunidades dos Pirenéus. Os resultados desta investigação está a ter algum impacto em Espanha.

Pormenor da capa do livro

“Ao contrário do que aparentava no início deste projeto, foi relativamente fácil dar um ritmo de arte sequencial (banda desenhada) ao argumento.

A 2.ª edição do mestrado em Gestão e Governança Ambiental da Faculdade de Ciências da Universidade Agostinho Neto (FCUAN) deverá arrancar no último trimestre do ano letivo 2018/2019 e contará novamente com o apoio de Ciências. Na 1.ª edição 16 estudantes concluíram com sucesso os programas de estudo.

Cinquenta alunos do 4.º ano do Colégio Colibri, de Massamá, foram cientistas por um dia nos Departamentos de Biologia Animal e Biologia Vegetal.

Quando João Graça Gomes iniciou o estágio “Cenarização Sistema Elétrico 100 % Renovável em 2040”, com a duração de um ano, no Departamento Técnico da Associação Portuguesa de Energias Renováveis (APREN), sob a orientação de José Medeiros Pinto, engenheiro e secretário-geral daquela associação, quis “dar o melhor e mostrar a qualidade do ensino de engenharia na FCUL”. O ano passado foi distinguido com um dos prémios de maior destaque da engenharia nacional.

João Graça Gomes, engenheiro do Departamento Técnico da APREN e mestre em Engenharia da Energia e do Ambiente, foi galardoado com o Prémio - Melhor Estágio Nacional em Engenharia Eletrotécnica da Ordem dos Engenheiros.

Nesta fotolegenda destacamos uma passagem da entrevista com o climatologista Ricardo Trigo e que pode ser ouvida no canal YouTube e na área multimédia deste site.

Por forma a gerir a ansiedade de uma forma mais eficaz antes dos momentos de avaliação são propostas algumas estratégias que não eliminam a ameaça mas podem ajudar a lidar de um modo mais eficaz com a ansiedade.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O primeiro Dictum et factum de 2018 é com Marta Daniela Santos, responsável pelo Gabinete de Comunicação do cE3c – Centro de Ecologia, Evolução e Alterações Ambientais.

Páginas