IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

No âmbito do mestrado em Bioestatística realiza-se no dia 29 de outubro, entre as 16h00 às 17h00, na sala 6.4.30, no edifício C6, o seminário "Doppler Flow Pattern in patients with Aortic Coarctation&quo

LaSIGE 2015 Workshop

O LaSIGE 2015 Workshop realiza-se no dia 7 de novembro, entre as 14h00 e as 19h00, no auditório da Fundação da FCUL.

Em Ciências ULisboa há uma disciplina, desenvolvida em parceria com o ISCTE-IUL, que ajuda os estudantes a conceber ideias de negócio. As inscrições decorrem até dia 23 de outubro.

Susana Custódio

A "animação" mostra a vibração do solo registada em Mafra durante um sismo de magnitude 6 (M6) ocorrido ao largo do cabo de S. Vicente.

O Departamento de Estatística e Investigação Operacional (DEIO) associa-se a esta celebração a nível mundial, promovendo várias iniciativas destinadas a divulgar a Estatística não só aos alunos mas também a toda a restante comunidade de Ciências.

Programa

José Madeira

A palestra de entrada livre visa divulgar os resultados de um estudo publicado recentemente na Science Advances e para a necessidade da sociedade melhorar a sua capacidade de resiliência.

Participação da equipa portuguesa nas IESO 2015

A semana de 13 a 20 de setembro de 2015 será algo que nenhum de nós jamais irá esquecer. Tivemos a oportunidade de, pela primeira vez na vida, participar numa competição internacional, a International Earth Science Olympiad (IESO), na qual nunca nenhum estudante português tinha participado. O riquíssimo programa desta competição englobou momentos de turismo, de convívio, de projetos e, claro, de provas. Vamos, agora, contar-vos a nossa experiência…

O Gabinete de Mobilidade, Estágios e Inserção Profissional e o GAPsi, em colaboração com as empresas Galp Energia, Accenture e Jerónimo Martins promovem na Faculdade de Ciências da ULisboa um evento de empregabilidade subordinado ao tema “Estágios Profissionais – o que procuram as empresas?”.

“Livros de Ciências, Ciências em Livros” é a primeira exposição da Galeria Ciências e vai estar patente ao público até 29 de fevereiro de 2016.

Vasco Teixeira/MUHNAC

Um dos sonhos mais antigos da humanidade foi, desde sempre, representar o céu dentro de um espaço fechado. Essa ilusão torna-se realidade nos teatros do espaço e do tempo – os planetários.

Encontra-se aberto concurso para a atribuição de uma Bolsa de Investigação para um Mestre no &a

José Maneira trabalhou como postdoc no grupo de Arthur B McDonald, um dos galardoados este ano com o prémio Nobel da Física. O docente do Departamento de Física de Ciências ULisboa, juntamente com a professora Amélia Maio, orientou Nuno Barros, cujo tema da tese de doutoramento incidiu sobre os resultados agora premiados.

Desde 2009 que temos vindo a trabalhar no solo da horta, transformando um solo argiloso bastante paupérrimo no que é hoje.

“Agitar, promover, valorizar, beneficiar o ensino da Geologia em Portugal, captar vocações, atrair mais e melhores estudantes para esta área do conhecimento são os objetivos últimos deste nosso envolvimento. As medalhas são um prémio e um instrumento, não um fim em si”, diz em entrevista Jorge Relvas, professor do Departamento de Geologia de Ciências.          

A iniciativa é gratuita, mas implica prévia inscrição.

Na sequência da publicação do 

O artigo “Hazard potential of volcanic flank collapses raised by new megatsunami evidence” é publicado online a 2 de outubro de 2015, na Science Advances, uma nova revista do grupo editorial Science e reacende o debate que dura há algumas d&ea

A Biblioteca de Ciências alerta para a necessidade de salvaguardar informação guardada na área do atual serviço.

A propósito do quarto aniversário da morte do P.

Páginas