IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Encontram-se abertos vários concursos para atribuição de bolsas de gestão de ciência e tecnologia para o Instituto Português do Mar e da Atmosfera (IPMA).

Acesso a texto integral de artigos

Campus de Ciências

Pedro Lencastre é do Porto e agora estuda em Lisboa. A mudança proporcionou-lhe novos conhecimentos. “As pessoas com as quais trabalho neste momento são para mim um importante modelo como cientistas e pessoas”, conta.

Encontram-se abertas as candidaturas para o Programa Trainee Volkswagen Autoeuropa.

Pedro Lencastre

Pedro Lencastre estuda método matemático que possa aferir objetivamente a fiabilidade das avaliações de rating.

O Évoa - Espaço de Visitação e Observação de Aves encontra-se a recrutar guias para o seu projeto de turismo da natureza e de educação ambiental.

Entrevista de Paulo Veríssimo em destaque na edição de dia 8 do jornal diário Público.

A Randstad Professionals procura Fixed Income Quantitative Analyst. Para mais informações contactar 

A LPN encontra-se a recrutar técnicos para vários cargos.

Para consultar os editais, aceda a www.lpn.pt

Data limite de candidatura: 10 de setembro de 2014

Desejamos as boas vindas aos novos alunos do Departamento de Informática.

As candidaturas ao programa de doutoramento em Filosofia da Ciência, Tecnologia, Arte e Sociedade estão abertas até ao dia 12 de setembro de 2014.

Alunos de Ciências

Na primeira semana em Ciências os novos alunos enquanto aguardam pela inscrição podem assistir a palestras.

A relevância do estudo publicado na “Astronomy & Astrophysics” está na quantidade e qualidade da informação obtida por aquela infraestrutura astronómica internacional, tanto a nível químico como dinâmico.

Prémio Jovem Investigador da Sociedade Europeia de Aterosclerose

“A comunidade científica presente no evento congratulou-me, e a toda a equipa, pela qualidade do trabalho desenvolvido. Disseram que Portugal estava de parabéns!”, explicou a vencedora do Prémio Jovem Investigador da Sociedade Europeia de Aterosclerose, Catarina Alves.

Os resultados da 1.ª fase do concurso nacional de acesso ao ensino superior são divulgados a 8 de setembro.

A actividade científica é colectiva e cumulativa. Newton disse: “Se vi um pouco mais longe do que os outros, é porque pude subir aos ombros de alguns gigantes”.

Gestos que salvam 2014

A partir do mês de setembro, entre outras iniciativas, está prevista uma ação de sensibilização em avaliação e prevenção de riscos.

Convento da Arrábida

“No limite do (im)possível” organizado pelo Instituto de Ciências da Complexidade ocorreu no Convento da Arrábida, entre 30 de junho e 1 de julho passado.

“Nós oferecemos muitas oportunidades sobretudo para pós-doutorados, pessoas bem treinadas”, disse Jorge Almeida Guimarães, referindo que em Portugal existem mais de cinco mil bolseiros brasileiros, enquanto o número de portugueses no Brasil é ainda reduzido.

Uma reflexão sobre o ano lectivo 2013/2014.

Encontra-se aberto concurso para atribuição de uma Bolsa de Investigação para Mestre no âmbito do Projeto “ Biosustain – Mobilidade Sustentável: Perspetivas para o futuro da produção de biocombustíveis”, Laborat&oacut

De 11 a 14 de agosto as instalações da Faculdade de Ciências da ULisboa encontram-se encerradas, na sequência do corte do abastecimento de água. Os Departamentos encontram-se encerrados até 19 de agosto.

Laboratório de Ciências

Ana Paula Calixto é docente do ensino secundário há 28 anos. Cátia Silva é aluna de Ciências desde 2005, neste momento frequenta o doutoramento. Conheça os testemunhos de quem visita e estuda em Ciências.

Páginas