IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Através da iniciativa os alunos de Ciências ULisboa ficam a conhecer o processo de recrutamento e seleção da Galp Energia.

Através da iniciativa os alunos de Ciências ULisboa ficam a conhecer o processo de recrutamento e seleção da Galp Energia.

"Reflexões sobre a neurobiologia da consciência" foi o tema da palestra de António Damásio.

Nos dias 26 e 27 de novembro de 2015 decorreu em Ciências ULisboa, a reunião anual do projeto europeu QTLeap – Quality Translation by Deep Language Engineering Approaches. Nesta reunião geral do segundo ano do projeto, os parceiros avaliaram os resultados obtidos com o protótipo 2 (Piloto 2)

Amélia Pilar Rauter e Catarina Dias

O website Nutriageing é destinado ao público em geral e já está disponível em nutriageing.fc.ul.pt.

New workstation computers for image analysis have been added to the C8 node of the FCUL Microscopy Facility, under BioISI management.

Sandra Nascimento Ferreira

É preciso pensar e realizar iniciativas que despertem os consumidores, ou seja, os diversos cidadãos, para a necessidade de reduzir a produção de resíduos, aumentado a consciência ambiental e a participação informada, crítica e reflexiva.

A Faculdade de Ciências da ULisboa realiza, pelo segundo ano consecutivo, a reunião anual do projeto QTLeap, que conta com a presença de todos os parceiros do consórcio e de outros investigadores, especialistas em processamento profundo de linguagem e em tradução automática.

A partir de janeiro de 2016, a ULisboa disponibiliza um espaço de apoio

O aluno do Mestrado em Matemática e colaborador do CEMAT (Centro de Matemática Computacional e Estocástica) Bernardo Hipólito Fernandes, ganhou uma bolsa de estímulo à investiga&cc

Joint Oney Intelligent Analytics Services, empresa satélite que apoia a actividade do Jumbo e que é especializada em estudos de mercado e projectos de consultoria na área do Grande Consumo, pretende recrutar

O Professor António Branco, do Departamento de Informática da FCUL, é o representante de Portugal, na Assembleia Geral da Infraestrutura Europeia CLARIN, que se realiza em Copenhaga, na Dinamarca, esta quinta e sexta-feira, 1

O curso deverá começar a 12 de fevereiro de 2016.

Na manhã da passada quinta-feira dia 12 de novembro, alunos do 4.º, 5.º e 6.º ano do Externato Santa Catarina e do

Durante o Congresso AlChe Annual Meeting 2015, a Elsevier atribuiu o prémio de melhor artigo científico do ano (2014) ao investigador Pedro Castro.

A 11 de novembro de 2015 foi assinado um protocolo entre a Faculdade de Ciências da ULisboa e a Sociedade Portuguesa de Matemática.

O Departamento de Matemática e Estatística da Universidade de Jyväskylä, Finlândia, está a oferecer bolsas de doutoramento. Os interessados devem submeter as suas candidaturas 

capa do livro  "Ciência, Prestígio e Devoção: Os Jesuítas e a Ciência em Portugal (séculos XIX e XX)"

A organização do concurso recebeu nesta edição 12 obras, quase na totalidade teses de doutoramento.

O prémio é entregue durante o Solar World Congress 2015.

Quem queira visitar Ciências ULisboa pode preencher o formulário disponível no portal da faculdade.

A Portugaliae Mathematica, revista científica da Sociedade Portuguesa de Matemática, acaba de publicar um fascículo duplo do volume de 2015 dedicado a João Paulo de Carvalho Dias, antigo diretor e professor jubilado do Departamento de Matemática da Faculdade de Ciências da ULisboa.

No ano em que celebra 30 anos, a Quercus distinguiu o cidadão Filipe Duarte Santos e a entidade Vale da Sarvinda, pelo trabalho que têm realizado na defesa do ambiente e na promoção do desenvolvimento sustentável.

Fornos preparados para começar a cozinhar

Cerca de 30 pessoas participaram no 1.º workshop de construção de fornos solares, construindo-os e degustando uma saborosa refeição.

Páginas