IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

O curso decorrerá entre 8 de Junho a 9 de Julho, de segunda a quinta feiras, 4h por dia, 4 dias por semana. 

Imagina que era possível experimentar um curso universitário antes de concorreres ao ensino superior?

O curso decorrerá entre o dia 13 e 25 de julho de segunda a sexta-feira das 17h às 20h e sábados das 09h às 17h. O objetivo principal deste curso será dar a conhecer as tecnologias de produção e armazenamento utilizadas em micro-redes de energia elétrica e respetiva formação em HOMER Pro (v.

As eleições dos membros dos Conselhos Científico e Pedagógico da Faculdade de Ciências da ULisboa ocorrem nos dias 26 e 27 de maio, entre as 9h00 e as 20h00, no átrio do edifício C3.

Ciências tem paixão pelas coisas do mar. A sua multidisciplinaridade fê-la receber o Prémio Scientia Mare 2015.

O seminário "Emergências Radiológicas" realiza-se a 28 de maio de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

Seminário Informal em Matemática no próximo dia 25 de Maio, 2ªfeira, às 14h na sala 6.2.44.

 

Tema: Teoria de super-caracteres do grupo unitriangular infinito", apresentado por Jocelyn Lochon.

A UNBABEL, start-up de antigo aluno do DI-FCUL, o Vasco Pedro, licenciado em Engenharia da Linguagem e do Conhecimento, é uma d

O seminário "Machine Learning: Introduction and selected applications" realiza-se a 21 de maio de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

O Departamento de Informática da Faculdade de Ciências da ULisboa organiza este ano a terceira edição do FCUL Rally Pro.

Aula aberta: Solos. Prof. Galopim de Carvalho

O Núcleo de Estudantes de Geologia (NEG FCUL), em colaboração com o Departamento de Geologia da Faculdade de Ciências da Universidade de Lisboa, tem o privilégio de receber o nosso tão acarinhado Professor Doutor António Galopim de Carvalho para uma

O evento inclui testemunhos. Os alunos de Ciências da ULisboa interessados em participar na sessão de esclarecimento devem inscrever-se.

No âmbito do Erasmus + strategic partnership ParIS (Partnership in Information Security), estudantes da Polónia, do Luxemburgo e de Portugal, nomeadamente do Departamento de Informática da Faculdade de Ciências da ULisboa, participaram recentemente no primeiro programa

A UNBABEL, start-up de antigo aluno do DI-FCUL, o Vasco Pedro, licenciado em Engenharia da Linguagem e do Conhecimento, é uma d

Mestrados do DBA de 2014 a 2016

Está a decorrer até dia 11 de junho de 2015 um trial  da eLS – Encyclopedia of Life Sciences, da editora Wiley. O acesso deve ser através da ligação

Realiza-se na Universidade Aberta (UAb), no dia 19 de Maio de 2015, pelas 15h, no Auditório 3 (Palácio Ceia, Rua da Escola Politécnica, 147, Lisboa), o Seminário de Matemática na Aberta Resolução numérica de equaç&o

Seminário Informal em Matemática no próximo dia 15 de Maio, 6ªfeira, às 14h na sala 6.2.44.

 

O seminário "CSI – Sismologia" realiza-se a 14 de maio de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

O Instituto Nacional de Estatística pretende recrutar 20 técnicos superiores. Os interessados devem preencher os requisitos indicados no anúncio

Pretendendo estimular o estudo e a investigação científica em Probabilidades e Estatística entre os jovens, a SPE atribui um número limitado de bolsas para participação no Congresso da SPE 2015, de acordo com o seguin

Durante a iniciativa serão apresentados projetos desenvolvidos no território nacional, na área dos portos, vinha, cadastro, energia e Geologia.

Haverá seminário de Lógica (21 de maio) e de Análise e Equações Diferenciais (28 de maio).

 

THURSDAY, MAY 21, 4:30PM ROOM: C8.2.11

A Associação dos Estudantes da Faculdade de Ciências de Lisboa organiza mais uma edição da Jobshop FCUL, de 4 a 8 de maio de 2015, no edifício C3.

Páginas