IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Professora Olga Pombo, autora do livro "O Círculo dos Saberes"

“Estou convencida que a imagem do círculo constitui um arquétipo, uma determinação conceptual prévia a toda a investigação”, defende Olga Pombo, docente na FCUL e autora do livro “O Círculo dos Saberes”.

Imagem ilustrativa do livro "O Círculo dos Saberes"

“A apresentação do livro seguirá um formato sério e discreto. O professor Shahid Rahman fará uma apresentação e apreciação do livro e eu agradecerei todas as suas palavras, sejam elas elogiosas, sejam críticas", afirma a autora Olga Pombo.

Trial para todos os Membros da b-on.

Pessoas a correr junto ao Marquês de Pombal

A primeira Corrida da Ciência aconteceu o ano passado por ocasião das celebrações dos 100 anos da FCUL. A edição deste ano integra-se na 2.ª Edição do AmbientALL – Universidade em Movimento.

O concurso de programação destina-se a alunos universitários e este ano junta 16 equipas, oriundas de oito instituições universitárias portuguesas. A equipa da FCUL chama-se BigO(1).

Imagem da professora Maria José Boavida

“Colega amiga”, “orientadora empenhada e humanista” e “investigadora solidária”, assim se recorda Maria José Boavida (1948 – 2012).

Desenho do campus da FCUL

As tabelas e notas científicas, assim como as regras elementares de segurança em laboratórios são algumas das mais-valias deste “livro”.

A fim de cumprir com o estabelecido no Regulamento Eleitoral, o Caderno Eleitoral para a eleição do Presidente do Departamento de Estatística e Investigação Operacional está disponível para consulta.

 O projecto CAMPUS UL realizado pelos alunos de mestrado em Engenharia Geográfica no âmbito das disciplinas de Fotogrametria Analítica e de Produção Cartográfica ganhou o segundo prémio no concurso internacional de projectos com fins educativos

lâmpada

"Criar, transferir e valorizar economicamente o conhecimento científico" é a causa primária do renovado centro de inovação, situado no campus da FCUL.

Hoje, quarta-feira, dia 10 de Outubro de 2012, registou-se uma quebra no acesso à Internet pelas 17h00 por cerca de 5 minutos.

A causa foi externa à Faculdade de Ciências da Universidade de Lisboa e ainda não fomos informados das suas causas.

Estão abertas três vagas para bolseiros para a Unidade de Informática

Imagem do professor J. Sebastião e Silva

O Departamento de Matemática da FCUL apresenta obras selecionadas de personalidades da nossa história, nomeadamente os Compêndios de Matemática e os respetivos Guias para professores de José Sebastião de Silva, cujos direitos patrimoniais foram cedidos à Faculdade por um período de 30 anos.

Devido a uma avaria no equipamento de Videoconferência, o serviço encontra-se interrompido por tempo indeterminado. Pedimos desculpa pelo incómodo causado.

Alunos aguardam a sua vez na fila para as inscrições

Este ano, durante a 1.ª fase de inscrições, foi realizado um inquérito a 845 estudantes. De acordo com os resultados obtidos, o reconhecimento da competência científica (25%), a localização (22%) e a nota de candidatura (22%), foram determinantes na escolha da FCUL.

Abertura de Concurso para uma posição de substituição de Doutor Ciência na CFNUL na área Física Nuclear – Reações Nucleares, ver anúncio em http://www.eracareers.pt/opportunities/index.aspx?task=global&job

A FCUL dá as boas-vindas aos novos alunos, após o arranque do novo ano letivo, a 17 de setembro.

Filipe Duarte Santos - Professor Catedrático e Jubilado do Departamento de Física e Director do SIM

Imagem de perfil de Maria Filomena Camões, professora do DQB-FCUL

Maria Filomena Camões, professora do Departamento de Química e Bioquímica da FCUL, assina um artigo sobre a criação do Instituto Nacional de Metrologia da Colômbia e a inauguração de um laboratório do qual é madrinha.

Guiomar Evans - Prof. Auxiliar do Departamento de Física e Investigadora do Centro de Física da Matéria Condensada

A missa do 30.º dia em memória de José Manuel Pires dos Santos, professor aposentado do Departamento de Informática da FCUL, realiza-se a 11 de setembro, pelas 19h00, na Igreja da Luz, em Carnide.

Toda a morte, mesmo a anunciada, é uma surpresa. Um misto de espanto e de descrença como se não fosse possível acontecer.

As actividades da Semana Zero do DEGGE têm lugar nos dias 12, 13 e 14 de Setembro.

Bolsas Universidade de Lisboa / Fundação Amadeu Dias

Em cinco anos, a UL e a FAD apoiaram 134 projetos. A Faculdade de Ciências distingue-se com o maior número de alunos e respetivos trabalhos distinguidos, setenta.

Páginas