IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

O seminário "Wind Waves: from climate to forecasting scales" realiza-se a 7 de maio de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

Andra Stroe, do Observatório de Leiden, em breve vai estar em Lisboa, para trabalhar em novas descobertas com o astrónomo David Sobral, do Instituto de Astrofísica e Ciências do Espaço (IA) e da Faculdade de Ciências da ULisboa.

Com a fusão da Universidade de Lisboa e da Universidade Técnica de Lisboa, em 2013, foi possível equacionar formatos de formação, que beneficiam da cooperação entre as 18 escolas da atual ULisboa.

O seminário "On the Use of Muse of Meteorological Satellites for Land Surface Monitoring" realiza-se a 30 de abril de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

MÁRIO EDMUNDO

Mais de mil participantes parecem ter aceite o desafio, anunciado no site da faculdade. As inscrições encerraram a 22 de abril e são muitas as atividades com lotação esgotada.

A próxima atividade deste ciclo ocorre a 29 de maio e conta com a presença do cientista Henrique Leitão, que irá abordar o tema “A Luz na História da Ciência”.

O Gabinete de Mobilidade, Estágios e Inserção Profissional da Faculdade de Ciências da ULisboa, em colaboração com a Fundação da Juventude e o Novo Banco, promove uma "Sessão de Apresentação de Estágios de Verão", destinada a alunos pré-finalistas e finalistas de licenciatura e de mestrado. 

"As editoras académicas internacionais estão abertas a propostas de livros”, dizem Paulo Teixeira e João Casquilho.

É preciso desfazer o mito de que as Tecnologias da Informação e Comunicação (TIC) são uma área para homens, onde se trabalha de forma isolada e sem espaço para a criatividade.

Seminário Informal em Matemática no próximo dia 8 de Maio, 6ªfeira, às 14h na sala 6.2.44.

 

Tema: Derivação microscópica da equação do calor, apresentado por Alexandra Symeonides.

Seminário Informal em Matemática no próximo dia 24 de Abril, 6ªfeira, às 14h na sala 6.2.44.

 

Tema: Jogos de azar - estratégias ousadas e tímidas, uma perspectiva matemática, apresentado por Cristina Serpa.

Os utilizadores da FCUL que necessitem de acesso VPN à FCUL devem deixar de utilizar a anterior configuração baseada no servidor vpn.ul.pt ou webvpn.ul.pt e reconfigurar a sua ligação para as novas configurações.

Estão disponíveis através do Portal da FCUL novas plataformas e ferramentas de Tecnologias de Informação para toda a Comunidade da FCUL.
 

O seminário "METABOLISMO URBANO" realiza-se a 23 de abril de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

Temos de acreditar que vamos chegar onde queremos. Para isso, todos teremos de continuar a dar o nosso melhor, a bem da família de Ciências – alunos, docentes e não docentes.

A Associação Portuguesa de Estudantes e Investigadores no Reino Unido (PARSUK – Portuguese Association of Researchers and Students in the UK) vem oferecer 5 estágios de verão, com bolsa de estudos no valor de &eu

19 de abril de 1911. Quando a Faculdade de Ciências da ULisboa surgiu em Portugal, passava pouco mais de cem anos do surgimento da primeira escola classificada como tal, a Universidade de Berlim, na Alemanha, em 1810.

A Ação COST TD1402, iniciada em novembro de 2014, termina em novembro de 2018 e está fortemente ligada ao projeto “Nano partículas magnéticas para tratamento do cancro por hipertermia”, cuja investigadora principal é Maria de Deus Carvalho.

The European Organization for Nuclear Research (CERN) is offering full-time paid internships (4-12 months) to students. CERN has two different programmes, depending on the field of students:

O seminário "Do Espaço para a Terra com Copernicus" realiza-se a 16 abril de 2015, entre as 12h00 e as 13h00, no edifício C8, anfiteatro 8.2.47.

Páginas