IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Secção Autonoma de História e Filosofia das Ciências da FCUL

A Secção Autónoma de História e Filosofia das Ciências - SAHFC

 

DESAFIO SOCIETAIS 1, 2 E 5: HEALTH, BIO-ECONOMY, CLIMATE ACTION

IV Jobshop

“Os alunos e os responsáveis pelos recursos humanos das empresas participantes poderão dialogar e assim trocar informações úteis acerca dos métodos, oportunidades e critérios de recrutamento utilizados”, informa o presidente da AEFCL, Eduardo Matos.

Logotipo Cost

A próxima reunião do Comité COST, área de Chemistry and Molecular Sciences and Technologies realiza-se em  setembro, em Lisboa. Durante esse acontecimento a organização local prevê estudar, juntamente com os atuais e os antigos delegados a ações COST, novas formas de incrementar a participação portuguesa no Horizonte 2020.

“A parceria que temos [com a FCUL] contribuiu em larga escala para o desenvolvimento da Science4you”, comenta Miguel Pina Martins, a propósito do sucesso da empresa que soma novos galardões: o “Business Internationalization Award” e os Prémios Novos, na categoria Empreendedorismo.

Instituto Dom Luiz – University of Lisbon and the Center of Geophysics of the University of Coimbra invite applications for one Post-Doctoral research position. The post-doctoral researcher will be integrated in project QuakeLoc‐PT.

Sessão de esclarecimento sobre os mestrados no GeoFCUL 2013/14

Sessão de esclarecimento sobre os mestrados em Geologia 2013/2014 do GeoFCUL

 

17 Maio (sexta-feira), 10h00-11h30, sala 6.2.47

 

Terá a presença dos coordenadores:

Rosto de Luísa Canto e Castro Loura

Conciliar e anonimizar as mais extensas bases de dados da Direção-Geral de Estatísticas da Educação e Ciência é uma tarefa com várias etapas, que se prevê estar finalizada no decorrer do quarto trimestre de 2013.

Aldeia mineira do Lousal

Até ao momento os Prémios GeoConservação já distinguiram a ação das autarquias de Idanha-a-Nova, Valongo, Cantanhede, Arouca, Porto, Alcanena, Rio Maior e das associações de municípios Natureza e Tejo e dos Açores.

Anfiteato 3.2.14

Durante a sessão comemorativa do 102.º aniversário da FCUL, alguns dos melhores alunos da FCUL sorriram e encantaram com os seus depoimentos, num trabalho multimédia apresentado durante o evento.

Cerca de 93 alunos, agrupados em equipas de três elementos, realizaram as provas teóricas e experimentais nas instalações da FCUL.

No âmbito da disciplina de Estatística Ciência e Sociedade, a Profª Dirce Monteiro do Instituto Superior de Ciências Sociais e Políticas, Universidade Técnica de Lisboa, proferirá, no dia 23 de Abril (3ª feira) pelas 14:30, na sala 6.4.30,&n

Logotipo Dia da FCUl 2013

A FCUL foi criada no século XX, a 19 de abril de 1911, pouco mais de cem anos após o surgimento da primeira escola classificada como tal, a Universidade de Berlim, na Alemanha, em 1810. Em 2013 Ciências comemora 102 anos.

 

Manuel Nunes Marques

Manuel Nunes Marques, antigo diretor do Observatório Astronómico de Lisboa e professor aposentado do Departamento de Engenharia Geográfica, Geofísica e Energia da FCUL, faleceu durante a madrugada de 18 de abril. A missa de corpo presente realiza-se esta quinta-feira, pelas 19h00, na Igreja Nossa Senhora Conceição dos Olivais Sul, em Lisboa. O funeral realiza-se a 19 de abril, pelas 15h00, na Igreja de Santo António das Areias, no concelho de Marvão. Aos familiares, amigos e colegas, a FCUL apresenta as sinceras condolências.

património + educação = identidade

A Geometria na Politécnica, no âmbito das comemorações do Dia Internacional dos Monumentos e Sítios.

 

Carlos Rafael Borges Mendes

O interesse pelas ciências e tecnologias surgiu ainda no liceu, tendo optado por prosseguir os estudos na área da Biologia, em parte por influência de duas professoras dessa disciplina.

Visitas guiadas à  Exposição Formas & Fórmulas

13 de abril 11h30-13h00

11 de maio 11h30-13h00

Diálogos com Formas & Fórmulas

11 de abril 18h

No próxima quinta-feira, 11 de Abril, a FCUL e em particular, o Departamento de Informática, vão ser "invadidos" pelos alunos do secundário. Para visitar o DI-FCUL já temos cerca de 200  alunos inscritos.

Maqueta do Campus Sustentável da UL

As expetativas da equipa da Universidade Verde só podiam ser elevadas: as verbas alcançadas no âmbito desta iniciativa serão usadas para implementar medidas de eficiência energética, já identificadas nas auditorias realizadas.

Trial para todos os membros da b-on

 

Páginas