IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

InovCarbon, Janus e o BreatheBio são os vencedores da segunda edição da Call for Projects do ScienceIN2Business.

Nos últimos anos a saída de quadros superiores seniores e de cientistas de Portugal acompanhou uma grande vaga de emigração, sobretudo para a Europa.

O tema deste ano é “A ciência não é só dos cientistas”.

Se a última Noite de Ciências foi dedicada ao Trânsito de Mercúrio e ao sistema solar, em maio é a vez do bosão de Higgs ganhar destaque.

Alunos da Faculdade agitam no ar fitas de fim de curso

A Alameda da Universidade de Lisboa voltou a encher-se de finalistas de Ciências e de tantas outras faculdades e universidades. Este ano a cerimónia ocorreu no dia 21 de maio de 2016. Para alguns este é um acontecimento especial - é que "há momentos que marcam a vida", por isso mesmo merecem ser recordados.

“A poor international standard for trap selectivity threatens carnivore conservation” - um estudo publicado online a 2 de maio de 2016 na revista “Biodiversity and Conservation” - revela falhas graves nas normas que regulam a legalidade de armadilhas para captura de carnívoros.

A 2.º edição da Escola de Verão de Energia da Faculdade de Ciências da Universidade de Lisboa acontece entre 27 de junho e 1 de julho de 2016. As candidaturas já abriram e terminam a 31 de maio.

Recentemente, a Google anunciou o SmartReply para diminuirmos a carga que muitos de nós têm com o serviço de correio (emails), as dezenas de mensagens que se vão acumulando enquanto as horas passam. Quem está interessado nesta facilidade? É segura, não invasiva, e quem ganha no fim?

Estão prestes a ser divulgados pela Reitoria da Universidade de Lisboa os resultados do inquérito à empregabilidade dos estudantes da Universidade. Estes indicadores passarão a ter cada vez mais importância, seja ao nível da Universidade como das políticas públicas. O tema da empregabilidade passa pois a ser crítico, e a Jobshop anual um instrumento prioritário para a acção de Ciências.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O quinto Dictum et factum é com Andreia Rezende, técnica superior do Gabinete Jurídico de Ciências.

Trinta e três pessoas submeteram até ao final do passado mês de março mais de 200 fotografias no âmbito do Concurso de Fotografia de Ciências 2016. Durante o Dia de Ciências – a 19 de abril de 2016 – foram atribuídos os prémios e as menções honrosas às melhores imagens do concurso.

Um grupo de investigadores do Centro de Química e Bioquímica de Ciências, da Osaka Prefecture University (OPU), no Japão, do Rutherford Appleton Laboratory, no Reino Unido e de duas instituições francesas - o Institut de Chimie de Clermont-Ferrande e o CNRS - sintetizou um novo nanomaterial considerado como catalisador verde de nova geração. 

O Dia de Ciências 2016 foi celebrado no dia do aniversário da Faculdade – 19 de abril – e juntou, como em anos anteriores, alunos, professores, investigadores, outros funcionários desta faculdade, seus familiares e amigos.

António Branco, professor do Departamento de Informática de Ciências, participa na cerimónia “CPLP 20 anos - A Diversidade Cultural que Nos Une”, cujo objetivo é comemorar o Dia da Língua Portuguesa e da Cultura da CPLP, celebrado a 5 de maio de 2016, no Palácio Conde de Penafiel, em Lisboa.

Diz-se que nem sempre pensamos por linhas direitas, quase sempre seguimos por curvas, em ziguezagues, corrigindo o que estava confuso, unindo e simplificando, recorrendo a imagens e metáforas, para ajudar os outros a capturarem a essência das coisas.

A próxima sessão da Cicloficina realiza-se a 2 de maio de 2016, pelas 17h00, no parque de bicicletas do C5.

A iniciativa do Departamento de Informática de Ciências - organizada no âmbito do Girls in ICT Day - visa promover uma reflexão sobre as potencialidades das Tecnologias da Informação e Comunicação junto de jovens raparigas, pais e professores. 

logotipo da iniciativa

A inscrição no Dia Aberto é gratuita, obrigatória e não tem data limite. Os visitantes a 27 de abril de 2016 podem conhecer a faculdade sozinhos ou acompanhados, em 30 minutos ou o dia inteiro.

O plano de atividades deve ser um ato participado, de modo a congregar os esforços que as partes estão dispostas a investir no todo. As unidades de serviços souberam dar este passo importante, estabelecendo objetivos anuais e metas de concretização para as atividades previstas.

Daniel Kahneman, um psicólogo que obteve o prémio Nobel da Economia em 2002, escreveu o livro “Thinking Fast and Slow” (2011) para nos ensinar que a inteligência precisa da intuição, e isso explica aqueles modos de pensar, com duas velocidades.

Paul Schmit, embaixador do Grão-Ducado do Luxemburgo em Portugal visita a Faculdade de Ciências da Universidade de Lisboa no âmbito da receção de boas-vindas aos alunos do “2nd Intensive Study Programme (ISP)”, um curso avançado em Segurança Informática, destinado a alunos de mestrado

O que fazem e o que pensam alguns membros da comunidade de Ciências? O quarto Dictum et factum é com Ricardo Ferreira, bolseiro da Segurança do Trabalho.

Os estudantes da Escola Técnica e Liceal Salesiana de Santo António e do Colégio dos Plátanos venceram as semifinais das Olimpíadas de Química Júnior 2016 ocorridas em Ciências este sábado, dia 9 de abril.

A mostra itinerante “A ULisboa é para todos”- inaugurada esta segunda-feira - está em exibição até 15 de abril, no átrio do edifício C3, no campus de Ciências.

Quando Ana Henriques Pato terminou em 2002 o ensino secundário, na Escola Secundária Fernão Mendes Pinto, em Almada, com a média de 18 valores, escolheu Ciências. A sua ligação à Faculdade não ficou por aí.

Páginas