IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Scientists working at the laboratory

Jaime A. S. Coelho, professor do DQB Ciências ULisboa e investigador no CQE, polo desta faculdade, é o primeiro investigador a trabalhar em Portugal a ser galardoado com o Prémio Thieme Chemistry Journals. "É uma enorme honra fazer parte desta prestigiada lista em que estão presentes outros químicos internacionalmente reconhecidos, como o Dean Toste (distinguido em 2003), Nuno Maulide (distinguido em 2010), Benjamin List (distinguido em 2001, prémio Nobel da Química 2021), David MacMillan (distinguido em 1999, prémio Nobel da Química 2021), entre outros”, diz Jaime A. S. Coelho.

Worldwide connection technology interface. Global Strategy Virtual Icon.Innovation Graphs Interface

A Faculdade é um dos associados fundadores da Biodata.pt, que opera a infraestrutura distribuída portuguesa de dados biológicos e o nó português ELIXIR. “A participação da Faculdade nesta associação é de elevada importância e valor estratégico”, escrevem os cientistas Cátia Pesquita, Sofia Henriques, Vítor Sousa, Célia Miguel e Miguel Machuqueiro.

Digital Cyber Circuit Head 3d

Um dos seis novos projetos financiados pelo Programa CMU Portugal no âmbito do concurso da FCT para projetos exploratórios 2021, na área das TIC intitula-se “Agência de Adultos Idosos em Interação Humano-Robot”.

zona costeira

Trabalho de investigação liderado por grupo da Universidade de Barcelona, que conta com contribuições de quatro investigadores do IDL Ciências ULisboa, encontra evidências de ocupação Neandertal mais recuada e prolongada no tempo.

Pescoço inclinado para trás

"Esta altura do ano é ideal para parar e refletir e sobretudo agradecer aos alunos, alumni, professores, investigadores e todos os outros funcionários desta “casa”, aqueles que continuam no ativo, os que se reformaram e aos que já não estão entre nós. Há um legado, sempre", escreve Ana Subtil Simões, editora da Newsletter de Ciências.

6 investigadores

Equipa de investigadores portugueses a trabalhar no German Cancer Research Center desenvolvem técnica pioneira para o tratamento com protões do cancro da próstata.

várias imagens de engenheiros ao computador e no terreno

Último artigo de opinião no âmbito das comemorações do centenário do curso de Engenharia Geográfica/Geoespacial.

Troféu

Em 2021 a Ordem dos Engenheiros (OE) celebrou 85 anos e 152 anos enquanto associação representativa destes profissionais portugueses. Durante as comemorações, esta sociedade pública profissional distinguiu Ciências ULisboa com o Troféu OE pelo centenário da criação da licenciatura Engenharia Geográfica/Geoespacial, um dos 12 que foram atribuídos durante a Gala 85 Anos OE.

Campus da Faculdade - passagem

“O equilíbrio entre o pensamento holístico e o pragmatismo experimental, entre a intuição e a dedução, é difícil de atingir. A educação é o terreno próprio para não recearmos essa viagem”, escrevem Rui Malhó e Helder Coelho, a propósito da obra “Complexidade: implicações e políticas globais”, apresentada recentemente na Fundação Calouste Gulbenkian.

Logotipo da rubrica radar Tec Labs

Vigésima rubrica Radar Tec Labs, dedicada às atividades do Centro de Inovação da Faculdade. A empresa em destaque é a Shift.

1.ª edição das Medalhas de Mérito Científico REN - Ciência LP

Adyler Frota,  alumnus do mestrado integrado em Engenharia da Energia e Ambiente da Faculdade, foi galardoado este mês com o 2.º prémio das Medalhas de Mérito Científico REN - Ciência LP, na categoria jovens estudantes, pela tese “Otimização do Desempenho Ótico de amostras de silício cristalino por Metal Assisted Chemical Etching (MACE)” e que contou com os orientadores José Silva e Ivo Costa.

grupo de atletas da equipa AEFCL

A equipa de natação da AEFCL conquistou nove medalhas num total de 24 provas no Campeonato Nacional Universitário de Natação em Piscina Curta. A AEFCL conseguiu a sua melhor classificação de sempre nestes campeonatos.

 albatrozes-de-sobrancelha

Um estudo liderado por um estudante do doutoramento em Biologia e Ecologia das Alterações Globais sobre a influência da temperatura da água do mar nos “divórcios” de uma população de albatrozes demostrou, pela primeira vez, uma influência direta do meio ambiente nas taxas de separação desta espécie monogâmica.

Maria Amélia Martins-Loução

“O esforço contínuo em inovar e cruzar saberes vale sempre a pena”, diz a cientista Maria Amélia Martins-Loução, distinguida com o Grande Prémio Ciência Viva 2021.

Brochuras e outros brindes

"A comunicação gera representações sociopsicológicas que são usadas para diferenciar, reconhecer e memorizar os seus bens, produtos e serviços, tornando-os singulares." Mais uma rubrica em jeito de editorial, da autoria de Ana Subtil Simões, editora da Newsletter de Ciências.

Maria Manuel Torres com alunos

"A Matemática serve para fazer magia", comenta Maria Manuel Torres, professora do Departamento de Matemática, a propósito da sessão sobre investigação em Matemática pura, realizada no âmbito do "Encontro com o Cientista", uma inicativa do Pavilhão do Conhecimento - Escola Ciência Viva. A Faculdade recebeu a visita de cerca de 45 alunos, com cerca de 10 anos, acompanhados pelas suas professoras e auxiliares, assim como por técnicos da Ciência Viva.

Reboot - closing this endless crisis [terminar esta crise interminável]

A Reboot é uma associação sem fins lucrativos formada em outubro de 2020 com a missão de criar uma comunidade focada no combate à crise climática. Circular 2021 é o próximo evento organizado pela Reboot, e decorre a 1 de dezembro, na Aula Magna da Reitoria da ULisboa.

Todas as semanas são boas para dar a conhecer os cientistas e o que investigam, assim como os seus contributos para o avanço do conhecimento, ainda assim há semanas mais especiais que outras, como é o caso da Semana da Ciência e da Tecnologia.

Imagem abstrata relacionada com o cartaz promocional do ranking

Alan Phillips é distinguido, pelo 4.º ano consecutivo, como um dos cientistas mais citados na área da Ciência Vegetal e Animal a nível mundial, pelo Highly Cited Researchers da Clarivate Analytics, uma empresa norte-americana especializada em gestão de informação científica.

musaranho-de-dentes-brancos

Investigador do Centro de Estudos do Ambiente e do Mar polo da Ciências ULisboa lidera descoberta sobre o comportamento social do musaranho-de-dentes-brancos.

Mulher escreve num quadro

Quer saber quem são os cientistas mais citados a nível mundial? Aceda gratuitamente aos dados da Mendeley, publicados na Elsevier. Portugal tem 481 cientistas no ranking referente ao impacto ao longo da carreira e 703 no ranking de 2020. Ciências ULisboa apresenta melhores resultados face a 2019.

4 pessoas com colete refletor

O Gabinete de Segurança, Saúde e Sustentabilidade da Ciências ULisboa promoveu a realização do primeiro simulacro no edifício do Centro de Ciências do Mar e do Ambiente. O primeiro exercício na Faculdade ocorreu em dezembro de 2013. Até agora já foram realizados 19 simulacros.

João Carlos Ribeiro Reis, professor aposentado do Departamento de Química e Bioquímica da Faculdade, e investigador do Centro de Química Estrutural, faleceu no passado dia 5 de novembro. A Faculdade apresenta sentidas condolências aos seus familiares, amigos e colegas.

Logotipo da rubrica radar Tec Labs

Décima nona rubrica Radar Tec Labs, dedicada às atividades do Centro de Inovação da Faculdade.

Seringas

Ensaio da autoria dos professores Manuel Carmo Gomes e Carlos Antunes.

Páginas