IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
João Lin Yun

João Lin Yun distingue-se na área da Física e da Astronomia. No seu currículo, diversidade de atividades organizadas e desenvolvidas dentro do território nacional e fora dele são um marco evidente. Para além da forte aposta na carreira profissional, a vida do professor da FCUL é marcada também pela escrita.

João Lin Yun

“Quando escrevo, há alturas em que as ideias e o material fluem de forma tão espontânea que me surpreendo com o resultado! É como se as personagens tomassem as rédeas e dissessem: ‘quero dizer isto e fazer aquilo!’ E eu limito-me a obedecer-lhes…”, comenta o professor da FCUL, João Lin Yun.

As candidaturas à formação avançada decorrem até 13 de dezembro. Para esta 1.ª edição, que se inicia a 13 de janeiro de 2014, devem ser atribuídas seis bolsas mistas cujos trabalhos decorrem em Portugal e no estrangeiro, com o intuito de desenvolver projetos conjuntos entre países.

Paulo Veríssimo, professor catedrático do DI-FCUL, participou no passado dia 25 de novembro de 2013, no programa "Sociedade Civil", transmitido na RTP2.
 
António Branco

Um dos resultados chave da análise levada a efeito é o de que a língua portuguesa é um dos idiomas para o qual a preparação tecnológica para a era digital é "fragmentária".

Imagem abstrata da  "Philosophy of Science in the 21st Century - Challenges and Tasks"

Durante o evento será lançado o programa doutoral em Filosofia da Ciência, Tecnologia, Arte e Sociedade, recentemente aprovado pela FCT, com a mais elevada classificação: “Exceptionally strong with essentially no weaknesses”.

Rita Cascão

O sucesso do Biobanco-IMM é promovido pelo contínuo aumento de parcerias e colaborações não só com empresas de biotecnologia e unidades de saúde, mas também com institutos de investigação científica e investigadores académicos de ciências básicas, como os investigadores da FCUL.

SIMPLES AZULEJOS

Azulejos quadrados e Matemática

 

Bandeira de Marrocos

Atualmente a equipa prossegue com os trabalhos de correção de falhas e de afinação do CuCo de modo a dar apoio às sete faculdades marroquinas e a prepará-lo também para entrar em operação no DI-FCUL já no próximo ano letivo.

José Afonso

Chama-se galáxia IRAS 08572+3915 e é a mais luminosa do universo local. José Afonso é um dos membros da equipa de astrónomos internacionais, que anunciou recentemente a descoberta. O investigador da FCUL e dirigente do CAAUL é muito otimista quanto ao presente e futuro desta área científica.

Consulte informação adicional aqui.

Bill Fyfe foi um grande amigo de Portugal. Orientou ou coorientou vários doutoramentos de portugueses, acerca de temas relevantes para Portugal e fomentou as ligações científicas entre Portugal-Brasil-Canadá. Em 1990 a Universidade de Lisboa outorgou-lhe o grau de doutor honoris causa.

Uma das consequências do aumento da disponibilidade de fontes laser de maior potência, compactas e a baixo preço é o aumento da sua má utilização.

Circo Matemático

“O objetivo do Circo é mostrar que é possível utilizar resultados matemáticos para produzir resultados espetaculares e para divertir e motivar as pessoas”, explicou o professor da FCUL, Pedro Freitas.

Temos sido pioneiros de muito boas práticas no ensino superior. Uma excelente escola e nós, que cá estamos, sabemos isso. E os alunos também. Os que cá estão e os que já cá estiveram. Mas hoje não chega. Temos que saber responder aos desafios e temos que exportar as nossas mais-valias.

Inscrições 2013/2014

Atualmente estudam na FCUL mais de cinco mil alunos, a maioria conhece bem os cantos da casa centenária, outros nem tanto, por isso é especialmente importante o acolhimento dado durante o arranque do ano letivo, que o digam a Catarina, a Leonor e o Ricardo!

Joaquim Dias

Num planeta com mais de 7000 milhões de pessoas, vão ser necessárias quantidades enormes de alguns recursos naturais que começam a escassear. Chegará em breve a era da mineração submarina? Existe tecnologia adequada? Será possível a mineração em condições de preservar a diversidade natural dos ecossistemas marinhos?

Ana Bastos

Através de diversas atividades práticas vamos aprender qual o papel do sol na dinâmica da atmosfera e do oceano, qual a importância dos oceanos, das calotes polares e da vegetação, como se formam as nuvens e os sistemas meteorológicos, e como funciona o ciclo da água.

Foi a 26 de Outubro que se realizou a Maratona Inter-Universitária de Programação, 2013, (MIUP2013).

Uma das surpresas do Dia Internacional passa pela exposição do concurso de fotografia lançado recentemente e alusivo ao tema “Mobilidade Internacional”.

Maria Inês Cruz

Atualmente, para além do “básico” lápis de grafite com que todos ainda escrevemos, até o desenvolvimento dos carros híbridos está dependente da evolução e extração dos recursos da nossa “casa”.

Susana Custódio

Como é que são gerados os tremores de Terra? E os tsunamis? Como é que nós reconhecemos no terreno a existência de tsunamis antigos? Porque é que na Nazaré vemos ondas tão grandes? Todos estes fenómenos são o reflexo de um enorme dinamismo do nosso planeta.

SCOPUS é também uma ferramenta para estudos bibliométricos e avaliações de produção científica.

Páginas