IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
FCUL Raly Pro

Everybody in this country should learn how to program a computer… Because it teaches you how to think”, citação de Steve Jobs, fundador da Apple, mencionada na sessão de abertura do evento FCUL Rally Pro.

A empresa Grupo Actuarial encontra-se a oferecer estágios remunerados a estatísticos, matemáticos e engenheiros informáticos .

A qualidade da formação será tão mais diferenciada quanto mais os seus graduados forem capazes de integrar habilmente as diversas competências que assimilaram no seu percurso académico.

Fernando Pessoa em destaque nas Redes Sociais

“[Pretendemos] identificar quais os versos e frases de Fernando Pessoa que mais inspiram os seus leitores de todo o mundo e, ao mesmo tempo, conduzir todos aqueles que usam as palavras de Pessoa aos seus textos originais”, explica Francisco Couto, professor do DI-FCUL e coordenador do projeto.

foto de Microsonda

A Faculdade de Ciências da Universidade de Lisboa (FCUL) conta com 3 infraestruturas de investigação registadas na base de dados do projecto MERIL - Mapping of the European Research Infrastructures Landscape.

Dupla Titulação em Geologia - Ano lectivo 2013-2014

Convénio de Cooperação Académica entre o Instituto de Geociências da USP e o GeoFCUL

FCUL promove sessão de informação sobre oportunidades de financiamento no âmbito dos Desafios Societais 2 e 5.

“O principal objetivo é precisamente mostrar o que o EMBL tem para oferecer aos investigadores portugueses (e aos da FCUL, muito em particular) e também demonstrar o que pode ser feito em cooperação com o [laboratório].”, declara Margarida Amaral, docente da FCUL e membro do conselho de organização do evento.

Estão abertas as candidaturas à edição de 2013 do Prémio Academia Lx, destinado a trabalhos de investigação e estudos sobre temas com relevância prática para a cidade de Lisboa.  

Aceitam-se candidaturas de docentes para inclusão numa  Bolsa de Recrutamento, para a Área de Finanças e Economia - Secção Autónoma de Estatística, d

FCUL promove cooperação com EMBL

A passagem do diretor-geral do EMBL pela FCUL, foi registada através de uma reportagem multimédia. Fique a saber mais sobre esta visita bem como os pormenores do evento “Molecular Biology in Portugal and EMBL”!

De 8 de Julho a 30 de Agosto as bibliotecas do C4 e C8 têm alteração nos horários de funcionamento

Doctorate in Applied and Engineering Physics

Programa Doutoral em Física Aplicada e Engenharia Física

Arthur Vieira, estudante do mestrado integrado em Engenharia Física e Emiliano Pinto, aluno de mestrado em Física Nuclear e Partículas, são os diretores da revista trimestral do Departamento de Física da FCUL e  que integra uma equipa editorial constituída por outros 16 discentes.

Challenge4you desafiou estudantes dos cinco aos vinte anos

“Aquilo que aqui aprendemos faz parte da cultura geral e todos nós devemos ter algumas ideias sobre o local onde estamos inseridos e sobre esta união de que todos fazemos parte e que tanto nos ajuda”. A declaração é da estudante e participante Adriana Pereira de 17 anos.

Para uma crítica das perspectivas recentes da União Europeia sobre o Ensino Superior

Recomendações para melhorar a qualidade do ensino e da aprendizagem.

Implicações no Quebramento do Gondwana e sua Correlação com as bacias da Margem Atlântico Sul e Atlântico Central

É crucial que estatísticos e investigadores em Ciências do Ambiente mantenham uma colaboração estreita, para que continuem a ser desenvolvidos métodos estatísticos e computacionais adequados que permitam dar resposta continuada aos desafios presentes e futuros.

Está disponível a edição de 2012 do JCR (Journal Citation Reports).

O trabalho de cinco investigadoras portuguesas foi distinguido no início de junho em Boston, nos EUA. O congresso mundial contou com mais de 800 cientistas de 50 países.

[Tec Labs]i – Potenciar a Inovação

“Os alunos da FCUL tiveram uma experiência única que não vão esquecer ao longo da sua vida académica e profissional”, denota Rui Ferreira, administrador do Tec Labs – Centro de Inovação da FCUL.

Visita de Estudo à nova Universidade de Lisboa

“[Viveu-se um ambiente] muito propício ao debate onde o intercâmbio de ideias e de boas práticas foram muito gratificantes e uma mais-valia para os participantes e oradores do evento”, declarou Luísa Cerdeira, pró-reitora da Universidade de Lisboa e presidente do FORGES.

Páginas