IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

Arthur Vieira, estudante do mestrado integrado em Engenharia Física e Emiliano Pinto, aluno de mestrado em Física Nuclear e Partículas, são os diretores da revista trimestral do Departamento de Física da FCUL e  que integra uma equipa editorial constituída por outros 16 discentes.

Challenge4you desafiou estudantes dos cinco aos vinte anos

“Aquilo que aqui aprendemos faz parte da cultura geral e todos nós devemos ter algumas ideias sobre o local onde estamos inseridos e sobre esta união de que todos fazemos parte e que tanto nos ajuda”. A declaração é da estudante e participante Adriana Pereira de 17 anos.

Para uma crítica das perspectivas recentes da União Europeia sobre o Ensino Superior

Recomendações para melhorar a qualidade do ensino e da aprendizagem.

Implicações no Quebramento do Gondwana e sua Correlação com as bacias da Margem Atlântico Sul e Atlântico Central

É crucial que estatísticos e investigadores em Ciências do Ambiente mantenham uma colaboração estreita, para que continuem a ser desenvolvidos métodos estatísticos e computacionais adequados que permitam dar resposta continuada aos desafios presentes e futuros.

Está disponível a edição de 2012 do JCR (Journal Citation Reports).

O trabalho de cinco investigadoras portuguesas foi distinguido no início de junho em Boston, nos EUA. O congresso mundial contou com mais de 800 cientistas de 50 países.

[Tec Labs]i – Potenciar a Inovação

“Os alunos da FCUL tiveram uma experiência única que não vão esquecer ao longo da sua vida académica e profissional”, denota Rui Ferreira, administrador do Tec Labs – Centro de Inovação da FCUL.

Visita de Estudo à nova Universidade de Lisboa

“[Viveu-se um ambiente] muito propício ao debate onde o intercâmbio de ideias e de boas práticas foram muito gratificantes e uma mais-valia para os participantes e oradores do evento”, declarou Luísa Cerdeira, pró-reitora da Universidade de Lisboa e presidente do FORGES.

Álvaro de Campos

TABACARIA

O Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa (DI-FCUL) vai organizar a 3 de julho deste ano a primeira edição do 

“Eu sempre gostei de fazer desenho geométrico e sempre me interessei pelos azulejos e seus painéis e pela calçada portuguesa pela sua beleza, pela arte, e porque têm potencialidades científicas, estéticas e didáticas praticamente ilimitadas”, conta o investigador do Grupo de Física-Matemática, distinguido recentemente com o Prémio Abordagem Inovadora “SOS Azulejo 2012”.

As bibliotecas do C4 e C8 têm horários alargados durante a época de exames de 1 a 29 de Junho.

Mestrados DBA 2013-2014

Investigadores do projeto “Climate Change Iniciative – Ocean Colour”

A equipa do projeto “Climate Change Iniciative – Ocean Colour” esteve reunida na FCUL, nos dias 21 e 22 de maio. Os investigadores avaliaram as ações em curso e discutiram alguns assuntos com a comunidade de end-users.

Jorge Manuel Ribeiro Rezende galardoado com o prémio “Abordagem Inovadora”

Intervenção na cerimónia de entrega dos Prémios 'SOS Azulejo' 2012:

Sessões dias 24 e 25 de junho 2013

"Gás de Xisto"?! Sim? Não? Porquê? Como? Onde?

Cerimónia de escritura do Instituto do Petróleo e do Gás

A transferência de conhecimento e tecnologia para a sociedade faz-se mediante o reforço das relações entre as comunidades científica e empresarial. Para J. M. Pinto Paixão, diretor da FCUL, esta é a oportunidade ideal para constituir parcerias suportadas no conhecimento e no exercício de uma cidadania plena.

Acções de Formação em Geologia na FCUL / 2013

Departamento de Geologia da FCUL

Informações sobre o procedimentos de escolha de ramo na Licenciatura em Geologia, 2013-14, do Departamento de Geologia da FCUL.

Alunos de Estatística Aplicada da FCUL

Atualmente, o uso e a aplicação da estatística têm a sua razão de ser não apenas na legitimação da indução, mas também na possibilidade de incorporar a incerteza nas suas conclusões: outro testemunho da sua proximidade ao real.

 

O Departamento de Informática (DI), da Faculdade de Ciências da Universidade de Lisboa (FCUL), convida as empresas e instituições para o estabelecimento de Parcerias e a submeter propostas de trabalhos na área de Engenharia Informática e da Seguranç

Páginas