IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Imagem de uma criança

– Mas do que é que tu gostas, Ana Isabel!? Tirando o bife, o frango e as batatas fritas, de que é que tu gostas, rapariga? Não comes feijão porque enfarta e com o grão é a mesma desculpa.

O primeiro grupo do exame de Química deste ano incluiu um excerto do livro “Química 12.º ano”, editado em 2001 e da autoria de Alda Pereira e de Maria Filomena Camões.

3 de junho de 1949 - 15 de agosto de 2013

É com uma profunda tristeza e eterna gratidão que comunicamos a morte da bióloga Alexandra Escudeiro, associada da Liga dos Amigos do Jardim Botânico.

Rui Malhó

As palestras e as comunicações em forma de póster foram de elevadíssima qualidade (77), facto que foi atestado pelos 230 participantes que louvaram ainda a organização do evento.

A Plataforma Moodle encontra-se em manutenção nos dias 7 e 8 de agosto.

Pedimos desculpa pelo incómodo.

Agradecemos a sua compreensão.

 

Unidade de Informática

 

De entre as matérias que ensino, esta tem sido inspiradora, transformando discretos alunos em cientistas empenhados: “Professora, consegui a bolsa para as microalgas tóxicas, vou seguir o meu sonho…”. Este artigo foi publicado no jornal "Público" no passado dia 2 de agosto.

Estão abertos concursos da FCT para

 

Concurso para atribuição de Bolsas Individuais de Doutoramento, Doutoramento em Empresas e Pós-Doutoramento

A 3ª fase de candidaturas online decorre de 1 de Agosto até 28 de Agosto.

As Nações Unidas procuram candidatos qualificados que desejem ter uma carreira profissional como funcionários internacionais.

Programa jovens profissionais 2013

Paulo Semblano,antigFCUL

A literacia estatística é fundamental para o exercício de cargos públicos ou de gestão e é indispensável nas nossas vidas, na vida das nossas empresas e para o exercício da cidadania.

FCUL Raly Pro

Everybody in this country should learn how to program a computer… Because it teaches you how to think”, citação de Steve Jobs, fundador da Apple, mencionada na sessão de abertura do evento FCUL Rally Pro.

A empresa Grupo Actuarial encontra-se a oferecer estágios remunerados a estatísticos, matemáticos e engenheiros informáticos .

A qualidade da formação será tão mais diferenciada quanto mais os seus graduados forem capazes de integrar habilmente as diversas competências que assimilaram no seu percurso académico.

Fernando Pessoa em destaque nas Redes Sociais

“[Pretendemos] identificar quais os versos e frases de Fernando Pessoa que mais inspiram os seus leitores de todo o mundo e, ao mesmo tempo, conduzir todos aqueles que usam as palavras de Pessoa aos seus textos originais”, explica Francisco Couto, professor do DI-FCUL e coordenador do projeto.

foto de Microsonda

A Faculdade de Ciências da Universidade de Lisboa (FCUL) conta com 3 infraestruturas de investigação registadas na base de dados do projecto MERIL - Mapping of the European Research Infrastructures Landscape.

Dupla Titulação em Geologia - Ano lectivo 2013-2014

Convénio de Cooperação Académica entre o Instituto de Geociências da USP e o GeoFCUL

FCUL promove sessão de informação sobre oportunidades de financiamento no âmbito dos Desafios Societais 2 e 5.

“O principal objetivo é precisamente mostrar o que o EMBL tem para oferecer aos investigadores portugueses (e aos da FCUL, muito em particular) e também demonstrar o que pode ser feito em cooperação com o [laboratório].”, declara Margarida Amaral, docente da FCUL e membro do conselho de organização do evento.

Estão abertas as candidaturas à edição de 2013 do Prémio Academia Lx, destinado a trabalhos de investigação e estudos sobre temas com relevância prática para a cidade de Lisboa.  

Aceitam-se candidaturas de docentes para inclusão numa  Bolsa de Recrutamento, para a Área de Finanças e Economia - Secção Autónoma de Estatística, d

FCUL promove cooperação com EMBL

A passagem do diretor-geral do EMBL pela FCUL, foi registada através de uma reportagem multimédia. Fique a saber mais sobre esta visita bem como os pormenores do evento “Molecular Biology in Portugal and EMBL”!

De 8 de Julho a 30 de Agosto as bibliotecas do C4 e C8 têm alteração nos horários de funcionamento

Doctorate in Applied and Engineering Physics

Programa Doutoral em Física Aplicada e Engenharia Física

Arthur Vieira, estudante do mestrado integrado em Engenharia Física e Emiliano Pinto, aluno de mestrado em Física Nuclear e Partículas, são os diretores da revista trimestral do Departamento de Física da FCUL e  que integra uma equipa editorial constituída por outros 16 discentes.

Páginas