IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

O Dia de Ciências 2016 foi celebrado no dia do aniversário da Faculdade – 19 de abril – e juntou, como em anos anteriores, alunos, professores, investigadores, outros funcionários desta faculdade, seus familiares e amigos.

António Branco, professor do Departamento de Informática de Ciências, participa na cerimónia “CPLP 20 anos - A Diversidade Cultural que Nos Une”, cujo objetivo é comemorar o Dia da Língua Portuguesa e da Cultura da CPLP, celebrado a 5 de maio de 2016, no Palácio Conde de Penafiel, em Lisboa.

Diz-se que nem sempre pensamos por linhas direitas, quase sempre seguimos por curvas, em ziguezagues, corrigindo o que estava confuso, unindo e simplificando, recorrendo a imagens e metáforas, para ajudar os outros a capturarem a essência das coisas.

A próxima sessão da Cicloficina realiza-se a 2 de maio de 2016, pelas 17h00, no parque de bicicletas do C5.

A iniciativa do Departamento de Informática de Ciências - organizada no âmbito do Girls in ICT Day - visa promover uma reflexão sobre as potencialidades das Tecnologias da Informação e Comunicação junto de jovens raparigas, pais e professores. 

logotipo da iniciativa

A inscrição no Dia Aberto é gratuita, obrigatória e não tem data limite. Os visitantes a 27 de abril de 2016 podem conhecer a faculdade sozinhos ou acompanhados, em 30 minutos ou o dia inteiro.

O plano de atividades deve ser um ato participado, de modo a congregar os esforços que as partes estão dispostas a investir no todo. As unidades de serviços souberam dar este passo importante, estabelecendo objetivos anuais e metas de concretização para as atividades previstas.

Daniel Kahneman, um psicólogo que obteve o prémio Nobel da Economia em 2002, escreveu o livro “Thinking Fast and Slow” (2011) para nos ensinar que a inteligência precisa da intuição, e isso explica aqueles modos de pensar, com duas velocidades.

Paul Schmit, embaixador do Grão-Ducado do Luxemburgo em Portugal visita a Faculdade de Ciências da Universidade de Lisboa no âmbito da receção de boas-vindas aos alunos do “2nd Intensive Study Programme (ISP)”, um curso avançado em Segurança Informática, destinado a alunos de mestrado

O que fazem e o que pensam alguns membros da comunidade de Ciências? O quarto Dictum et factum é com Ricardo Ferreira, bolseiro da Segurança do Trabalho.

Os estudantes da Escola Técnica e Liceal Salesiana de Santo António e do Colégio dos Plátanos venceram as semifinais das Olimpíadas de Química Júnior 2016 ocorridas em Ciências este sábado, dia 9 de abril.

A mostra itinerante “A ULisboa é para todos”- inaugurada esta segunda-feira - está em exibição até 15 de abril, no átrio do edifício C3, no campus de Ciências.

Quando Ana Henriques Pato terminou em 2002 o ensino secundário, na Escola Secundária Fernão Mendes Pinto, em Almada, com a média de 18 valores, escolheu Ciências. A sua ligação à Faculdade não ficou por aí.

O Departamento de Química e Bioquímica de Ciências volta uma vez mais a aderir a este concurso com 13 anos e que este ano conta com cerca de 266 escolas inscritas, segundo dados disponibilizados pela Sociedade Portuguesa de Química.

Os estudantes de Ciências elegem no dia 28 de abril os três alunos representantes do Conselho de Escola para os próximos dois anos.

O Instituto Dom Luiz organiza a conferência “COP 21 - Desafios para Portugal depois da Conferência de Paris”, no próximo dia 22 de abril de 2016, no edifício C8, no anfiteatro 8.2.30, sito na Faculdade de Ciências da Universidade de Lisboa.

Nove em cada dez dos inquiridos têm conhecimento do projeto HortaFCUL.

Arquitetos, filósofos, advogados, Maria João Collares Pereira refere que os formandos eram sobretudo das humanidades, por isso “para ensinar coisas complicadas a pessoas com esta formação é preciso saber divulgar ciência”.

O quadrado design-ideias-tecnologia-negócios tem vindo a marcar os últimos anos das start-ups, as suas perspetivas e novas possibilidades, com uma inovação extraordinária que atrai os consumidores e faz crescer o valor de uma empresa.

“Todos chegaram ao final com um projeto, um protótipo como se pretendia e com algumas ideias bem interessantes!”, comenta Bernardo Tavares, um dos organizadores do primeiro Lisbon Green Hacakthon.

O que fazem e o que pensam alguns membros da comunidade de Ciências ULisboa?

Ciências participa no dia 19 de março de 2016 nas Masterclasses Internacionais em Física de Partículas.

Oficina das Energias - um grupo de alunos do mestrado integrado de Engenharia da Energia e do Ambiente Ciências - organiza pela primeira vez em Portugal o Lisbon Green Hackathon.

Jorge Relvas, professor do Departamento de Geologia de Ciências, é o novo presidente da Society for Geology Applied to Mineral Deposits. 

A HortaFCUL, como projeto que tenta procurar e experimentar soluções para os atuais problemas socioeconómicos, tem vindo a incorporar nas suas práticas a Economia da Dádiva.

Páginas