IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

“No stand da FCUL descobrimos áreas que não sabíamos sequer que existiam e que agora vamos querer pesquisar, já valeu a pena ter vindo. Vamos ter mais informação e hipóteses para ponderar!”, declarou um grupo de alunos da Escola Salesiana de Manique a visitar a banca da FCUL na Futurália.

Rosto de Fernando Ramos

“A maioria das instituições de ensino superior em Portugal têm qualidade superior às do Brasil, contrariando de forma que não deixa dúvidas a 'recomendação' do Governo brasileiro”, escreve Fernando Ramos num artigo publicado no jornal "Público" no passado dia 26 de março.

O artigo intitulado "PAMPA in the wild: a real-life evaluation of a lightweight ad-hoc broadcasting family" da autoria de Christopher Winstanley, Ra

O Departamento de Informática marcou presença na última edição da Futurália. A Futurália, a Feira de Ofertas Educativas e Formativas para estudantes, realizou-se de 13 a 16 de Março, na Feira Internacional de Lisboa (FIL)

“Luís Mendes Victor dedicou uma carreira de mais de 40 anos à investigação nas diversas áreas da Geofísica. Professor Catedrático da Faculdade de Ciências da Universidade de Lisboa desde 1991, ensinou Geofísica, Sismologia, Prospeção Geofísica, Hidrologia e Física dos Recursos Naturais”, refere o colega e amigo, Jorge Miguel Miranda.
 

Atualmente, a nova rubrica disponibiliza entrevistas realizadas a participantes e colaboradores da última edição do Dia Aberto e a dois investigadores que trabalham na área da surdez genética.

Rosto de Teresa Alpuim

Pode-se dizer, sem risco de exagero, que a Estatística é a mais social das ciências exatas.

Programa M23

Atualmente 47 alunos estudam na FCUL através do programa Maiores de 23 anos. A FCUL conversou com uma dessas alunas, Ana Jardim, de 35 anos, aluna do 2.º ano de Engenharia Informática.

FCUL esclareceu possíveis candidatos ao programa M23 no Open Day pelo Núcleo de Formação ao Longo da Vida

“Tenho interesse em prosseguir os estudos académicos por vários motivos, entre eles o pessoal, sei que posso dar muito mais não só para mim como também para a sociedade e também porque poderei melhorar a minha condição de trabalho”, afirma Elísio Gomes, de 31 anos e visitante do Dia Aberto a Maiores de 23 da UL.

Antenas do ALMA

O primeiro de uma série de vodcasts de divulgação científica do CAAUL dedicados aos maiores tópicos da atualidade em Astronomia apresenta o ALMA.

Rosto de Luísa Maria Abrantes

“A professora Luísa Maria Abrantes será sempre recordada pela sua enorme dedicação e empenho durante os 40 anos de serviço a esta casa”, refere o seu colega e amigo Jorge P. Correia.

A FCUL volta a marcar presença na Futurália, na FIL, no Parque das Nações, juntamente com outras unidades orgânicas da UL, entre 13 e 16 de março.

“Foi o professor Henrique Leitão que me alertou para o facto de a questão do real impacto de Pedro Nunes na náutica do seu tempo estar por resolver.

“Foi o professor Henrique Leitão que me alertou para o facto de a questão do real impacto de Pedro Nunes na náutica do seu tempo estar por resolver. A tese e o prémio foram passos saborosos de um caminho longo mas que tem todo o potencial de ser gratificante e divertido”, reforça Bruno Almeida, vencedor do Prémio Cultura 2012 atribuído pela Sociedade de Geografia de Lisboa.

A reportagem multimédia sobre o Dia Aberto em Ciências inclui testemunhos de candidatos ao ensino superior, alunos e professores da FCUL, colaboradores desta iniciativa.

Prémio SAHFC 2012 - Marta Macedo

Prémio SAHFC

  A Comissão Executiva da Secção Autónoma de História e Filosofia das Ciências (SAHFC) atribui a anualmente o Prémio SAHFC.

O Grupo de Surdez do BioFIG-FCUL, coordenado por Graça Fialho, já analisou cerca de 400 famílias portuguesas afetadas com surdez hereditária. A primeira tese de doutoramento realizada em Portugal na área da genética da surdez foi defendida em 2012, na UL, por Tiago Matos.

Anfiteatro da FCUL

Cerca de 100 alunos de 15 escolas secundárias da zona de Lisboa participaram na 9.ª edição da ação de divulgação da Física de Partículas.

“Portugal é o principal destino dos estudantes brasileiros de graduação bolsistas do Programa Ciência sem Fronteiras.

“Acho que este tipo de ações é bastante útil porque, nesta altura, precisamos de todas as informações possíveis para podermos fazer uma escolha certa”, declara Maria Buzaglo, aluna do 12.º ano, a frequentar o curso de Ciências e Tecnologias na Escola Secundária de Pedro Nunes.

Alunos no átrio do C3

O Gabinete de Mobilidade, Estágios e Inserção Profissional organizou uma sessão de acolhimento aos cerca de 30 novos alunos de mobilidade para o 2.º semestre.

Em 2000, a UL atribuiu o título de doutor honoris causa a Laurens de Haan. Em 2013, outro gigante dos Extremos, Ross Leadbetter, honrará a UL ao aceitar a mesma distinção. Quando a universidade honra investigadores desta importância está também a honrar-se.

O Departamento de Matemática da FCUL e o CMAF organizam dois mini-cursos de Sistemas Dinâmicos de 17 a 24 de Abril 2013. Os oradores serão Rafael Ortega da Universidade de Granada e Pedro Miguel Duarte do DM da FCUL.

Gulf Labor Markets and Migration Program (GLMMP), a joint program of the European University Institute (EUI - Florence) and the Gulf Research Center (GRC - Jeddah, Geneva, Cambridge), seeks two Research Assistants (Demographer/Statistician and Lawyer).

Páginas