No Campus com Helder Coelho

Atualidade dos Analisadores Semânticos

Helder Coelho

Nos últimos anos, a possibilidade de falar com uma máquina (relógio, telemóvel, computador portátil, automóvel), um dos sonhos da Inteligência Artificial, tornou-se trivial, pois a tecnologia da linguagem (tradução, reconhecimento, análise, síntese) evoluiu bastante desde a aposta da Apple no Siri em 2011 (veja-se o "Technology Quarterly" do "Economist" de 5 de janeiro de 2017, e a melhoria da precisão no reconhecimento das palavras ou na tradução, cada vez mais perto dos 100%). No entanto, esta vitória da ciência (na idade da avalanche dos dados ou Big Data) não foi fácil e, o que estava em causa, o poder de análise semântica (semantic parser) cresceu (scaled up) graças à fusão dos aspetos lógicos e estatísticos. Mais, o analisador é agora capaz de aprender (Liang, 2016), e foram os avanços da Aprendizagem Mecânica e dos Modelos Estatísticos (Hidden Markov Model, a via da força bruta) os principais responsáveis pelo entusiasmo da indústria e dos mercados. A Microsoft, a Facebook, a Google foram também para a luta e parecem estar empenhadas em melhorar os seus resultados.

Duas linhas de investigação confrontaram-se nos últimos 40 anos, o lado da linguística formal, defendido por Noam Chomsky, e o lado da teoria da informação, que se apoiou em Claude Shannon. E, não se deve esquecer Zellig Harris, o qual defendeu uma aliança forte entre os princípios gramaticais e os informacionais, e o mesmo aconteceu com a via da teoria das linguagens formais.

As técnicas matemáticas ganharam espaço e estão hoje na frente pelos avanços e a lidar com as avalanches de dados. Na presente década, graças aos esforços de um grupo pequeno de empresas, a via da teoria da informação ganhou adeptos, sobretudo devido aos sucessos no reconhecimento da voz (discurso), na busca de informação, e na tradução das línguas. Ferramentas online como o BabelFish (apoiada em regras) e o Google Translate, passaram a ser usadas e prezadas. Empresas mais pequenas, como a Nuance (e o programa Dragon Dictate), mostraram que as tecnologias das redes neuronais são úteis (a DeepMind da Google inaugurou, em 2014, um novo modo de sintetizar os discursos orais, recorrendo a redes neuronais profundas).

O mercado do processamento da língua natural (PLN), segmentado em codificação automatizada, análise de textos, reconhecimento de carateres óticos, resposta interativa em voz, reconhecimento de padrões e imagens, e analítica da voz, tenderá a aumentar muito nos próximos dez anos.

A compreensão de uma língua natural (Português) passou a poder ser decomposta em duas etapas, a tradução das frases lógicas (representação do seu significado) e a produção de ações. E, os analisadores semânticos são capazes de aprender as formas lógicas que estão associadas aos pares frases/ações. A compreensão é organizada com vários módulos, como o executor, a gramática, o modelo, o analisador e o aprendiz. E, o sistema por detrás da compreensão é ensinado e, após o treino, aumenta a sua precisão de trabalho. Mas, devemos ter um certo cuidado pois as línguas estão cheias de ambiguidades e exceções.

Compreensão profunda + raciocínio lógico
(sintaxe, semântica e pragmática)

A composição do significado de uma frase (expressão) é o resultado do arranjo/combinação das subexpressões (partes significantes da frase).

No início (anos 60), e nas duas décadas seguintes, era muito difícil ir além de domínios limitados (fechados) e de enfrentar as complexidades de uma língua em geral, apenas com regras feitas à mão. A evolução da aprendizagem mecânica, foi influenciada pelas técnicas estatísticas, já adotadas pelo reconhecimento de padrões (discurso com voz), e também graças ao modo repetitivo de explorar exemplos de comportamento (entrada/saída) e de os obrigar ao encaixe num modelo (estatístico). A revolução passou ainda pelo enfraquecimento da supervisão (na passagem das formas lógicas anotadas às respostas) e pela ampliação (scaling up) dos analisadores semânticos a domínios mais abertos e complicados. Se os primeiros sistemas exigiam as formas anotadas, os novos começaram a ser treinados com as respostas (via aprendizagem). E, finalmente, a aplicação dos analisadores a diferentes domínios e além do que é mais comum, a pergunta/resposta, tais como a navegação de robôs, a identificação de objetos em cenas, ou a conversão da língua natural em expressões regulares.

O escalamento (scaling up) é, hoje em dia, um dos problemas interessantes da Informática. Consiste em passar de um protótipo (em geral com uma escala pequena) para um sistema mais realista, e na maioria dos casos não exige apenas grandes computadores (alta velocidade e poder de processamento, enormes memórias).

Por exemplo, em simulação social baseada em agentes inteligentes, requer paciência para afinar os principais parâmetros, tornar os agentes cognitivos parecidos com os seres humanos, e multitudes de agentes diferentes em cenários com paisagens bem sofisticadas (o filme Avatar de James Cameron é um bom exemplo de um empreendimento que levou dez anos a realizar, recorrendo a novas tecnologias e ferramentas). No caso de conflitos sociais (como as manifestações de protesto em rua) passar de 1.000 agentes para 2.000 é trivial, mas o salto para 10.000 impõe muito trabalho, tempo e paciência para as afinações.

No futuro, os desafios são ainda grandes, como por exemplo a representação semântica da linguagem ou que supervisão se deverá adotar para aprender a semântica. Recentemente, houve bastante interesse em recorrer às redes neuronais, e suas extensões, para atacar as tarefas mais populares do processamento da língua natural, a tradução mecânica e a pergunta/resposta (veja-se o sucesso do sistema Watson da IBM e da interface Siri da Apple, desde 2011). A paridade entre a tecnologia e o desempenho humano está ainda longe, medida em 2/3 anos, embora os produtos comecem a surgir, como os automóveis com controles ativados por voz. Para alguns, criar discurso ou compreendê-lo são duas operações opostas.

No Departamento de Informática (DI) da Faculdade de Ciências da Universidade de Lisboa (Ciências ULisboa), o grupo do professor António Branco, por detrás da unidade de investigação e desenvolvimento NLX (criada no início de 2000), disponibilizou um serviço o LX-Service para se observarem algumas das ferramentas desenvolvidas em cerca de 20 anos de estudo (LX-Suite, LX-Conjugator, LXGram, POS Tagger, LX-Tokenizer, Lematizador verbal). Recentemente foi aprovado o projeto CNPTDeepMT (Tradução Automática Profunda entre Chinês e Português, no domínio do eCommerce), com a duração de três anos, o apoio da FCT e do Ministério da Ciência e Tecnologia da China e a ser realizado na unidade NLX no DI Ciências ULisboa.

Referência
Liang, P. Learning Executable Semantic Parsers for Natural Language Understanding, Communications of the ACM, Setembro, Vol. 59, Nº 9, 2016.

Helder Coelho, professor do Departamento de Informática de Ciências
info.ciencias@ciencias.ulisboa.pt
Ana Cachudo

Ana Chachudo, de 34 anos, natural de Lisboa, é licenciada em Química, pela Faculdade.

Foto do átrio do edifício C3

A Faculdade de Ciências comemorou no dia 29 de abril o seu 114.º aniversário com a celebração do Dia de Ciências. A cerimónia decorreu ao longo da tarde e foi marcada pelo reconhecimento da excelência, reflexão sobre os desafios futuros e pela valorização da comunidade de Ciências.

Cassilda Paz junto ao quadro

Cassilda Paz, de 59 anos, natural de Almancil, em Faro, licenciada em Matemática, nesta faculdade, é professora de Matemática na

Fotografias das Professoras Teresa Chambel, Ana Respício, Ana Paula Afonso e Cátia Pesquita

Quatro professoras do Departamento de Informática de CIÊNCIAS assinaram um artigo de opinião para assinalar o Girls in ICT Day.

Sessão da DGES no Dia Aberto de Ciências vai esclarecer tudo sobre o acesso ao ensino superior

No próximo dia 7 de maio, a Faculdade de Ciências abre portas a milhares de estudantes do ensino secundário no Dia Aberto 2025.

José Carvalho Soares

José Carvalho SoaresÉ com profundo pesar que a Faculdade de Ciências comunica o falecimento de José Carvalho Soares, professor aposentado do Departamento de Física, o

O investigador do MARE – Centro de Ciências do Mar e do Ambiente e da Faculdade de Ciências da Universidade de Lisboa (FCUL), José Ricardo Paula, foi distinguido com u

Tânia Graça veio à Faculdade de Ciências!

A saúde começa no bem-estar — e o bem-estar também passa pela saúde sexual. Foi neste espírito que o projeto Ciências em Harmonia recebeu, na passada terça-feira, 15 de abril de 2025, a sexóloga e comunicadora Tânia Graça, num evento que encheu o Grande Auditório da Faculdade de Ciências.

Desejamos a todos os membros da comunidade da Faculdade de Ciências uma Boa Páscoa junto dos seus familiares e amigos.

Avaliação de Unidades de I&D 2023/2024

Já estão disponíveis os resultados do processo de avaliação das Unidades de I&D 2023/2024 da Fundação para a Ciência e Tecnologia (FCT), realizado por painéis de especialistas internacionais independentes. As avaliações, divulgadas no passado dia 15 de abril, revelam que, de um total de 13 Centros de I&D de CIÊNCIAS, 12 foram classificados como Excelente ou Muito Bom.

O primeiro prémio da 6.ª edição do Concurso de Ideias para a Sustentabilidade foi atribuído ao projeto ‘Keyhole Garden - A chave para a fertilidade’. A proposta, redigida pelos guardiões da HortaFCUL em colaboração com Cristina Cruz, professora de CIÊNCIAS e investigadora no CE3C - Centro de Ecologia, Evolução e Alterações Ambientais, sugere a criação de hortas-compostores à porta dos bares e cafetarias do campus, como uma forma de aproveitar os resíduos orgânicos trazidos pelos membros da nossa comunidade académica.

Mergulho científico em campanha de monitorização da biodiversidade subaquática ao largo da costa da Ilha da Madeira

O Laboratório Associado ARNET – Aquatic Research NETwork | Rede de Investigação Aquática é uma rede multi-institucional, de dimensão nacional, estabelecida em 11 instituições nacionais e composta por 742 investigadores.

CIÊNCIAS integra o consórcio que, no âmbito de um memorando de entendimento, assinado no passado dia 9 de abril, no Palácio dos Marqueses de Pombal, em Oeiras, dará origem ao futuro Instituto para o Desenvolvimento Sustentável, uma iniciativa inovadora que reúne a Câmara Municipal de Oeiras, várias Escolas e a própria Reitoria da Universidade de Lisboa (FCUL, ISEG, IST, ISA), e a empresa intermunicipal TRATOLIXO.

Foto de Maria Helena Garcia no laboratório.

Maria Helena Garcia dedicou a sua carreira ao estudo de compostos metálicos, como o ruténio para memórias óticas de computadores. A partir de 2004, entrou na área dos metalofármacos destinados a tratar o cancro.

Pessoas na jobshop Ciências 2025

O maior evento de empregabilidade da Faculdade reuniu mais de 1500 estudantes, recém-graduados dos vários cursos de CIÊNCIAS, que puderam participar em workshops, debates, sessões com alumni, entrevistas, networking sunset e contactar diretamente com as empresas e recrutadores. Nesta edição estiveram presentes cerca de 80 empresas e entidades convidadas. Cerca de 695 estudantes submeteram currículos e participaram em entrevistas de recrutamento. Leia a reportagem e conheça a opinião de quem participou no evento.

Universidade de Groningen visita CIÊNCIAS

Boas Práticas - A shared learning experience at CIÊNCIAS ULisboa.

No arranque desta Primavera, CIÊNCIAS acolheu a visita exploratória por parte de um grupo de 12 estudantes universitários, pertencentes aos órgãos de Direção das Faculdades e da Universidade de Groningen, nos Países Baixos.

Tomada de posse do conselho científico

Decorreu na passada segunda-feira, 7 de abril, na reitoria da Universidade de Lisboa, a tomada de posse dos novos membros do Conselho Científico (CC).

Novo DataLab powered by Fidelidade reforça inovação e conhecimento nas áreas de Matemática Aplicada, Estatística e Analítica Avançada.

Olimpíadas Regionais de Física

No passado sábado, 29 de março, CIÊNCIAS acolheu as Olimpíadas Regionais de Física, um evento organizado pela Sociedade Portuguesa de Física que reuniu mais de 200 alunos do ensino básico e secundário de diversas escolas, acompanhados por mais de 80 professores. Durante a manhã, os participantes enfrentaram desafios teóricos e experimentais, pondo à prova os seus conhecimentos e criatividade na resolução de problemas científicos. O principal objetivo da competição foi estimular o interesse dos jovens pela Física e promover o pensamento crítico. Enquanto os alunos realizavam as provas, os professores acompanhantes tiveram a oportunidade de assistir a palestras ministradas pelos docentes do Departamento de Física Francisco Lobo e Nuno Matela, que abordaram temas como Ondas Gravitacionais e Imagem Médica.

Futurália

CIÊNCIAS marcou novamente presença na Futurália, a maior feira nacional dedicada à educação, formação e empregabilidade que vai já na 16ª edição. Foram milhares os visitantes, especialmente estudantes, que estiveram entre 26 e 29 de março na FIL – Feira Internacional de Lisboa.

CHILL - CHIcken Tractors as an efficient and sustainable Link in closed Loop agriculture

A história da capoeira móvel no PermaLab, integrada na HortaFCUL, é um exemplo vivo de como os princípios da permacultura podem transformar desafios em oportunidades. Desde a sua implementação em 2018, este galinheiro móvel, ou chicken tractor em inglês, foi concebido para unir sustentabilidade, inovação e comunidade, desempenhando um papel fulcral no ecossistema agrícola do projeto.

Professor António Casimiro coordenador científico do curso e Professor Associado do Departamento de Informática de CIÊNCIAS

A sessão de abertura do Cybersecurity Executive Program aconteceu em CIÊNCIAS, no passado dia 27 de março, marcando o arranque da 4ª edição desta formação. O Cybersecurity Executive Program é uma iniciativa conjunta de CIÊNCIAS e da consultora Premivalor Consulting, que se destina a formar e sensibilizar decisores e executivos C-level, de organizações públicas, privadas, civis e do setor militar, para as questões da cibersegurança.

Carlos Corela na entrega do prémio.

A Associação Portuguesa de Meteorologia e Geofísica (APMG) atribuiu ao investigador Carlos Corela o Prémio de Carreira Técnica para a Geofísica. A entrega desta distinção decorreu durante o jantar de confraternização do 13.º Simpósio de Meteorologia e Geofísica, durante o qual o investigador foi homenageado.

Equipa do projeto MIMESIS

A Fundação Ana Mendonça (FAM) anunciou a doação de €25.000,00 ao projeto MIMESIS –Bioadesivos inspirados na natureza para aplicações biomédicas e biotecnológicas, coordenado por Romana Santos, professora da CIÊNCIAS e investigadora no Centro de Ciências do Mar e Ambiente (MARE ULisboa), nomeadamente no grupo de investigação em bioadesão e biomimética.

Sala com alunos e jornalistas do Portugal em Direto

Cerca de 250 pessoas participaram nas várias atividades realizadas no Dia Internacional da Matemática em CIÊNCIAS 2025, o Dia do Pi, comemorado a 14, 15 e 19 de março. Leia alguns testemunhos de quem participou e organizou as atividades.

Páginas