Talks @ DI

Generating and Ranking Candidate Data Models from Background Knowledge

Transmissão através de Videoconferência

Por Daniela Oliveira.

Abstract: Knowledge Graphs have emerged as a core technology to aggregate and publish knowledge on the Web. However, integrating knowledge from different sources, not specifically designed to be interoperable, is not a trivial task. Finding the right ontologies to model a dataset is a challenge since several valid data models exist and there is no clear agreement between them. In this presentation, I will describe a framework to facilitate the selection of a data model by generating and ranking candidates that match entity types and for the properties associated with these types. These candidates are obtained by aggregating freely available RDF datasets in a Knowledge Graph and then enriching it using ontology matching techniques. The entity type candidates are obtained by exploiting the content and graph structure of this Knowledge Graph to compute a score that considers both the accuracy and interoperability of the candidates. Matching properties are predicted with a Random Forest model, trained on the Knowledge Graph properties, that makes predictions to generate candidates, and ranks them according to different measures. We present experiments using two use-cases, libraries and biomedical, and show that our methodology can produce meaningful candidate data models that can be adapted depending on the use case.

Bio: Daniela Oliveira is currently an Invited Assistant Professor in the Department of Informatics of the Faculty of Sciences in the University of Lisbon. Her background includes a BSc in health sciences and a MSc in bioinformatics. Daniela's current research focuses on general data integration to enable the publication of meaningful knowledge on the Web, with a special interest in the automation of health data to generate new knowledge in the domain.

Zoom: https://videoconf-colibri.zoom.us/j/85733155604

14h30
Departamento de Informática
Computador portátil a projetar imagem de sequência biológica

O curso visa a aquisição de conhecimentos sobre as ferramentas bioinformáticas disponíveis para efetuar análises de sequências de DNA e proteínas, bem como a autonomia e espírito crítico na utilização dessas ferramentas. Procura igualmente desenvolver competências na utilização de software de bioinformática disponível gratuitamente na Internet e na interpretação do significado biológico dos resultados - candidaturas até 12 dezembro.

Bola de cristal colocada no solo

O curso tem como objetivo apresentar aos participantes um estado da arte atualizado sobre a diversidade da biota do solo e os papéis funcionais desempenhados pelos organismos do solo nos principais processos ecológicos - candidaturas até 19 de dezembro.

Imagem exemplificativa da área da deteção remota

Este curso avançado tem como objetivo fornecer acesso e ferramentas para a aquisição e processamento de dados de deteção remota para diferentes aplicações, usando imagens multiespectrais de satélite, drone, terrestres e LiDAR, com foco na caracterização da vegetação e da paisagem, bem como das suas mudanças ao longo do tempo - candidaturas até 19 de dezembro.

Imagem abstrata

Neste curso, será promovida uma abordagem multidisciplinar, apresentando as descobertas mais recentes sobre o tema e desafiando a forma tradicional de considerar as associações simbióticas como exceções e não como a regra - candidaturas até 09 de janeiro.

A conferência visa reunir os principais especialistas no domínio da Imagiologia Médica por Micro-ondas (MMWI) e incluirá palestras, apresentações e pósteres de resumos revistos por pares e artigos de conferências, bem como workshops em áreas satélite de investigação com interesse para a investigação em MMWI.

Páginas