Passar para o conteúdo principal

Seminário

An introduction to deep reinforcement-learning

Out032019

Localização LIP, Lisboa

Por Giles Strong (LIP).

Reinforcement learning (RL) is a process of learning to act optimally in an environment in order to accomplish a given task without (or with limited) prior knowledge of both the environment and the task. Whilst this problem has been studied since before 1990, it has only been due to recent advances in neural networks, computing power, and learning algorithms that have allowed the field to start to tackle real-world problems: e.g AlphaGo beating the top players of Go in 2016 and 2017, and OpenAI Five beating the world champions of a popular esports game in 2019.

In this seminar I will introduce RL focussing on model-free learning; algorithms which do not require, or attempt to learn, an explicit model of the environment. The theory of model-free RL will be presented followed by several example algorithms of increasing complexity and an example comparison of their performance. The seminar will conclude with some closing remarks of my personal impressions of the field.

Potential attendees should be aware that this seminar will take place in the context of my evaluation for the IST course "Advanced Experimental Methods in Particle Physics II", in which I was required to study a new subject of interest. Therefore I claim no expertise in the subject of RL, beyond having spent some time studying it, and as such the seminar will represent my current and best understanding of the subject, which is hopefully more correct than incorrect.

Horário 11h30-12h30

Organização LIP - Laboratório de Instrumentação e Física Experimental de Partículas

Anexos

Website

https://indico.lip.pt/event/627/

Tags

Natal 2025

Dez 12 2025

Conferência de Natal de CIÊNCIAS

Uma oportunidade única de estudantes e professores do ensino secundário dialogarem diretamente com especialistas de várias áreas científicas.

Computador portátil a projetar imagem de sequência biológica

Jan 05 2026

Bioinformatics analysis of biological sequences

O curso visa a aquisição de conhecimentos sobre as ferramentas bioinformáticas disponíveis para efetuar análises de sequências de DNA e proteínas, bem como a autonomia e espírito crítico na utilização dessas ferramentas. Procura igualmente desenvolver competências na utilização de software de bioinformática disponível gratuitamente na Internet e na interpretação do significado biológico dos resultados - candidaturas até 12 dezembro.

Representação de pessoa a interagir com tecnologia

Jan 13 2026

Digital Twins no serviço público

O curso introduz o conceito de Digital Twins e a sua aplicação estratégica no contexto do serviço público, com foco na modernização digital, otimização de processos e apoio à decisão - candidaturas até 11 de janeiro.

Bola de cristal colocada no solo

Jan 19 2026

Soil ecology and ecosystem services

O curso tem como objetivo apresentar aos participantes um estado da arte atualizado sobre a diversidade da biota do solo e os papéis funcionais desempenhados pelos organismos do solo nos principais processos ecológicos - candidaturas até 19 de dezembro.

Imagem exemplificativa da área da deteção remota

Jan 26 2026

Remote sensing of the environment: a practical course

Este curso avançado tem como objetivo fornecer acesso e ferramentas para a aquisição e processamento de dados de deteção remota para diferentes aplicações, usando imagens multiespectrais de satélite, drone, terrestres e LiDAR, com foco na caracterização da vegetação e da paisagem, bem como das suas mudanças ao longo do tempo - candidaturas até 19 de dezembro.

Duas pessoas a interagirem num contexto de realidade virtual

Jan 28 2026

Realidade virtual e aumentada no onboarding e formação

O curso explora o potencial da Realidade Virtual (VR) e Aumentada (AR) como ferramentas inovadoras nos processos de onboarding e desenvolvimento de competências - candidaturas até 25 de janeiro.

Ginásio "inundado" de tecnologia

Jan 31 2026

Tecnologia Digital em Ciências da Reabilitação

Um programa único na Europa, com o objetivo de capacitar para a integração crítica, segura e eficaz de ferramentas digitais na intervenção clínica - candidaturas até 30 de janeiro.

Imagem abstrata

Fev 02 2026

Until Death Do Us Apart: Living in a Symbiotic World

Neste curso, será promovida uma abordagem multidisciplinar, apresentando as descobertas mais recentes sobre o tema e desafiando a forma tradicional de considerar as associações simbióticas como exceções e não como a regra - candidaturas até 09 de janeiro.

Fev 03 2026

ICMWIA - International Conference on Medical Microwave Imaging Applications

A conferência visa reunir os principais especialistas no domínio da Imagiologia Médica por Micro-ondas (MMWI) e incluirá palestras, apresentações e pósteres de resumos revistos por pares e artigos de conferências, bem como workshops em áreas satélite de investigação com interesse para a investigação em MMWI.

Pessoas a analisarem dados

Mar 18 2026

Data Collection and Analysis in Qualitative and Participatory Methods

Candidaturas até 13 de fevereiro.

Mar 23 2026

Concepts and Applications in Macroecology

Um curso prático, limitado a um pequeno número de participantes, destinado a quem procura formação básica em teoria e estatística macroecológica e deseja familiarizar-se com algumas das potenciais utilizações de vários métodos avançado - candidaturas até 13 de fevereiro.

Páginas