Seminário

An introduction to deep reinforcement-learning

LIP, Lisboa

Por Giles Strong (LIP).

Reinforcement learning (RL) is a process of learning to act optimally in an environment in order to accomplish a given task without (or with limited) prior knowledge of both the environment and the task. Whilst this problem has been studied since before 1990, it has only been due to recent advances in neural networks, computing power, and learning algorithms that have allowed the field to start to tackle real-world problems: e.g AlphaGo beating the top players of Go in 2016 and 2017, and OpenAI Five beating the world champions of a popular esports game in 2019.

In this seminar I will introduce RL focussing on model-free learning; algorithms which do not require, or attempt to learn, an explicit model of the environment. The theory of model-free RL will be presented followed by several example algorithms of increasing complexity and an example comparison of their performance. The seminar will conclude with some closing remarks of my personal impressions of the field.

Potential attendees should be aware that this seminar will take place in the context of my evaluation for the IST course "Advanced Experimental Methods in Particle Physics II", in which I was required to study a new subject of interest. Therefore I claim no expertise in the subject of RL, beyond having spent some time studying it, and as such the seminar will represent my current and best understanding of the subject, which is hopefully more correct than incorrect.

11h30-12h30
LIP - Laboratório de Instrumentação e Física Experimental de Partículas
“Coroa de Flores” cósmica

Seminário do Instituto de Astrofísica e Ciências do Espaço, por Federica Loiacono (INAF OAS Bologna, Italy).

Seminário de Análise e Equações Diferenciais, por João Pedro Ramos (Instituto Nacional de Matemática Pura e Aplicada).

Logótipo do LIP Summer Internship Program

Um programa destinado a estudantes de Física e Engenharia com interesse em investigação científica e tecnológica, com candidaturas até 15 de maio (nova data).

Título/data/local do evento

No Dia Nacional dos Cientistas, o conhecimento não risca fronteiras.

O Museu Nacional de História Natural e da Ciência da Universidade de Lisboa celebra a Noite Europeia dos Museus (17 de maio) e o Dia Internacional dos Museus (18 de maio). Nestes dias, os Museus abrem as portas e convidam os cidadãos a conhecer os seus acervos, coleções, exposições e atividades.

Seminário do Centro de Física Teórica e Computacional, por João Amaral (Department of Physics and CICECO, University of Aveiro, Portugal).

Bodião-limpador "em ação"

Seminário Doutoral II (Doutoramento em Biologia), por Beatriz Palinhos Pereira.

Seminário de Análise e Equações Diferenciais, por Wladimir Neves (Universidade Federal do Rio de Janeiro).

Título/data/local do evento, logótipos das entidades organizadoras e fotografia de peixe

The event aims to facilitate the exchange of information and knowledge among professionals to advance the understanding, collaboration and capabilities of aquaculture to respond to the impact of climate change in a rapidly changing global environment.

Composição do logótipo da ULisboa e de representação do rosto humano à base de relógios

22 de maio - dois dos doze finalistas da competição são alunos de CIÊNCIAS.

Pintura abstrata azul e rosa

Seminário de Análise e Equações Diferenciais, por Leonid Berlyand (Penn State University).

Technovation Girls Challenge Portugal - Final

Ciências acolhe o evento final do Programa Technovation Girls Challenge Portugal.

Seminário do Instituto de Astrofísica e Ciências do Espaço, por Pier-Stefano Corasaniti (Observatoire de Paris-Meudon, France).

Um programa estruturado que combina discussões em grupo, exploração de carreira e workshops informativos, com inscrições até 23 de maio.

Uma oportunidade para fortalecer a cultura de segurança e bem-estar em CIÊNCIAS.

Logótipo do EVM 2025

Candidaturas até 28 de maio.

Uma oportunidade única para interagir com a comunidade global de computação científica.

Logótipo Moodle

Ação de formação para docentes e investigadores de CIÊNCIAS.

Logótipo Mentimeter

Ação de formação para docentes e investigadores de CIÊNCIAS.

Título/data/local do evento e iconografia representativa de energias renováveis

Inscrições até 16 de maio! Junta-te a esta revolução energética e faz a diferença!

Neste curso ficarás a saber como te podes tornar um permacultor eficiente, produtivo e consciente! O curso está preparado para iniciantes na prática de permacultura.

Formação - Cultivar em Permacultura.

Pessoas a interagirem em frente a um computador portátil

As inscrições para a edição de 2025 da formação decorrem até às 17h do dia 23 de maio.

Curso destinado a estudantes de Mestrado e de Doutoramento, bem como a profissionais que desenvolvam investigação científica na área da saúde.

Químico a escrever fórmulas num quadro

Curso acreditado para efeitos de progressão na carreira dos professores do Ensino Básico e Secundário do Grupo 510 (CCPFC/ACC-118288/22), com candidaturas até 18 de maio.

Páginas