Seminário

An introduction to deep reinforcement-learning

LIP, Lisboa

Por Giles Strong (LIP).

Reinforcement learning (RL) is a process of learning to act optimally in an environment in order to accomplish a given task without (or with limited) prior knowledge of both the environment and the task. Whilst this problem has been studied since before 1990, it has only been due to recent advances in neural networks, computing power, and learning algorithms that have allowed the field to start to tackle real-world problems: e.g AlphaGo beating the top players of Go in 2016 and 2017, and OpenAI Five beating the world champions of a popular esports game in 2019.

In this seminar I will introduce RL focussing on model-free learning; algorithms which do not require, or attempt to learn, an explicit model of the environment. The theory of model-free RL will be presented followed by several example algorithms of increasing complexity and an example comparison of their performance. The seminar will conclude with some closing remarks of my personal impressions of the field.

Potential attendees should be aware that this seminar will take place in the context of my evaluation for the IST course "Advanced Experimental Methods in Particle Physics II", in which I was required to study a new subject of interest. Therefore I claim no expertise in the subject of RL, beyond having spent some time studying it, and as such the seminar will represent my current and best understanding of the subject, which is hopefully more correct than incorrect.

11h30-12h30
LIP - Laboratório de Instrumentação e Física Experimental de Partículas
Árvore florida

A minha Jornada pela Matemática: Descobertas, Escolhas e Desafios, por Ana Catarina Monteiro - estudante do Mestrado em Matemática (Licenciatura: Matemática).

Título do prémio

As candidaturas decorrem até ao dia 31 de maio.

Inscrições até 24 de maio.

Pormenor de linguagem corporal (braços e mãos) de pessoa a dialogar

Ação de formação para docentes e investigadores de Ciências.

Feixes luminosos

Envio de propostas até 20 de junho.

Vai realizar-se em Lisboa, nos dias 28 e 29 de junho de 2024, o 37.º Encontro do Seminário Nacional de História da Matemática.

Logótipo do Verão na ULisboa, sobre um fundo amarelo

Uma oportunidade única de conheceres e experimentares o ritmo e o espírito da vida académica!

The topics of the conference include (but are not limited to) classical and quantum integrable systems, complex geometry of moduli spaces, automorphic forms and their applications to number theory.

Título/data do evento, logótipos das entidades organizadoras e fotografia de Lisboa (Castelo de S. Jorge e respetiva colina)

Inscrição (taxa reduzida) até 20 de abril.

Título/data/local do evento, logótipos das entidades organizadoras e várias fotografias da orla costeira e de pessoas

Escola de verão com um programa muito diversificado, com especialistas em vários tópicos, que vão falar sobre formas de olhar para o nosso planeta de uma forma integrada, juntando conhecimentos de várias disciplinas.

Are you a BSc or MSc student interested in Soft Matter, Non-linear Dynamics and Waves or Particle Physics?

Vem investigar connosco!

Logótipo do evento, sobre um fundo branco

Um evento de reunião da comunidade nacional nas diversas vertentes da informática, com a ambição de ser o fórum de eleição para a divulgação, discussão e reconhecimento de trabalhos científicos.

Páginas