Seminário

An introduction to deep reinforcement-learning

LIP, Lisboa

Por Giles Strong (LIP).

Reinforcement learning (RL) is a process of learning to act optimally in an environment in order to accomplish a given task without (or with limited) prior knowledge of both the environment and the task. Whilst this problem has been studied since before 1990, it has only been due to recent advances in neural networks, computing power, and learning algorithms that have allowed the field to start to tackle real-world problems: e.g AlphaGo beating the top players of Go in 2016 and 2017, and OpenAI Five beating the world champions of a popular esports game in 2019.

In this seminar I will introduce RL focussing on model-free learning; algorithms which do not require, or attempt to learn, an explicit model of the environment. The theory of model-free RL will be presented followed by several example algorithms of increasing complexity and an example comparison of their performance. The seminar will conclude with some closing remarks of my personal impressions of the field.

Potential attendees should be aware that this seminar will take place in the context of my evaluation for the IST course "Advanced Experimental Methods in Particle Physics II", in which I was required to study a new subject of interest. Therefore I claim no expertise in the subject of RL, beyond having spent some time studying it, and as such the seminar will represent my current and best understanding of the subject, which is hopefully more correct than incorrect.

11h30-12h30
LIP - Laboratório de Instrumentação e Física Experimental de Partículas
Logótipo do evento

No dia 04 de abril, pelas 14h30, será gravado um episódio em direto do podcast "A Escala do Clima" de Filipe Duarte Santos (Professor Jubilado de CIÊNCIAS).

Fotografia de aluna

Uma iniciativa aberta a toda a comunidade académica da ULisboa.

Fotografia de coleção de insetos

The course includes several case studies of insect adaptation, and the most recent overview on insect evodevo, plasticity, ecophysiological responses and conservation under global change.

A iniciativa, promovida pela Rede Campus Sustentável (da qual CIÊNCIAS faz parte), é direcionada para o incentivo à colaboração entre as pessoas que pertencem a estruturas existentes ou em fase de constituição.

Logótipo CIE

A leading venue for presenting and discussing the latest research, industrial practice and innovations in dependable and secure computing.

Título/data/local do evento e fotografia aérea de vias urbanas

Conferência da redeMOV, por Gabriel Costa Valença.

Seminário do Centro de Física Teórica e Computacional, por João Neves (CFTC).

Edição anterior da Jobshop Ciências

Evento de empregabilidade - 08 e 09 de abril

Título do evento

A collaborative initiative supported by five Portuguese research centers, aimed at strengthening and connecting the geometry research community in Portugal.

RSS Meetup, por Rodrigo Bruno (IST, ULisboa).

Equipa da Raiz Vertical Farms

Uma Experiência Única sobre Agricultura Urbana e Energia Renovável.

Seminário de Lógica Matemática, por Eduardo Skapinakis (Universität Tübingen / NOVA FCT).

Título/data/local do evento e fotografia da cidade de Lisboa

The conference aims to bring together students and young researchers working in Mathematics, Statistics, and Applications with a view to fostering discussions and collaborations amongst participants.

Seminário do Instituto de Astrofísica e Ciências do Espaço, por Amidou Sorgho (Instituto de Astrofísica de Andalucía - IAA-CSIC, Spain).

Título/data/local do evento e representação de ser humano

Workshop de Medicina Nuclear, organizado pelo Instituto de Biofísica e Engenharia Biomédica.

Título "Para um ensino humanista das ciências" e logótipos das entidades organizadoras

O evento tem como tema principal "Para um ensino humanista das ciências" e conta com a participação de vários professores de CIÊNCIAS.

Seminário do Centro de Física Teórica e Computacional, por Artur Ferreira (Departamento de Engenharia de Eletrónica e Telecomunicações e de Computadores, ISEL, Portugal).

Microplásticos em suspensão no oceano

O curso tem como objetivo dar formação sobre a problemática da contaminação por detritos de plástico dos nossos ecossistemas, bem como alertar para os potenciais efeitos deletérios nos organismos - candidaturas até 22 de março.

Banner do Dia de Ciências 2025

A 29 de abril assinalamos o 114.º aniversário de CIÊNCIAS.

Junte-se a nós no Grande Auditório de CIÊNCIAS para uma tarde de celebração que reúne toda a comunidade da Faculdade.

Fotografia de fábrica a emitir poluição para a atmosfera

The course aims at enabling the participants to use different methods to measure the impacts of pollutants on ecosystems.

Logótipo C-Academy

O curso oferece uma base sólida sobre os fundamentos e práticas essenciais para proteger sistemas e dados num mundo cada vez mais digital - candidaturas até 13 de abril.

Um concurso de programação dirigido aos alunos do ensino secundário (11.º e 12.º anos), que visa promover a prática e o gosto pela programação.

Banner Dia Aberto de CIÊNCIAS 2025.

Bem-vindos a Ciências ULisboa!

O encontro tem como objetivo divulgar e promover os resultados da investigação produzidos nos dois pólos do Centro de Química Estrutural (CIÊNCIAS e IST), estimulando a criatividade, o trabalho interdisciplinar e o espírito científico.

Fotografia de Chapim-azul

The goal of this course is to provide the participants with the most recent and practical knowledge on the use of Functional Diversity.

Páginas