Seminário

An introduction to deep reinforcement-learning

LIP, Lisboa

Por Giles Strong (LIP).

Reinforcement learning (RL) is a process of learning to act optimally in an environment in order to accomplish a given task without (or with limited) prior knowledge of both the environment and the task. Whilst this problem has been studied since before 1990, it has only been due to recent advances in neural networks, computing power, and learning algorithms that have allowed the field to start to tackle real-world problems: e.g AlphaGo beating the top players of Go in 2016 and 2017, and OpenAI Five beating the world champions of a popular esports game in 2019.

In this seminar I will introduce RL focussing on model-free learning; algorithms which do not require, or attempt to learn, an explicit model of the environment. The theory of model-free RL will be presented followed by several example algorithms of increasing complexity and an example comparison of their performance. The seminar will conclude with some closing remarks of my personal impressions of the field.

Potential attendees should be aware that this seminar will take place in the context of my evaluation for the IST course "Advanced Experimental Methods in Particle Physics II", in which I was required to study a new subject of interest. Therefore I claim no expertise in the subject of RL, beyond having spent some time studying it, and as such the seminar will represent my current and best understanding of the subject, which is hopefully more correct than incorrect.

11h30-12h30
LIP - Laboratório de Instrumentação e Física Experimental de Partículas
Fotografia de Chapim-azul

The goal of this course is to provide the participants with the most recent and practical knowledge on the use of Functional Diversity.

O evento reunirá alunos de Ciências ULisboa e do ISCAL, proporcionando-lhes uma oportunidade única para apresentarem e defenderem os seus projetos empreendedores num formato de pitch.

Seminário do Centro de Física Teórica e Computacional, por Susana Barbosa (INESC TEC, Porto, Portugal).

Logótipo CQE Days 2025

O encontro tem como objetivo divulgar e promover os resultados da investigação produzidos nos dois pólos do Centro de Química Estrutural (CIÊNCIAS e IST), estimulando a criatividade, o trabalho interdisciplinar e o espírito científico.

Palestra de divulgação das atividades e oportunidades do IEEE (Institute of Electrical and Electronics Engineers).

Seminário de Lógica Matemática, por Eduardo Magalhães (Universidade do Porto).

Mão a segurar em globo de vidro

Curso acreditado pelo CCPFC para efeitos de progressão na carreira dos professores na dimensão cientifico-pedagógica dos grupos 230, 420, 510, 520 e 560, com candidaturas até 30 de abril.

Seminário de Geometria e Física, por Tomás Inácio (FCUL, Universidade de Lisboa).

The aim of this event is to illustrate the importance of interdisciplinarity. To do so the meeting will bring together researchers from different areas who work in interdisciplinary fields within Ciências ULisboa

Cardume

Seminário Doutoral I (Doutoramento em Biologia), por Eduardo Miguel Onofre Feijão.

Seminário do Departamento de Física de Ciências ULisboa, por José Manuel Rebordão (FCUL - DF).

Seminário de Análise e Equações Diferenciais, por João Pedro Ramos (Instituto Nacional de Matemática Pura e Aplicada).

Logótipo do LIP Summer Internship Program

Um programa destinado a estudantes de Física e Engenharia com interesse em investigação científica e tecnológica, com candidaturas até 15 de maio (nova data).

“Coroa de Flores” cósmica

Seminário do Instituto de Astrofísica e Ciências do Espaço, por Federica Loiacono (INAF OAS Bologna, Italy).

Seminário do Centro de Física Teórica e Computacional, por João Amaral (Department of Physics and CICECO, University of Aveiro, Portugal).

Seminário de Análise e Equações Diferenciais, por Wladimir Neves (Universidade Federal do Rio de Janeiro).

Título/data/local do evento, logótipos das entidades organizadoras e fotografia de peixe

The event aims to facilitate the exchange of information and knowledge among professionals to advance the understanding, collaboration and capabilities of aquaculture to respond to the impact of climate change in a rapidly changing global environment.

Composição do logótipo da ULisboa e de representação do rosto humano à base de relógios

22 de maio - dois dos doze finalistas da competição são alunos de CIÊNCIAS.

Seminário de Análise e Equações Diferenciais, por Leonid Berlyand (Penn State University).

Seminário do Instituto de Astrofísica e Ciências do Espaço, por Pier-Stefano Corasaniti (Observatoire de Paris-Meudon, France).

Uma oportunidade única para interagir com a comunidade global de computação científica.

Logótipo Moodle

Ação de formação para docentes e investigadores de CIÊNCIAS.

Logótipo Mentimeter

Ação de formação para docentes e investigadores de CIÊNCIAS.

Título/data/local do evento e iconografia representativa de energias renováveis

Inscrições até 16 de maio! Junta-te a esta revolução energética e faz a diferença!

Neste curso ficarás a saber como te podes tornar um permacultor eficiente, produtivo e consciente! O curso está preparado para iniciantes na prática de permacultura.

Páginas