Seminário

An introduction to deep reinforcement-learning

LIP, Lisboa

Por Giles Strong (LIP).

Reinforcement learning (RL) is a process of learning to act optimally in an environment in order to accomplish a given task without (or with limited) prior knowledge of both the environment and the task. Whilst this problem has been studied since before 1990, it has only been due to recent advances in neural networks, computing power, and learning algorithms that have allowed the field to start to tackle real-world problems: e.g AlphaGo beating the top players of Go in 2016 and 2017, and OpenAI Five beating the world champions of a popular esports game in 2019.

In this seminar I will introduce RL focussing on model-free learning; algorithms which do not require, or attempt to learn, an explicit model of the environment. The theory of model-free RL will be presented followed by several example algorithms of increasing complexity and an example comparison of their performance. The seminar will conclude with some closing remarks of my personal impressions of the field.

Potential attendees should be aware that this seminar will take place in the context of my evaluation for the IST course "Advanced Experimental Methods in Particle Physics II", in which I was required to study a new subject of interest. Therefore I claim no expertise in the subject of RL, beyond having spent some time studying it, and as such the seminar will represent my current and best understanding of the subject, which is hopefully more correct than incorrect.

11h30-12h30
LIP - Laboratório de Instrumentação e Física Experimental de Partículas

No âmbito das atividades de encerramento deste ciclo, destaca-se a a apresentação pelo docente de CIÊNCIAS Miguel Miranda, intitulada "Relembrar o passado, Prevenir o Futuro", e a exibição do filme sobre o Terramoto de 1775: “O Melhor dos Mundos”, realizado por Rita Nunes e que contou com a participação de membros de CIÊNCIAS.

Este encontro é uma ocasião para dar visibilidade ao trabalho e à obra de Mary B. Hesse, apresentando o livro “Ensaios sobre o conhecimento Científico” (Edições Colibri, 2024) que oferece uma recolha de ensaios desta filosofia traduzidos para português.

Fotografia, a preto e branco, de luz de rua

Seminário do Centro de Física Teórica e Computacional, por Cátia Pesquita (LASIGE, Faculdade de Ciências, Universidade de Lisboa).

Título do curso e logótipo das entidades organizadoras, sobre representação de DNA

Curso online, de 6 sessões e com uma duração total de 16 horas, dirigido a estudantes de Mestrado/Doutoramento e a profissionais que desenvolvam investigação científica na área da saúde.

Seminário de Lógica Matemática, por Raheleh Jalali (Institute of Computer Science - Czech Academy of Sciences).

Logótipo do projeto

O evento, no âmbito do Projeto VA|PREVENTION (com a participação de CIÊNCIAS), conta com a presença de diversos peritos na área da saúde pública, promovendo o debate sobre o estilo de vida na prevenção da diabetes tipo 2.

Colóquio de Matemática, por Florian Pausinger (Departamento Matemática - Ciências ULisboa).

Seminário de Pós-graduação (Doutoramento em Biologia), por Pedro Miguel Duarte Gomes.

Imagem abstrata

Um evento pioneiro que marca o lançamento do Programa para a Promoção da Saúde Mental no Ensino Superior na ULisboa. Ao longo do evento, será apresentada uma plataforma inovadora que reunirá recursos e iniciativas destinadas a prevenir e abordar questões relacionadas com a saúde mental e o bem-estar.

Logótipos de Ciências ULisboa/GAPsi e calendarização das palestras

Palestra promovida pelo GAPSI - Gabinete de Apoio Psicológico de Ciências ULisboa.

Lisbon Webinar in Analysis and Differential Equations, por Damião Araújo (Universidade Federal da Paraíba).

Título/data/local do evento, logótipos das entidades participantes e fotografia de céu nublado

A 3.ª edição do workshop, dedicada à modelação e validação de processos de alta resolução, pretende abordar a modelação de fogos florestais e de eventos extremos de temperatura, precipitação e vento, tais como ondas de calor, secas, inundações, ciclones pós-tropicais e agitação marítima.  

A sessão de homenagem inclui o lançamento de uma nova edição do livro Estatística: Inferência e Decisão, anteriormente editado pela Imprensa Nacional-Casa da Moeda, e atualmente esgotado.

Título/data/local do evento, logótipos da entidade organizadora e fotografia de mãos na água

Encontro Alumni ULisboa 2024 - a inscrição é obrigatória, tendo um preço simbólico para apoiar o projeto Bolsas Alumni Solidário.

Logótipos de Ciências ULisboa/GAPsi e calendarização das palestras

Uma conversa sobre regulação emocional.

Conferência do Centro Interuniversitário de História das Ciências e da Tecnologia, por Gemma Cirac-Claveras (Institut d'Història de la Ciència - Barcelona).

Título/data/local do evento e fotografia de profissional de saúde a interagir com um paciente, em tons sépia

Com foco na promoção de cuidados de saúde centrados no doente, a conferência pretende mobilizar a comunidade e o ecossistema da ULisboa para discutir estratégias e tendências na área, bem como atuais e futuras iniciativas de investigação clínica e de dados com vista à prestação de cuidados de elevado valor.

Imagem do evento - título, local e data do evento

Investigação Ecológica ao Serviço da Conservação

Seminário Doutoral II (Doutoramento em História e Filosofia das Ciências), por André Gonçalo Azevedo Pedro.

Logótipos de Ciências ULisboa/GAPsi e calendarização das palestras

Palestra promovida pelo GAPSI - Gabinete de Apoio Psicológico de Ciências ULisboa.

This workshop aims to explore crucial issues raised by contemporary computational models and methods in AI. The focus will be on fostering discussions about the epistemological, ontological, and formal considerations, as well as the societal implications of AI systems.

Título/data/local do evento e três fotografias relacionadas com a permacultura

Permacultura? Não é uma pseudociência esotérica? Uma utopia sem fundamento científico? Para desmistificar estas e outras ideias, o permacultor certificado Tiago Silva (SmartLeap) guiar-te-á pelos caminhos desta prática multidisciplinar, fundada em sólidas bases empíricas.

Logótipos de Ciências ULisboa/GAPsi e calendarização das palestras

Uma conversa sobre ti, alguém amigo ou apenas acerca de ansiedade.

Páginas