Minicursos
M1 - Aprendizagem e Inferência Causal: Um Guia Prático


- Segunda e terça-feira, 04/08 e 05/08
- 08:00 - 10:00
Neste minicurso, adotaremos uma abordagem prática para apresentar os conceitos fundamentais para inferência causal a partir de dados observacionais, demonstrando como diferentes técnicas nessa área podem expandir as possibilidades de inferência, indo além da identificação de associações estatísticas (inferências do nível 1), avançando para explicações dos processos de decisão, incluindo a identificação tanto efeitos de intervenções quanto contrafactuais (inferências dos níveis 2 e 3, respectivamente). Entre as técnicas que exploraremos estão os algoritmos de aprendizado de estrutura causal, capazes de identificar, ao menos parcialmente, relações de causa efeito entre variáveis. Discutiremos, em particular, o algoritmo Fast Causal Inference (FCI), que se destaca pelo seu rigor metodológico e pela menor dependência de suposições não realistas em comparação com outros métodos de descoberta causal. Notavelmente, o FCI é capaz de corretamente identificar relações causais, mesmo na presença de confundimento latente e viés de seleção. No entanto, assume-se que há um teste estatístico adequado disponível para a identificação das relações de independência condicional entre as variáveis aleatórias envolvidas. Neste contexto, discutiremos os desafios e possíveis soluções para aplicações que envolvem variáveis heterogêneas (quantitativas, categóricas, de contagem, etc.), avaliações longitudinais e a presença de dados faltantes. Além de algoritmos de aprendizado causal, também discutiremos técnicas para identificabilidade e estimação dos efeitos, apresentando um pipeline de inferência causal inteiramente baseado em dados observacionais.
Palavras-chave: inferência causal, aprendizado de estrutura causal, dados longitudinais, dados heterogêneos, dados faltantes, variabilidade do risco de malária.
Apoio Recebido: O presente trabalho foi realizado com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), Brasil. Processo nº 2022/11963-3. As opiniões, hipóteses e conclusões ou recomendações expressas nesse material são de responsabilidade dos autores e não necessariamente refletem a visão da FAPESP.
Obtenção de dados geoespaciais e integração com modelos de machine learning


- Segunda e terça-feira, 04/08 e 05/08
- 08:00 - 10:00
Palavras-chave: Geoestatística; Análise espacial; Machine Learning; Análise de dados.
Machine-Learning for Handling Imbalanced Data: Multi-Class Classification, Anomaly Detection, and Accuracy Metrics in R


- Segunda e terça-feira, 04/08 e 05/08
- 08:00 - 10:00