Programação detalhada

Segunda-feira, 04/08

Minicursos 1, 2 e 3

Café

Abertura

CONFERÊNCIA 1 (Abertura)

Almoço

Concursos de Melhores Trabalhos

Miniconferência 1

Conferência 2

Café

Sessões Temáticas 1 e 2 e Mesa Redonda 1

Festa RBras 70 anos

Terça-feira, 05/08

Minicursos 1, 2 e 3

Café

Sessão Temática 3, Mesa Redonda 2 e Tutorial 1

Almoço

Conferência 3

Miniconferência 2

Conferência 4

Café

Sessão Temática 4, Mesa Redonda 3 e Tutorial 2

Sessão Pôsteres 1

Quarta-feira, 06/08

Comunicações Orais 1 a 4

Café

Sessões Temáticas 5 e 6 e Tutorial 3

Almoço

Espaço Parceiro - Grupo Autoglass

CONFERÊNCIA 5

Miniconferência 3

Conferência 6

Café

Assembléia RBras

Premiação Destaque RBras

Sessão Pôsteres 2

Quinta-feira, 07/08

Comunicações Orais 5

Comunicações Orais 6

Comunicações Orais 7 e Apresentações Hackixaba

Mesa Redonda 4 e Sessão Temática 7

Café

Sessões Temáticas 8 e 9 e Tutorial 4

Almoço

Espaço Parceiro - SEBRAE/ES

CONFERÊNCIA 7

Miniconferência 4

Conferência 8

Café

Conferência 9 (Encerramento)

Encerramento e Premiações do Hackixaba

Sexta-feira, 08/08

Sessão Expandida para Conexões Científicas

Programação resumida

Minicursos

Adèle Helena Ribeiro​

Universidade de Münster, Alemanha
Minicurrículo

Júlia Maria Pavan Soler

IME-USP
Minicurrículo
Neste minicurso, adotaremos uma abordagem prática para apresentar os conceitos fundamentais para inferência causal a partir de dados observacionais, demonstrando como diferentes técnicas nessa área podem expandir as possibilidades de inferência, indo além da identificação de associações estatísticas (inferências do nível 1), avançando para explicações dos processos de decisão, incluindo a identificação tanto efeitos de intervenções quanto contrafactuais (inferências dos níveis 2 e 3, respectivamente). Entre as técnicas que exploraremos estão os algoritmos de aprendizado de estrutura causal, capazes de identificar, ao menos parcialmente, relações de causa  efeito entre variáveis. Discutiremos, em particular, o algoritmo Fast Causal Inference (FCI), que se destaca pelo seu rigor metodológico e pela menor dependência de suposições não realistas em comparação com outros métodos de descoberta causal. Notavelmente, o FCI é capaz de corretamente identificar relações causais, mesmo na presença de confundimento latente e viés de seleção. No entanto, assume-se que há um teste estatístico adequado disponível para a identificação das relações de independência condicional entre as variáveis aleatórias envolvidas. Neste contexto, discutiremos os desafios e possíveis soluções para aplicações que envolvem variáveis heterogêneas (quantitativas, categóricas, de contagem, etc.), avaliações longitudinais e a presença de dados faltantes. Além de algoritmos de aprendizado causal, também discutiremos técnicas para identificabilidade e estimação dos efeitos, apresentando um pipeline de inferência causal inteiramente baseado em dados observacionais.

Palavras-chave: inferência causal, aprendizado de estrutura causal, dados longitudinais, dados heterogêneos, dados faltantes, variabilidade do risco de malária.

Apoio Recebido: O presente trabalho foi realizado com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), Brasil. Processo nº 2022/11963-3. As opiniões, hipóteses e conclusões ou recomendações expressas nesse material são de responsabilidade dos autores e não necessariamente refletem a visão da FAPESP.

Deoclecio Jardim Amorim

USP
Minicurrículo

Maria Gabriella da Silva Araújo

USP
Minicurrículo
O curso oferece uma introdução aos princípios fundamentais da teoria do geoprocessamento e dos Sistemas de Informações Geográficas (SIG). Serão abordadas as  principais bases de dados geoespaciais ambientais, além da aplicabilidade, importância e  desafios na utilização desses dados em diferentes contextos. Os alunos aprenderão a obter  e manipular dados geoespaciais de maneira eficaz, combinando habilidades de  manipulação de dados e programação para realizar análises robustas. As técnicas  apresentadas serão aplicáveis em áreas como monitoramento ambiental, planejamento  territorial, gestão de recursos naturais, estudos de mudanças climáticas, análise de padrões  espaciais e modelagem de cenários futuros, promovendo uma visão integrada para tomada  de decisões em contextos científicos e de gestão ambiental. Portanto, objetiva-se introduzir  os conceitos iniciais referente a coleta de dados geoespaciais das principais bases de  dados, envolvendo a aquisição de dados, organização e integração de dados e visualização  utilizando linguagem de programação R. A abordagem adotada busca equilibrar teoria e  prática, proporcionando uma compreensão abrangente e aplicada dos métodos de coleta e  análise de dados.  

Palavras-chave: Geoestatística; Análise espacial; Machine Learning; Análise de dados.

Darshana Jayajumari

Maynooth University, Ireland
Minicurrículo

Niamh Mimnagh

Maynooth University, Ireland
Minicurrículo
This short course provides a comprehensive introduction to handling imbalanced data in machine learning, a critical challenge in fields like fraud detection, medical diagnosis, and anomaly detection. Participants will explore effective techniques to address class imbalance, focusing on resampling methods (both oversampling and undersampling), weighted classification, and multi-class classification strategies. The course will also cover anomaly detection approaches for rare event prediction, such as Local Outlier Factors, Isolation Forests, Angle-Based Outlier Detectors and Minimum Covariance Determinants, as well as performance metrics tailored for imbalanced datasets, such as Precision-Recall curves, F1 score, and AUC. Through hands-on case studies and examples in R, attendees will gain practical experience in implementing these techniques and evaluating model performance in real-world scenarios. The course is designed for data scientists and analysts seeking to build robust predictive models when faced with skewed data distributions, offering insights into both theory and practical applications.

Keywords: Imbalanced data, anomaly detection, classification, AUC, F1-scores, Precision-Recall curves, machine learning.

Café

Abertura

Conferência 1 (Abertura)

C1 - Are we already FAIR? – The future of data sharing

Iris Pigeot

Leibniz Institute, Germany
Minicurrículo

‘Data sharing’ is becoming increasingly important in terms of efficient use of resources. In 2007, the OECD called for easy access to research data for the scientific community. In 2016, the FAIR principles (findable, accessible, interoperable, reusable) for research data were published. In 2018, the German government decided to establish a National Research Data Infrastructure (NFDI) where NFDI4Health takes responsibility for personal health data. This talk will present the infrastructures that have been realized so far and discuss potential (statistical) hurdles by giving illustrative examples. Further European developments such as the European Health Data Space will be addressed.

Concursos de Melhores Trabalhos

Estimação por máxima verossimilhança em modelos espaciais lineares mistos generalizados baseada na aproximação de Laplace

Apresentador:
Caio Gomes Alves

O trabalho apresenta uma abordagem computacional para estimação de parâmetros em Modelos Espaciais Lineares Mistos Generalizados (SGLMMs) utilizando a aproximação de Laplace, como alternativa a métodos tradicionais baseados em MCMC, que são computacionalmente intensivos e possuem desafios de convergência. O estudo foi desenvolvido em R, com funções adaptadas para simplificar a sintaxe e otimizar o ajuste de modelos para dados não-gaussianos, como contagens e proporções georreferenciadas. 
Foram realizados estudos de simulação para avaliar propriedades dos estimadores, como não-viés e consistência, sob diferentes condições (tamanho amostral, funções de correlação espacial e regiões amostrais). Os resultados mostraram que a aproximação de Laplace é computacionalmente mais eficiente que MCMC (sob condições de regularidade), com estimativas comparáveis e menor tempo de execução. 
A aplicação a dados reais (contagem de ervas daninhas e sondagens geotécnicas) demonstrou a eficácia do método, permitindo predições espaciais precisas e seleção de modelos via verossimilhança. 

Palavras-chave: Geoestatística; Modelos Mistos; Aproximação de Laplace; Verossimilhança; Estatística Espacial.

D-Valor: comparação e aplicação para dados massivos

Apresentador:
Jefferson Caponero

Este trabalho traz uma discussão sobre o uso do p-valor nos testes de significância da hipótese nula e as questões relacionadas à sua interpretação. Foram avaliadas críticas à abordagem dos p-valores e os desafios específicos ao usar o p-valor para dados massivos. Com alternativa, se avaliou aplicação do d-valor em testes de hipóteses. O d-valor é uma métrica estatística proposta Demidenko focando na probabilidade de que uma observação de um grupo seja maior que uma de outro grupo (controle). Essa métrica é especialmente útil em áreas onde a interpretação prática da magnitude do efeito é mais relevante do que a significância estatística. Simulações realizadas indicaram que, em populações com distribuição normal e gama, o tamanho da amostra tem um impacto pouco significante no d-valor. Foram ainda abordados os desafios associados ao uso em análises estatísticas de dados massivos reais. Assim, aplicou-se o d-valor a amostras aleatórias do conjunto de dados formado pelo Censo da Educação Superior Brasileira do ano de 2019, avaliando categorias como: gênero, turno, auxílio financeiro, modalidade de ensino, grau acadêmico e desempenho territorial, destacando diferenças estatisticamente significativas entre essas categorias. O d-valor demonstrou estabilidade nos resultados, com uma distribuição normal e pouco sensível ao tamanho da amostra. Esse estudo revelou informações significativas sobre o ensino superior nacional. Os dados demonstram que em todas as categorias estudadas a diferença entre o grupo de referência e demais alunos foi ínfima e que a diferença de desempenho entre os estados brasileiros é no máximo pequena. 

Palavras-chave: D-Valor; P-Valor; Dados Massivos; Teste de Hipóteses; Censo da Educação Superior Brasileira. 

Avaliação aprimorada da capacidade do processo por meio de modelagem semiparamétrica por partes

Apresentador:
Vinícius da Costa Soares  

Os modelos por partes (piecewise models) têm ganhado popularidade como uma ferramenta útil em confiabilidade e monitoramento/controle da qualidade, especialmente quando os dados do processo não seguem uma distribuição normal. Neste estudo são desenvolvidos estimadores de máxima verossimilhança (EMVs) para os índices de capabilidade do processo Cpk, Cpm, C∗ pm e Cpmk, usando um modelo semiparamétrico. Para remover o viés nos EMVs com tamanhos de amostra pequenos, é proposta uma abordagem de correção de viés (bias-correction approach). Além disso, o método proposto é estendido para situações em que os pontos de quebra (changepoints) na função de densidade são desconhecidos. Para estimar os parâmetros do modelo de forma eficiente, é utilizado o método de máxima verossimilhança perfilada. O estudo de simulação revelou que o método sugerido produz estimativas com baixo viés e erro quadrático médio. Por fim, são fornecidas três aplicações a dados reais, a fim de demonstrar a superioridade do procedimento proposto em relação aos existentes. 

Palavras-chave: Índice de capabilidade do processo; método de correção de viés; modelo de ponto de quebra; modelo exponencial por partes.

New Generalized Autoregressive Score and Regression Models

Apresentador:
Fernando José Monteiro de Araújo   

This work proposes new dynamic models that combine the unit gamma (UG) and Burr XII (BXII) conditional distributions with the generalized autoregressive score (GAS) framework, referred to as UG-GAS and BXII-GAS. These proposals aim to enhance the understanding of stochastic behavior and improve the forecasting of hydro-environmental indicators. To model time-dependent effects, dynamic structures such as GAS models provide a useful framework, allowing for the update of time-varying parameters based on past observations and the weighted score function. The estimation of GAS models is performed via conditional maximum likelihood, and a Monte Carlo simulation study is conducted to assess the estimators’ performance. The proposed UG-GAS and BXII-GAS models are applied to real data on capacity factors in wind power plants and river flow rates in hydroelectric plants, respectively. In addition, we also propose a new quantile regression model based on a reparameterization of the unit ratio-Weibull (URW) distribution. We define a systematic structure for two parameters of the distribution: one representing the quantiles of the URW and the other corresponding to the shape parameter. The estimation of the regression model parameters is carried out using the maximum likelihood method, and its performance is evaluated through Monte Carlo simulations and an application to mortality rates. The results illustrate the model’s usefulness in understanding and quantifying the effects of economic, social, demographic, and public health variables on the quantiles of the COVID-19 mortality rate in Latin American countries. 

Palavras-chave: Generalized autoregressive score models; Hydro-environmental indicators; Monte Carlo simulation; Mortality rates; Quantile regression.

Identificação do Efeito Causal no Modelo de Medição com Variáveis Latentes

Apresentador:
Michelle P.V. Passos 

A análise de mediação causal baseada em respostas potenciais (contrafactuais) tem sido amplamente utilizada para decompor o efeito causal de uma intervenção sobre desfechos em diversas áreas, especialmente na epidemiologia e nas ciências sociais. Os métodos mais conhecidos se baseiam em variáveis contínuas, geralmente por meio de modelos lineares e mensuração sem erro. No entanto, em certos contextos, o mediador e/ou o desfecho podem ser variáveis latentes, caracterizadas via modelos de classes latentes. Assim, com a crescente disseminação de modelos de mediação com variáveis latentes, torna-se necessária a formalização das condições de identificação causal dos efeitos naturais direto e indireto, para garantir interpretação e estimação sem viés. Neste contexto, esta dissertação avalia o comportamento dos estimadores dos efeitos direto e indireto em modelos com variáveis latentes categóricas, via análise de classes latentes (LCA), em cenários com mediadores e/ou desfechos latentes. As metodologias para estimação dos efeitos natural indireto (NIE) e direto (NDE) são estendidas para variáveis latentes com mais de duas classes. Propõe se também a inclusão de escores de propensão em modelos marginais estruturais com variáveis latentes. Estudos de simulação de Monte Carlo avaliaram as propriedades dos métodos propostos sob diferentes cenários de violação das suposições. As metodologias são ilustradas com dados reais de duas aplicações na área da saúde. Os resultados destacam a importância dos critérios de identificação causal e oferecem insights relevantes para avanços metodológicos e futuros estudos. 

Palavras-chave: Inferência Causal, Análise de Classes Latentes, Efeito Natural Indireto, Mediação Causal, Modelos Marginais Estruturais.

Delineamentos ótimos para modelos polinomiais fracionários

Apresentador:
Samantha Navarro Janine 

A vasta aplicabilidade de modelos não lineares em diferentes contextos tem motivado o desenvolvimento de estudos para a definição de algoritmos envolvendo estas funções. Contudo, ainda existem poucos trabalhos realizados em cenários de delineamentos ótimos para modelos não lineares. A teoria de delineamentos de experimentos consiste em planejar o experimento e determinar a estimativa dos parâmetros de acordo com a função dada entre as variáveis de interesse. Para obter a máxima informação possível sobre os parâmetros, utilizam-se os delineamentos ótimos, com base em um determinado critério. Em funções com covariáveis contínuas, cujos comportamentos não são capturados por modelos polinomiais, o uso de polinômios fracionários, dado por um conjunto de potências usual mente utilizado, torna o ajuste mais flexível e de simples interpretação. Logo, o objetivo deste trabalho é estudar a teoria de delineamentos ótimos em modelos polinomiais fracionários a partir da construção de um algoritmo de troca das coordenadas da matriz de planejamento. Através do estudo das abordagens de delineamentos localmente ótimos e pseudo-Bayesianos considerando o critério D, o interesse é avaliar como a atribuição dos valores iniciais dos parâmetros e suas respectivas prioris podem influenciar no resultado do delineamento ótimo obtido a fim de garantir delineamentos mais eficientes. Além disso, deseja-se motivar a programação de algoritmos flexíveis a diferentes cenários que não estão implementados em pacotes usuais disponíveis em softwares para análises estatísticas. 

Palavras-chave: Delineamentos ótimos; Polinômios fracionários; Algoritmo de troca por coordenada; Planejamento de experimentos.

Functional Data Analysis: Spatial Association of Curves and Irregular Spacing

 Apresentador:
Alvaro Alexander Burbano Moreno

Spatial Functional Data (SFD) analysis is an emerging statistical framework that combines Functional Data Analysis (FDA) and spatial dependency modeling. Unlike traditional statistical methods, which treat data as scalar values or vectors, SFD considers data as continuous functions, allowing for a more comprehensive understanding of their behavior and variability. This approach is well-suited for analyzing data collected over time, space, or any other continuous domain. SFD has found applications in various fields, including economics, finance, medicine, environmental science, and engineering. This thesis proposes new functional Gaussian models incorporating spatial dependence structures, focusing on irregularly spaced data and reflecting spatially correlated curves. The models are based on B-spline basis expansions and Bernstein Polynomials (BP) and utilize a Bayesian approach for estimating unknown quantities and parameters. The thesis explores the advantages and limitations of B-spline-based and BP-based models in capturing complex shapes and patterns while ensuring numerical stability. The main contributions of this work include the development of an innovative model designed for SFD using B-spline or BP structures, including a random effect to address associations between irregularly spaced observations, and a comprehensive simulation study to evaluate models’ performance under various scenarios. The thesis also presents two real applications related to levels of PM10 and Temperature in Mexico City, showcasing practical illustrations of the proposed models. 

Palavras-chave: Functional Data Analysis; Spatial Dependency; Bayesian Statistics; Bernstein Polynomial; B-spline.

Multivariate modeling and linear and partially linear mixed models using scale mixtures of centered skew-normal distributions

 Apresentador:
João Victor Bastos de Freitas 

Durante muito tempo, em Estatística, a abordagem padrão para a modelagem de dados univariados/multivariados era considerar alguma metodologia com a distribuição normal univariada/multivariada. No entanto, em muitos casos as distribuições associadas às variáveis de interesse podem apresentar assimetria e/ou caudas mais pesadas do que as da normal, fazendo com que esta distribuição seja inapropriada. Assim, introduzimos e exploramos as distribuições de mistura de escala da skew-normal centrada multivariada para contornar alguns problemas inferenciais e de interpretação apresentados por sua versão sob a parametrização usual. Além disso, motivados pelo Millennium Cohort Study, propomos um modelo linear misto com efeitos aleatórios seguindo uma mistura de escala da skew-normal centrada multivariada e erros seguindo uma mistura de escala da normal multivariada. Por fim, motivados pelo estudo da qualidade do ar na cidade de Vitória, Espírito Santo, Brasil, propomos um modelo misto aditivo parcialmente linear sob independência condicional com erros seguindo uma mistura de escala da distribuição skew-normal centrada univariada, considerando também os parâmetros de escala e assimetria variando no tempo. Para todas as metodologias propostas foram feitos estudos de simulação para avaliar a recuperação de parâmetros e outras características de interesse. Quando pertinente, análise residual, critérios de informação e análise de influência foram propostas. As análises de conjuntos de dados reais constataram que os novos modelos (distribuições) apresentaram melhores resultados, em termos de qualidade de ajuste e, consequentemente, conclusões, do que abordagens usuais da literatura, como os modelos baseados nas distribuições normal e skew-normal (sob a parametrização direta).

Palavras-chave: Modelos mistos; Modelagem multivariada; Misturas de escala; Skew-normal centrada; Modelos aditivos parcialmente lineares.

Essays on Cure Rate Models

 Apresentador:
Márcia Brandão de Oliveira Martins

This work focuses on cure fraction models in survival analysis, which are fundamental in applications where a significant portion of individuals never experience the event of interest, even when observed for long periods. These models assume a homogeneous population and incorporate an unobserved random variable to represent missing information. The study is divided into three chapters. The first chapter provides an introduction to cure rate models. The second chapter extends the cure fraction model by incorporating competitive causes within the Power Series class, assuming a mixture of two competing causes. This generalization includes several well-known models as special cases. Parameter estimation is performed using the maximum likelihood method, and an EM (Expectation-Maximization) algorithm is proposed. Monte Carlo simulations are conducted to evaluate asymptotic properties. The methodology is illustrated with real data from a population-based study of cutaneous melanoma cases diagnosed in São Paulo, Brazil. The third chapter introduces a new modeling approach where the number of competing causes follows a mixture of Poisson and Birnbaum-Saunders distributions. This approach generalizes existing models, with the promotion time model appearing as a limiting case. Statistical properties of the proposed model are analyzed, and parameter estimation is again performed using the maximum likelihood method with an EM algorithm. Monte Carlo experiments are conducted to assess asymptotic properties and the power of the likelihood ratio test. Finally, the methodology is applied to real data from a population-based study of breast cancer cases in São Paulo, Brazil. 

Palavras-chave: Mixtures; Power series distribution, Poisson, Birnbaum-Saunders, competing causes; EM algorithm; Melanoma; Breast cancer.

Miniconferência 1

Y1 - Processos de contagem e derivações: Uma aplicação para dados ambientais e epidemiológicos

Ana Julia Alves Câmara

UFES
Minicurrículo

Nos últimos anos, o crescimento econômico e o desenvolvimento urbano decorrentes da expansão das cidades e comunidades trouxeram consigo tanto benefícios quanto desafios. Enquanto impulsionaram a economia e o progresso urbano, também resultaram em problemas ambientais e de saúde, devido à geração de resíduos que impactam a qualidade de vida da população. Modelos para dados de contagem têm sido amplamente empregados em estudos epidemiológicos para avaliar o impacto da poluição do ar na saúde humana. A presença de observações atípicas nesse tipo de dado pode prejudicar significativamente a estimativa e inferência dos parâmetros de interesse, impactando os resultados e as conclusões de estudos científicos na área. Devido à natureza do dado, um modelo GLARMA robusto é proposto baseado na robustificação da função de quase-verossimilhança. As observações atípicas são tratadas separadamente, usando funções de peso para as variáveis explicativas e a função de perda Huber para a variável resposta. Estudos de simulação demonstraram que essa abordagem robusta é mais confiável do que o modelo GLARMA clássico quando os dados estão contaminados. Para ilustrar a aplicabilidade do modelo, um estudo utilizando dados reais investiga o impacto do material particulado (PM10) no número de mortes por doenças respiratórias na cidade de Vitória/ES, Brasil.

Conferência 2

C2 - Bayesian learning for infectious disease surveillance

Leonardo Soares Bastos

FIOCRUZ
Minicurrículo

Public health decision-makers need to decide when to act based on expected or predicted case numbers and to act as quickly as possible based on the current situation of a particular infectious disease to minimize worst outcomes, such as deaths. As part of the epidemiological surveillance of infectious diseases, it is necessary to understand disease dynamics, often with limited data. Bayesian learning is a powerful ally in epidemiological surveillance due to its flexibility in combining expert knowledge and data in complex statistical models. In this talk, I will present problems and proposed solutions related to real-time infectious disease surveillance of arboviruses (e.g. dengue and chikungunya) in Brazil, severe cases of acute respiratory viruses (e.g. Influenza, COVID-19, RSV) in Brazil, and measles reported cases in the US.

Café

Sessões Temáticas 1 e 2 e Mesa Redonda 1

Elisângela Rodrigues (Chair)

UFC/Cidacs-Fiocruz-BA
Minicurrículo

Maria Yury Travassos Ichihara

Cidacs/Fiocruz-BA
Minicurrículo

Laís Picinini Freitas

PROCC - Fiocruz-RJ
Minicurrículo

Raphael de Freitas Saldanha

ICICT - Fiocruz-RJ
Minicurrículo
Na sessão temática “Fiocruz: Saúde com Dados”, destacamos avanços e aplicações na análise de dados voltados para a saúde pública, apresentando abordagens inovadoras em modelagem estatística e estudos sobre desigualdades sociais. Na palestra “Modelos Bayesianos espaço-temporais para dados de vigilância: distribuição, fatores associados, e predição de epidemias de arboviroses”, foi abordada a utilização de modelos estatísticos bayesianos para analisar padrões espaço-temporais de epidemias, como dengue, zika e chikungunya. Os pesquisadores exploraram a capacidade desses modelos de identificar fatores de risco, prever surtos e auxiliar na alocação de recursos para vigilância epidemiológica. Já a palestra “Desigualdades sociais em saúde e impacto de políticas sociais no Brasil: evidências produzidas no Cidacs” trouxe à tona os resultados de estudos realizados pelo Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs). As análises revelaram que esses estudos vêm produzindo evidências robustas sobre desigualdades sociais e avaliação de políticas sociais a partir do uso de grandes bases de dados integradas e o desenvolvimento de tecnologias de Big Data. Serão apresentadas as evidências que foram produzidas pelos pesquisadores do Cidacs em relação à saúde materno-infantil, doenças infecciosas, nutrição e doenças crônicas não transmissíveis como câncer, por exemplo. Na terceira palestra, “Democratização de acesso a dados de saúde, ambiente e clima com o R: a experiência do LIS/ICICT/Fiocruz”, destacamos o uso da linguagem de programação R como ferramenta para facilitar o acesso a dados de saúde e clima, promovendo a transparência e o uso de informações em pesquisas e políticas públicas. A combinação dessas temáticas ilustra como a estatística e a ciência de dados podem ser uma ferramenta poderosa para enfrentar desafios complexos de saúde pública, desde a previsão de epidemias até a promoção de equidade no acesso à saúde, além de reforçar a importância de dados e tecnologias como bases para ações mais eficazes e equitativas em saúde pública. 

Palavras-chave: Modelagem bayesiana; Vigilância Epidemiológica, Desigualdades sociais; Big data; Saúde pública; Estatística; Ciência de dados, Dados ambientais e climáticos, Linguagem de programação R.

Waldomiro Barioni Júnior (Chair)

Embrapa Pecuária Sudeste
Minicurrículo

Betúlia de Morais Souto

Embrapa Sede
Minicurrículo

Wilson Tadeu Lopes da Silva

Embrapa Instrumentação
Minicurrículo

Daniel de Castro Victoria

Embrapa Agricultura Digital
Minicurrículo
A Empresa Brasileira de Pesquisa Agropecuária – EMBRAPA, vinculada ao Ministério da Agricultura, Pecuária e Abastecimento – MAPA, tem como missão “Viabilizar soluções de pesquisa, desenvolvimento e inovação para a sustentabilidade da agricultura, em benefício da sociedade brasileira”. A EMBRAPA implantou na empresa a politica vinculada a Agenda 2030 da ONU que procura alinhar as suas ações de pesquisa a cada um dos 17 ODS de forma a promover a agropecuária brasileira como um importante setor para o protagonismo do desenvolvimento humano, econômico e ambiental, com foco na segurança alimentar e em alimentos seguros, produzidos com responsabilidade social e saúde única. A Embrapa instituiu a sua Rede ODS com olhar corporativo, tanto estratégico como operacional. Durante a sessão será feito uma abordagem geral sobre os ODS, suas metas e indicadores, com destaque de alguns casos de sucesso, de tecnologias e ações, desenvolvidas pela Embrapa, associadas a um ou mais ODS. Serão discutidas, também, algumas estatísticas dos ODS a nível mundial. Bem como, de que maneira a ciência de dados pode auxiliar no cumprimento das metas.

Palavras-chave:  Agenda 2030, ODS, Agricultura, Sustentabilidade e Embrapa

Doris Satie Maruyama Fontes (Chair)

CONRE-3
Minicurrículo

Geovane Carlos Barbosa

IFES
Minicurrículo

Mário Hissamitsu Tarumoto

Unesp
Minicurrículo
Estamos vivendo uma era onde, de forma muito rápida, a tecnologia vem ganhando espaço no cotidiano do cidadão, seja dentro das escolas, do mercado de trabalho, no lazer, no convívio familiar. No entanto, grande parte dessas tecnologias demanda um mínimo de conhecimento técnico e/ou cultural do usuário para melhor aproveitamento da “inteligência artificial”. Vamos dizer que as novas tecnologias demandam um Pensamento Crítico ou Pensamento Estatístico minimamente desenvolvido do usuário. Um ChatGPT só produzirá uma resposta aproveitável se o prompt tiver sido bem elaborado. No entanto, para elaborar um prompt aproveitável, é necessário que o usuário tenha um mínimo de conhecimento do assunto. Uma parte significante dos problemas hoje gira em torno da dificuldade de se desenvolver pensamentos lógicos, principalmente pela falta de compreensão numérica (numeracia). As falhas no aprendizado iniciam-se já no EF1 por um ensino fraco em matemática e, muito pior, senão nulo, em estatística e probabilidade, que vai seguir se agravando ao longo de todo o EF2 e EM. Quando o jovem ingressa num curso superior, na grande maioria dos cursos, a estatística e probabilidade serão lecionadas como curso introdutório. No entanto, o formato frequentemente utilizado, baseado em modelos dos anos 70 ou 80, além de não atrair a atenção dos alunos, exige um conhecimento mínimo de matemática que os alunos nunca tiveram. Mais uma etapa onde há desperdício de oportunidade para aprender a pensar criticamente. Assim, uma EDUCAÇÃO DE QUALIDADE, sobretudo em Matemática, Estatística e Probabilidade, é fundamental para que cada pessoa possa exercer plenamente a sua cidadania, seja nas decisões pessoais para sua sobrevivência, seja na leitura de notícias e ter capacidade/discernimento para decidir se é legítimo ou fake-news.

Palavras-chave: ensino de estatística; uso de tecnologias para ensino; pensamento crítico e cidadania; pensamento estatístico.

Festa RBras 70 anos

Café

Sessão Temática 3, Mesa Redonda 2 e Tutorial 1

Luiz Alexandre Peternelli (Chair)

UFV
Minicurrículo

Maicon Nardino

UFV
Minicurrículo

Tiago Olivoto

UFSC
Minicurrículo
O aumento populacional gera a necessidade de aumento da oferta de alimentos dos mais diversos. Em especial, em se tratando de alimentos de origem vegetal, destacam-se diversas culturas como o milho, a soja, o trigo e a cana-de-açúcar. Especificamente, o trigo é a base para a produção de pães e massas alimentícias, enquanto que a cana-de-açúcar contribui tanto para a produção de açúcar quanto para etanol. O aumento da produção alimentícia sem maiores danos ou invasões de áreas é possível quando se pensa no aumento da produtividade, de modo mais eficiente e econômico. Nesse sentido podemos falar sobre o melhoramento como forma de  melhorar a oferta de alimentos sem ter que aumentar a área cultivada, mas sim melhorando a produtividade por meio de variedades geneticamente superiores. Atualmente tem-se buscado otimizar os programas de melhoramento genético por  meio de técnicas de fenotipagem de alto rendimento e que, por meio de algoritmos computacionais, possam auxiliar o melhorista na tomada de decisão quanto à seleção dos genótipos mais adequados. Nesta sessão temática, serão abordados exemplos de aplicação, na cultura do trigo e da cana-de-açúcar, de uso de tecnologias de imagens multiespectrais e de espectros no infravermelho próximo como meio de otimizar as coletas de dados “indiretos” para seleção de genótipos nas etapas iniciais dos programas de melhoramento. Fechando a sessão, será apresentado um pacote computacional que permite, de maneira fácil, rápida e eficiente, as análises dos dados obtidos de imagens digitais.

Palavras-chave: eficiência de seleção; ganho genético; modelos de predição.

Clécio da Silva Ferreira (Chair)

UFJF e Diretoria da ABE
Minicurrículo

Fernanda Schumacher

Ohio State University, US
Minicurrículo

Márcio Diniz

Mount Sinai, NY
Minicurrículo

Victor Hugo Lachos

University of Connecticut, US
Minicurrículo
O objetivo é discutir o uso de novas tecnologias baseadas em inteligência artificial no ambiente de trabalho, tanto em termos de pesquisa como em aplicações.

Palavras-chave: ChatGPT, Inteligência artificial, ensaios clínicos.

Fernando Almeida Barbalho

Ministério da Fazenda
Minicurrículo
Com base nos dados do Censo 2022 divulgados pelo IBGE, é possível conduzir análises detalhadas considerando características dos domicílios, acesso a redes de água, presença de banheiros, tipos de esgotamento sanitário, bem como informações sobre cor e raça dos moradores e a localização regional das  residências, incluindo favelas. Esses dados permitem um panorama abrangente das desigualdades no acesso a recursos básicos em diferentes cidades brasileiras.  O tutorial proposto seguirá um fluxo estruturado, começando com a coleta automática de dados usando o pacote R {sidrar}, avançando para uma análise exploratória de dados para compreender padrões e tendências, e culminando em  análises avançadas, como a clusterização de cidades com base em critérios de acesso a água e saneamento. O objetivo é capacitar os participantes a realizar análises robustas e aprofundadas, que possam embasar políticas públicas e  intervenções direcionadas para melhorar o acesso equitativo a esses recursos essenciais. 

Palavras-chave: Linguagem de Programação R, ODS 6, ODS 10, SIDRA, Censo 2022.

Conferência 3

C3 - Continuous monitoring of delayed outcomes in basket trials

Márcio Diniz

Mount Sinai, NY
Minicurrículo

Precision medicine has led to a paradigm shift, enabling the development of targeted drugs that are agnostic to the tumor location. In this context, basket trials aim to identify which tumor types – or baskets – benefit from the targeted therapy among patients with the same molecular marker or mutation. We propose a continuous monitoring framework for basket trials to increase the likelihood of early identification of non-promising baskets. Although existent Bayesian trial designs allow multiple interim analyses, most are computationally intensive and do not address delayed outcomes that are typical for targeted treatments such as immunotherapies. To address these limitations, we leverage the Bayesian empirical approach proposed by Fujiwara et al. that has low computational cost, and built upon the ideas of Cai et al to handle multiple interim analyses via multiple imputation. We compare operating characteristics of five different strategies for handling delayed outcomes in an extensive simulation study, using the strategy where trial accrual is paused until complete data is observed as a benchmark. Practical recommendations for designing basket trials with continuous monitoring using a delayed outcome are provided.

Miniconferência 2

Y2 - Abordagem Bayesiana para a Predição do Estoque de Carbono em Florestas Plantadas

Fábio Prataviera

ESALQ/USP
Minicurrículo

O estoque de carbono em florestas plantadas desempenha um papel fundamental no sequestro de carbono e na mitigação das mudanças climáticas (ODS 13). Modelar e prever essa variável de forma precisa é importante para o planejamento sustentável e a tomada de decisões estratégicas no manejo florestal. Neste estudo, propomos uma abordagem bayesiana para a predição do estoque de carbono, explorando a flexibilidade dos Modelos Aditivos Bayesianos para Localização, Escala e Forma (BAMLSS). Essa metodologia permite capturar relações complexas entre variáveis ambientais, estruturando a incerteza de forma mais robusta e incorporando efeitos suavizados sem pressuposições rígidas sobre a forma das relações. Além disso, analisamos a influência e o comportamento de diferentes fatores para o carbono sequestrado na biomassa vegetal, como a idade das árvores, características do solo e condições climáticas. A modelagem bayesiana possibilita uma inferência robusta e interpretável, oferecendo estimativas para a predição e monitoramento do carbono em plantações florestais. Dessa forma, o estudo busca quantificar o carbono armazenado em florestas plantadas, ressaltando seu papel essencial na mitigação dos gases de efeito estufa.

Palavras-chave: BAMLSS; Manejo Florestal; Modelagem Bayesiana; Mudanças Climáticas; Sequestro de Carbono.

Conferência 4

C4 - Modelagem Estatística de Redes Complexas

Andressa Cerqueira

UFSCar
Minicurrículo

Redes complexas têm recebido uma grande atenção da comunidade estatística, especialmente no contexto de analisar e descrever as interações de sistemas complexos aleatórios. Redes estão por toda parte, desde redes sociais até redes biológicas e sistemas de transporte. No entanto, compreender e analisar essas redes complexas é um desafio científico. Nesta palestra discutiremos como técnicas estatísticas nos permitem desvendar os padrões subjacentes, identificar comunidades, medir a robustez e prever o comportamento futuro das redes complexas.

Café

Sessão Temática 4, Mesa Redonda 3 e Tutorial 1

Patricia Emilia Braga (Chair)

Butantan
Minicurrículo

Elizabeth Gonzalez Patiño

Butantan
Minicurrículo

João Italo Dias França

Butantan
Minicurrículo

Marcos Alves De Lima

Butantan
Minicurrículo

Marco Antonio De Oliveira

Butantan
Minicurrículo
A vacina é uma estratégia eficiente de prevenção primária contra diversas doenças. No processo de desenvolvimento de uma nova vacina, são empregados métodos estatísticos para avaliar a relação risco/benefício.  O Instituto Butantan (IB) é o principal produtor de imunobiológicos do Brasil, trata-se de um grande centro de referência em: pesquisas biológicas, produção de soros e vacinas. O IB possui como objetivo pesquisar, desenvolver, fabricar e fornecer produtos e serviços para a saúde da população, além de ter como política: melhorar a eficiência na produção de biológicos, intensificar a produção de biológicos buscando parcerias, buscar a melhoria contínua do sistema de gestão, minimizar os desvios dos processos produtivos e divulgar e popularizar o ensino de ciências. Assim o IB visa proteger a saúde pública e proporcionar o acesso a vacinas para todos.  O IB, dentro do processo de desenvolvimento de imunobiológicos, realiza ensaios clínicos de Fase I, II, III e IV. Nesses estudos são avaliados desfechos tais como: segurança, eficácia/efetividade e imunogenicidade. Para a avaliação destes desfechos são aplicados métodos estatísticos que subsidiam as tomadas de decisão para aprovação da nova vacina junto à ANVISA.  Nesta sessão temática, iremos apresentar alguns estudos desenvolvidos, pelo IB, contra COVID-19, infecção pelo vírus da dengue e influenza, com ênfase nos delineamentos dos estudos e nas metodologias empregadas.  Ao final, espera-se que os participantes desta sessão temática tenham acesso a aplicações da ciência estatística em estudos reais de relevância à saúde pública.

Palavras-chave: COVID-19; vacinas; Dengue; Influenza; Saúde pública; Ensaio clínico; Estatística.

Rafaela Figueiredo Rodrigues (Chair)

Unifal-MG
Minicurrículo

Eric Batista Ferreira

Unifal-MG
Minicurrículo

Tales Jesus Fernandes

UFLA
Minicurrículo
A revista científica Sigmae, que desde 2012 contribui para o avanço da Matemática e Estatística por meio da divulgação de pesquisas de qualidade, propõe a realização de uma mesa redonda para explorar o impacto das tecnologias emergentes e novas práticas na comunicação acadêmica. Com o tema Publicações Científicas, Inteligência Artificial e Pré prints, a ideia da mesa é buscar reunir editores experientes para debater os desdobramentos dessa interseção tecnológica e metodológica.  A mesa redonda contará com a participação de três editores de revistas científicas e um moderador, de diferentes áreas, que discutirão os seguintes aspectos: 1) a influência da inteligência artificial nas publicações científicas;  2) o papel dos pré-prints no ciclo de publicação; e 3) como as revistas podem se posicionar. A discussão será moderada por uma pesquisadora, garantindo que os debates abordem perspectivas variadas e atendam às demandas do público presente. A revista Sigmae propõe essa atividade como uma forma de fomentar reflexões relevantes para a comunidade acadêmica, promovendo o diálogo sobre como as publicações científicas podem evoluir em tempos de mudanças tecnológicas aceleradas.  Espera-se que o evento ofereça insights práticos e estratégicos tanto para pesquisadores quanto para outros atores envolvidos no ecossistema da comunicação científica, contribuindo para o aperfeiçoamento das práticas editoriais e a adoção de soluções inovadoras

Palavras-chave: Publicações Científicas; Inteligência Artificial; Pré-prints; Revisão Editorial; Comunicação Acadêmica.

Jodavid de Araújo Ferreira

UFPE
Minicurrículo
Neste tutorial, será utilizado uma abordagem para fazer correspondência de imagens utilizando a similaridade do cosseno com o algoritmo Vision Transformer (ViT). O objetivo é demonstrar uma técnica de deep learning para realizar correspondência de imagens, que se refere ao processo de identificar e emparelhar partes semelhantes ou correspondentes em duas ou mais imagens. Esta tarefa pode ser considerada complexa devido a variações de iluminação, ângulo de captura e qualidade da imagem, especialmente em cenários do mundo real, como o reconhecimento de objetos, animais ou pessoas em diferentes imagens. Assim, este tutorial tem como objetivo abordar as etapas de pré-processamento de imagens, geração de embeddings usando Vision Transformers e cálculo de similaridade através da similaridade do cosseno com a linguagem de programação Python. Espera-se que, ao final, os participantes entendam como aplicar esses métodos tanto em contextos acadêmicos quanto práticos no Mercado de Trabalho.

Palavras-chave: Vision Transformers, similaridade de imagens, deep learning, embeddings, Python.

Sessão Pôsteres 1

Na SP1, serão apresentados os trabalhos das seguintes áreas temáticas:

  1. Estatística Aplicada em Agronomia e Biologia 1
  2. Estatística Aplicada em Ciências Médicas, Saúde e Meio Ambiente
  3. Estatística Multivariada
  4. Geoestatística
  5. Inferência Bayesiana
  6. Inferência Estatística
  7. Modelos de Regressão
  8. Séries Temporais e Econometria


Veja a lista completa das apresentações da SP1 (terça-feira, dia 05/08) clicando neste link.

Comunicações Orais 1 a 4

CO1 - Estatística Aplicada em Agronomia e Biologia

Autores
Elisângela Aparecida da Silva Lizzi           Marcus Vinicius da Silva Rodrigues            Sandriele Aparecida Noriler            Glaucia Maria Bressan            Admilton Gonçalves de Oliveira Junior

Este estudo investigou as relações filogenéticas de linhagens de Bacillus nitratireducens com abordagens estatísticas computacionais avançadas de modelos evolutivos usando inferência clássicabayesiana. Foram analisados 19 genomas (14 do GenBank e 5 inéditos) e sequências dos genes 16S rRNA (conservado) e gyrB (variável), com B. proteolyticus como grupo externo. Os modelos probabilísticos evolutivos de substituição como TN+F para gyrB; HKY para 16S rRNA e revelaram alta concordância entre as topologias geradas por genomas completos e genes concatenados, com apoio computacional do IQTree e MrBayes, com uso de estimadores de máxima verossimilhança e simulação de Monte Carlo em Cadeias de Markov. A análise demonstrou que todas as linhagens pertencem à mesma espécie, com valores de suporte robustos. O gene gyrB forneceu maior resolução filogenética intraespécie em comparação ao 16S rRNA, cuja baixa variabilidade limitou a discriminação de linhagens próximas. Os resultados destacam a eficácia de abordagens multi-locus combinando marcadores com distintas taxas evolutivas, com aplicações em taxonomia microbiana e biotecnologia. A robustez e concordância das análises filogenéticas usando inferência bayesiana baseada em simulações de MCMC mostrou uma análise conservadora para reconstruir as relações evolutivas entre as linhagens estudadas, em comparação e complemento com métodos evolutivos de inferência clássica. Conclui-se que esses resultados destacam como a integração de métodos estatísticos avançados, inferência clássica e bayesiana dentro do contexto da microbiologia, com marcadores genéticos complementares mostra a elucidação de relações evolutivas em Bacillus nitratireducens usando modelos probabilísticos evolutivos. 

Palavras-chave: Modelos probabilísticos evolutivos; Árvores Filogenéticas; Inferência Clássica e Bayesiana; Bacillus nitratireducens.

Autores
Tiago Olivoto           Carlos Eduardo Forcelini Assoni            Lalesca Dadam Gomes          Luiz Paulo da Silva         
Matheus Lopes Machado          Kenji da Cruz Konno          Isabela Martins Ghizoni          Maria Laura Faustino Monteiro          Kamilly Vitória Siqueira Tonet          Leonardo Talavera Campos          Analu Mantovani

A linhaça (Linum usitatissimum L.) é uma cultura de crescente interesse agronômico e funcional, com aplicações na alimentação humana, animal e na indústria. Apesar do seu potencial, a produção de linhaça no Brasil ainda é limitada, reflexo da escassez de cultivares adaptadas e do baixo investimento em pesquisa e desenvolvimento. Para contribuir com o avanço dessa cultura, o Núcleo de Estudos e Pesquisas em Experimentação e Melhoramento Vegetal (NEPEM) iniciou um programa de melhoramento genético de linhaça no litoral sul do Brasil. Neste trabalho, avaliouse a diversidade fenotípica e os componentes de variância de 40 genótipos oriundos de duas populações contrastantes (Dourada e Marrom), conduzidos em delineamento de blocos aumentados, utilizando a cultivar ST PIONEIRA como testemunha. Foram mensurados dez caracteres agronômicos, e as análises estatísticas foram realizadas por meio de modelos lineares mistos. As herdabilidades em sentido amplo (H²) variaram de 0,485 a 0,837, com valores elevados para altura de planta (H² = 0,837) e número de cápsulas (H² = 0,701), indicando bom potencial de resposta à seleção. A variância intra-genotípica foi próxima de zero para a maioria das características, refletindo boa uniformidade fenotípica. A análise de agrupamento evidenciou variabilidade genética, mesmo se tratando de um painel com genótipos avançados, subsidiando a escolha estratégica de genótipos para cruzamentos dirigidos, como G69, G93 e G145 (Dourada), e G72, G13, G29 e G4 (Marrom). Os resultados demonstram o potencial do programa em gerar cultivares superiores e adaptadas às condições brasileiras, contribuindo para o fortalecimento da cadeia produtiva da cultura no país. 

Palavras-chave: Linum usitatissimum L; alimento funcional; análise multivariada; melhoramento vegetal.

Autores
Carlos Eduardo Forcelini Assoni          Kamilly Siqueira Tonet         Lalesca Dadam Gomes         Luiz Paulo da Silva         Matheus Lopes Machado         Leonardo Talavera Campos         Analu Mantovani         Tiago Olivoto

O melhoramento genético da linhaça (Linum usitatissimum L.) é essencial para aumentar a resiliência das culturas frente à instabilidade climática e impulsionar a produção sustentável de grãos com elevado valor nutricional e comercial. Este estudo teve como objetivo aplicar o índice MGIDI (Multi-trait Genotype-Ideotype Distance Index) para a seleção de genótipos superiores com base em múltiplas características agronômicas. O experimento foi conduzido em Campos Novos (SC), em 2024, utilizando delineamento de blocos aumentados, com 41 genótipos (40 linhagens e uma testemunha comercial) de linhaça marrom e dourada. Foram mensuradas nove caracteres agronômicas, incluindo rendimento de grãos por planta e componentes de rendimento como número de grãos e cápsulas por planta. A seleção foi realizada com o índice MGIDI em dois cenários: com e sem atribuição de pesos (peso 5 para massa de grãos e 1 para as demais), adotando-se uma pressão de seleção de 25%. As análises foram realizadas no software R, utilizando os pacotes metan e tidyverse. Os resultados demonstraram que o MGIDI foi eficiente na identificação de genótipos superiores, sendo G13 (marrom) e G69D (dourada) os genótipos que se destacaram. O G29 foi selecionado apenas com pesos, indicando a importância da ponderação para priorizar características estratégicas. O G69D obteve o maior rendimento de grãos (5,69 g), superando a testemunha ST_PIONEIRA (4,16 g). Os maiores diferenciais de seleção foram observados para massa de grãos e massa de mil grãos, especialmente com pesos. Conclui-se que o uso do MGIDI, com ou sem ponderações, é uma ferramenta robusta e eficaz para apoiar decisões em programas de melhoramento da linhaça. 

Palavras-chave: MGIDI; Linum usitatissimum L.; melhoramento genético; seleção. 

Autores
Lucas Coelho da Silva      Luiz Alexandre Peternelli

Os índices de vegetação (IVs) são combinações matemáticas de duas ou mais bandas espectrais, RGB, RedEDGE e NIR. Dada a grande variedade de possíveis IVs, surge a necessidade de selecionar aqueles que estão mais associados à produtividade. O Variable Selection Using Random Forest (VSURF) utiliza uma estratégia de seleção baseada no algoritmo Random Forest (RF), empregando o método stepwise com base na importância das variáveis. Este estudo utiliza o algoritmo VSURF para selecionar os IVs em cada estádio fenológico da soja mais associados a produtividade e comparar o desempenho preditivo das variáveis selecionadas com todas as variáveis, pelo algoritmo da RF. O experimento foi conduzido em delineamento de blocos casualizados, com 297 parcelas, distribuídas em três blocos. Foram capturadas 11 imagens, aproximadamente uma vez por semana, ao longo do ciclo da soja, a partir das quais foram calculados 36 IVs. A validação dos modelos foi realizada por meio de validação cruzada em 10 etapas, utilizando acurácia e área sob a curva ROC (AUC) como métricas de avaliação. Entre as variáveis mais selecionadas, destacam – se o NIR, NGBDI, o SIPI e o TGI. O modelo com variáveis selecionadas obteve acurácia de 0, 63 e AUC de 0,67, comparado a 0,62 e 0,65 do modelo completo. A fase do início do enchimento dos grãos  apresentou o melhor desempenho preditivo, com acurácia de 0,72 e AUC de 0,79. O VSURF demonstrou – se eficaz na seleção de variáveis, uma vez que manteve o desempenho preditivo semelhante ao modelo completo. 

Palavras-chave: classificação; curva ROC; multiespectral; Random Forest; sensoriamento remoto.

Autores
Marckis Lyandro Farias de Lima

O objetivo deste estudo foi avaliar a digestibilidade da dieta de éguas no terço final da gestação, alimentadas exclusivamente com forragem, e a utilização de fita de pesagem e equações da literatura para estimar o peso corporal. O experimento foi realizado na Universidade Federal da Paraíba, utilizando quatro éguas alimentadas com feno de capim-Tifton 85. O ensaio de digestibilidade durou cinco dias, e as fezes foram coletadas em dois turnos diários. O peso das éguas foi aferido semanalmente com balança comercial, fita métrica e equações, utilizando medidas biométricas (circunferência torácica, comprimento corporal, altura na cernelha, entre outras). A análise estatística incluiu testes de normalidade, homogeneidade de variâncias, e comparação dos dados com o teste de Kruskal-Wallis. O consumo de matéria seca foi, em média, de 1,57% do peso vivo, e a digestibilidade da matéria seca do feno foi de 56,18%. Os resultados mostraram que os métodos alternativos de pesagem diferem estatisticamente do peso real, mas ainda são úteis considerando sua praticidade e custo. A digestibilidade do feno foi considerada satisfatória e não impactou negativamente o desempenho das éguas. Conclui-se que, embora os métodos alternativos não sejam tão precisos quanto a balança, a fita métrica e as equações podem ser opções viáveis para estimar o peso de éguas gestantes, desde que aplicados com correções apropriadas.

Palavras-chave: equinos; gestante; morfometria; ganho de peso; condição corporal.

Autores
Cristiano Ferraz           João Eudes M. M. Torres

Brasil é um país com tradição centenária em Censos Agropecuários, realizados usualmente a cada dez anos, desde 1920. No entanto, é fato que entre censos, não existe ainda uma Pesquisa Nacional Agropecuária (PNAgro) que forneça informações sustentadas por um método probabilístico de amostragem. Estudos metodológicos de viabilidade e eficiência para uma PNAgro podem tender a adotar uma estratégia herdada da tradição exitosa brasileira de pesquisas domiciliares, à exemplo da PNADC, cujo foco está na identificação de estabelecimentos agropecuários a partir de endereços. Neste trabalho, uma estratégia distinta é apresentada, recomendada pela FAO – Organização das Nações Unidas para a Agricultura e Combate a Fome, com foco na identificação pelo monitoramento de uso do solo. As principais vantagens desta estratégia são discutidas, e uma proposta de planejamento amostral que a utiliza, baseada no uso de um cadastro de área de segmento quadrado, é investigada. Os resultados de um estudo de simulação computacional preliminar, com base em informações do Censo Agropecuário de 2017 para o município de Sorriso -MT, são apresentados. Os números observados, em conjunto com a experiência prática de outros países que já adotam a estratégia, dão suporte a viabilidade da proposta para o Brasil. 

Palavras-chave: Cadastro de área; Segmentos quadrados ponderados; Cadastro duplo.

CO2 - Modelos de Regressão, MLG e modelos não lineares

Autores
João Victor Bastos de Freitas             Caio Lucidius Naberezny Azevedo

For binary regression, the use of symmetric link functions is not appropriate when we have evidence that the probability of success increases at a different rate than decreases. In these cases, the use of link functions based on the cumulative distribution function of a skewed and heavy-tailed distribution can be useful. The most popular choice is some scale mixtures of skew-normal distributions. This family of distributions can have some identifiability problems caused by the so-called direct parameterization. To circumvent this problem, in this paper we proposed link functions based on the scale mixtures of skew-normal distributions under the centered parameterization. Also, in binary modelling with skewed link functions, we may have another identifiability problem caused by the presence of the intercept and skewness parameters. Furthermore, we proposed to fix the sign of the skewness parameter, which is a new perspective in the literature to deal with the identifiability problem in skewed link functions. Bayesian inference using MCMC algorithms and residual analysis are developed. Simulation studies are carried out to evaluate the performance of the model. The methodology is applied to a heart disease data

Keywords: Binary regression; Scale mixtures of skew-normal distributions; Centered parameterization; Bayesian inference; Skewed link functions.

Autores
Matheus Oliveira de Castro       Caio Lucidius Naberezny Azevedo      Juvêncio Santos Nobre

Quantile regression (QR) models offer an interesting alternative compared with ordinary regression models for the response mean. Besides allowing a more appropriate characterization of the response distribution, the former is less sensitive to outlying observations than the latter. Indeed, the QR models allow modeling other characteristics of the response distribution, such as the lower and/or upper tails. However, in the presence of outlying observations, the estimates can still be affected. In this context, a robust quantile regression model for bounded responses is developed, considering the Kumaraswamy Rectangular (KR) distribution. The KR model corresponds to a finite mixture structure similar to the Beta Rectangular distribution. That is, the KR distribution has heavier tails compared to the Kumaraswamy model. Indeed, we show that the correspondent KR quantile regression model is more robust and flexible than the usual Kumaraswamy one. Bayesian inference, which includes parameter estimation, model fit assessment, model comparison, and influence analysis, is developed through a hybrid-based MCMC approach. To link both conditional and marginal quantiles in terms of a regression structure, a twostep estimation algorithm under a Bayesian approach is proposed to obtain samples from the posterior distributions. Our proposal showed to be robust against outlying observations related to the response without adding too much complexity to the estimation process. Its performance is validated through three simulation studies, highlighting its accuracy and flexibility. Finally, we apply the proposed model to two real datasets involving socio-economic indicators in Brazil, demonstrating its practical utility and comparative advantages over existing alternatives.

Keywords: Kumaraswamy Rectangular; Double bounded response; Bayesian inference; MCMC algorithms; Latent variables.

Autores
Vinicius Mayrink            Wagner Barreto-Souza           Alexandre B. Simas

Beta regression is widely used for modeling continuous bounded data, with few competitors offering similar flexibility. The normalized inverse-Gaussian (N-IG) process, a Bayesian alternative to the Dirichlet process, has attracted growing interest; however, its univariate distribution remains largely unexplored in the context of classical inference. This study introduces bessel regression, based on the univariate N-IG, as a novel alternative to the beta regression model. Parameter estimation is performed via an EM algorithm, and inference procedures are outlined. We propose a practical model selection criterion to distinguish between bessel and beta regressions. Additionally, we present the R package bbreg for fitting both models, which includes tools for assessing model adequacy and selection. A simulation study evaluates performance under model misspecification, and an empirical example illustrates the comparison between bessel and beta regressions using bbreg. The first author acknowledges research support from CNPq, CAPES, and FAPEMIG. 

Keywords: beta regression; EM algorithm; normalised inverse-Gaussian distribution; misspecification; model selection. 

Autores
Keyliane Travassos            Larissa A. Matos              Fernanda L. Schumacher

Linear mixed models are often used to analyze studies with repeated measurements over time, where the data present a correlation between observations of the same individual. However, one of the main challenges in using these models is correctly defining the covariance structure associated with error and random effects. In this context, we obtain the sandwich variance estimator as a robust alternative to estimate the standard error in the scale mixture of skew-normal linear mixed models. We present the definition of the estimator, its derivation for this model, and its practical implementation. In addition, through simulation studies, we evaluate its performance in different scenarios, demonstrating its ability to provide reliable inferences even when the model or the covariance structure is misspecified. 

Keywords: sandwich variance estimator; linear mixed-effects model; scale mixture of skew-normal distributions.

Autores
Emerson Antonio Rocha Pazeto             Poliano Bastos da Cruz              Alessandro José Queiroz Sarnaglia              Fabio Alexander Fajardo Molinares

Nos últimos anos, o setor público brasileiro tem passado por transformações relevantes sob o ponto de vista da transparência e compliance. Por isso, os gastos públicos cada vez mais têm sido objeto de interesse da sociedade. Este trabalho focou na análise estatística de processos licitatórios, mais especificamente na discriminação não supervisionada entre processos “eficientes” e “ineficientes”. Foi utilizado como indicador de ineficiência o número de aditivos contratuais. Após a coleta e preparação dos dados, foram identificadas evidências de sobredispersão e excesso de zeros. A fim de resolver esse problema, propôs-se um modelo de Misturas de Regressões Binomiais Negativas, o qual foi ajustado com a aplicação do algoritmo EM. Esse algoritmo tornou o modelo capaz de classificar as observações em dois grupos com as características desejadas. Com o fito de mostrar a efetividade do modelo, foram realizadas comparações com modelos de regressões Poisson, Binomial Negativa, Poisson Inflada de Zeros e Binomial Negativa Inflada de Zeros. Os resultados mostraram que o modelo proposto se ajustou satisfatoriamente aos dados e apresentou o melhor desempenho associado à parcimônia em termos do Critério de Informação Bayesiano. Esse resultado torna-se interessante na medida que o modelo proposto tem potencial de se transformar em uma ferramenta de gestão pública capaz de identificar probabilidades de um processo ser “ineficiente” antes mesmo de ser contratado 

Palavras-chave: Aditivos, Ineficiência, Regressões, Classificação não Supervisionada, processos de contratações ineficientes, Infladas de Zeros, Binomial Negativa, Poisson, Algoritmo Expectation-Maximization.

Autores
Silvia M. Freitas            Poliano Bastos da Cruz              Lida Fallah             Clarice G.B. Demétrio             John Hinde

We consider discrete mortality data for groups of individuals observed over time. The fitting cumulative mortality curves as a function of time involves the longitudinal modelling of the multinomial response. Typically, such data exhibit greater variation than predicted by the multinomial distribution (overdispersion). To model the extra-multinomial variation, we consider a Dirichlet-multinomial model, a random intercept model and a random intercept and slope model. We construct asymptotic and robust covariance matrix estimators for the regression parameter standard errors. Applying these models to a specific insect bioassay of the fungus Beauveria bassiana, we note some simple relationships in the results and explore why these are simply a consequence of the data structure. Fitted models are used to make inferences on the effectiveness and consistency of different isolates of the fungus to provide recommendations for its use as a biological control in the field. 

Keywords: Dirichlet-multinomial; Extra-multinomial variation; Generalized esti mating equations; Generalized linear models; Random effects models.

CO3 - Análise de Sobrevivência

Autores
Valdemiro Piedade Vigas            Edwin M. M. Ortega;  Gauss M. Cordeiro           Giovani L. Silva          
Paulo
C. dos Santos Junior

A escolha do mecanismo de censura é muito importante quando se analisa dados de sobrevivência, pois, em algumas situações práticas, existe dependência entre os tempos de falha e de censura, o que contraria a suposição de censura não-informativa. O presente trabalho propõe uma regressão para dados censurados na presença de censura informativa, com base na família de distribuições odd log-logística generalizada. O modelo proposto se baseia na suposição de que os tempos de falha e de censura são condicionalmente independentes, dado um termo de fragilidade. A escolha da família odd log-logística generalizada para os tempos de falha e de censura é justificada pelo fato de estender algumas distribuições já consolidadas na área de sobrevivência e, simultaneamente, por oferecer grande flexibilidade na modelagem de dados práticos, além da capacidade de representar diversas formas da função de risco, incluindo a bimodal. O método de máxima verossimilhança é utilizado para estimar os parâmetros do modelo. Para diferentes configurações de parâmetros e tamanhos amostrais, são realizadas simulações com o objetivo de analisar o comportamento das estimativas de máxima verossimilhança. Aplicação a um conjunto de dados reais ilustra a utilidade do modelo proposto.

Palavras-chave: Censura informativa; Distribuição odd log-logística generalizada; Fragilidade; Modelo de regressão.

Autores
Katy Rocio Cruz Molina              Joaquín Martínez-Minaya               Danilo Alvares               Vera Tomazella

Os modelos de sobrevivência com a presença do termo de fragilidade são ferramentas essenciais para capturar a heterogeneidade não observada entre indivíduos em estudos clínicos e epidemiológicos. Propõe-se um modelo de sobrevivência Bayesiano em que a fragilidade discreta é modelada utilizando a versão Hurdle da distribuição de série de potência zero-modificada (HSPZM).  A distribuição HSPMZ é estruturada de forma a permitir que um dos parâmetros modele a proporção de indivíduos imunes ao risco, frequentemente interpretada como a fração de cura, enquanto outro parâmetro captura a heterogeneidade na suscetibilidade entre os indivíduos. Essa capacidade combinada confere ao modelo a flexibilidade necessária para representar realisticamente cenários com ou sem fração de cura. Para a estimação dos parâmetros, adotou-se uma metodologia Bayesiana, que possibilita a incorporação de conhecimento prévio e fornece inferências robustas, especialmente útil em amostras de tamanho limitado. Como aplicação prática, o modelo proposto foi ajustado a dados de sobrevivência de pacientes com câncer de pulmão. Este é um cenário clinicamente relevante, onde a variabilidade individual influencia significativamente a progressão da doença e a resposta ao tratamento. Os resultados indicam que a abordagem proposta oferece um ajuste superior aos dados em comparação aos modelos de fragilidade convencionais, além de permitir uma interpretação mais refinada do impacto da heterogeneidade na trajetória de sobrevivência dos pacientes. 

Palavras-chave: Câncer de pulmão; Distribuição HSPZM; Inferência Bayesiana; Modelo de fragilidade discreta.

Autores
 Jonathan K. J. Vasquez                 Vera Tomazella              Pedro Rafael D. Marinho 

Este estudo propõe um modelo de regressão para análise de sobrevivência incorporando fragilidade discreta com base na distribuição Waring, combinada com um mecanismo de ativação aleatória. Identificar as causas primárias de eventos críticos continua sendo um desafio significativo, particularmente em cenários com etiologia multifatorial. A distribuição Waring fornece uma estrutura robusta para capturar a heterogeneidade dos fatores de risco e modelar a fração de cura de forma mais realista. No modelo proposto, o número de causas latentes segue uma distribuição Waring, enquanto os tempos de ativação dessas causas são modelados usando uma distribuição Weibull. A influência da ativação aleatória é examinada em termos de como ela afeta a dispersão distribucional e captura fontes internas e externas de variabilidade, frequentemente negligenciadas em modelos tradicionais. A abordagem metodológica se baseia em estudos anteriores enfatizando a importância da ativação na modelagem da taxa de cura. O desempenho do modelo será avaliado por meio de um estudo de simulação de Monte Carlo para explorar suas propriedades inferenciais em vários cenários. Além disso, a aplicabilidade prática da metodologia proposta será ilustrada por meio de uma aplicação a dados reais sobre pacientes com câncer de melanoma, destacando sua flexibilidade e capacidade de capturar estruturas de risco complexas. As descobertas ressaltam o potencial da distribuição de Waring em contextos biomédicos, contribuindo para o avanço de técnicas modernas em análise de sobrevivência. 

Palavras-chave: Modelo de Fragilidade, Distribuição de Waring, Análise de Sobrevivência, Causas de Risco, Esquemas de Ativação Aleatória, Fração de Cura.

Autores
Maurício dos Anjos da Silva             Marciel Lelis Duarte           Nerilson Terra Santos           Sebastião Martins Filho

O desmatamento é um problema mundial relacionado a diversos fatores ecológicos, climáticos e socioeconômicos. O presente trabalho objetivou analisar o efeito de variáveis socioeconômicas e ambientais no desmatamento no sul do Amazonas, por meio da aplicação de métodos de análise de sobrevivência e análise espacial. Além disso, é igualmente relevante inserir a dependência espacial dos dados no modelo e avaliar o efeito aleatório espacial associado a cada grupo de área analisado. Em primeira análise, o tempo até o desmatamento em cada unidade de área foi estimado por meio do método não paramétrico de Kaplan Meier, considerando o nível de cada covariável para análise separadamente. Posteriormente, todas as covariáveis foram inseridas na análise, para uma avaliação em conjunto. A dependência espacial observada nos dados de desmatamento foi modelada por meio do modelo ICAR, considerando uma matriz de vizinhanças que captura a dependência espacial dos dados. Os efeitos espaciais associados a cada  grupo foram inseridos no modelo de fragilidade, com o intuito de capturar a dependência espacial. As variáveis unidades de conservação, terras indígenas e pastagem foram significativas e demonstraram uma importância maior para explicar o desmatamento na região. A magnitude dos efeitos aleatórios mostraram que regiões que fazem fronteira ao arco do desmatamento possuem um maior tempo esperado associado ao desmatamento e ligados a fatores não observados, não mensurados nos dados. Dessa maneira, os modelos de fragilidade são adequados para a modelagem do desmatamento. 

Palavras-chave: Modelos de fragilidade compartilhada; Modelagem Bayesiana; Modelo ICAR; Análise de vizinhança; Floresta Amazônica.

Autores
Rafael Toledo Costa de Almeida             Giovana Oliveira Silva              Edleide de Brito

Em análise de sobrevivência, geralmente o interesse está no tempo até a ocorrência de um evento, porém existem situações que o interesse está em mais de um evento e, além disso, a ocorrência de um dos eventos impede que os demais eventos aconteçam. Nesta situação, usa-se modelos que consideram a presença de eventos competitivos. Inicialmente, considerou-se eventos competitivos, dados censurados e modelo de regressão a partir da distribuição Weibull Generalizada. No estudo de simulação conduzido para diferentes combinações de valores dos parâmetros, tamanhos amostrais e percentuais de censura, observou-se que as estimativas obtidas por máxima verossimilhança apresentavam variâncias elevadas. Diante desse resultado, optou-se pelo modelo com restrição na distribuição de probabilidade. Adicionalmente, o bom desempenho deste modelo restrito foi verificado por meio de um novo estudo de simulação nos diversos cenários citados. Os resultados indicam que o modelo restrito apresentou estimativas precisas e com menor variância, com melhora significativa à medida que o tamanho da amostra aumenta. Testes de hipóteses para verificar a significância dos coeficientes de regressão foram aplicados utilizando a distribuição assintótica dos estimadores de máxima verossimilhança. Com o propósito de analisar a adequabilidade do modelo restrito, foi usado o resíduo quantile. Por fim, a metodologia foi aplicada ao conjunto de dados que trata da duração do vínculo empregatício de empresas privadas de Simões Filho (Bahia), em 2021, sendo tomado como eventos competitivos demissão e desligamento sem justa causa. 

Palavras-chave: Análise de Sobrevivência; Distribuição Weibull Generalizada; Evento competitivos; Resíduos; Simulação.

Autores
Natan Hilario da Silva             Adriano Kamimura Suzuki               Vicente Garibay Cancho               Josemar Rodrigues              Narayanaswamy Balakrishnan

Neste trabalho, generalizamos a aplicação dos modelos de cura por tempo de promoção para a inclusão de variáveis não estruturadas por meio de uma rede neural. Consideramos que o número de riscos competitivos segue uma distribuição Série de Potências Modificada, que generaliza distribuições como Poisson, Binomial Negativa, Poisson generalizada restrita, entre outras. A estimação é feita por meio do algoritmo EM. Estudos de simulação avaliam a convergência do modelo e a qualidade das métricas consideradas. Propomos uma nova métrica para a seleção de modelos de cura. Uma aplicação é feita utilizando tempos até o diagnóstico de pacientes de Alzheimer, flexibilizando modelos pré-existentes. 

Palavras-chave: análise de sobrevivência; modelos de cura; redes neurais; variáveis não-estruturadas; algoritmo EM.

CO4 - Séries Temporais, Análise espacial e Análise espaço-temporal

Autores
Nicoly Rodrigues da Costa            Paulo Emilio Costa Santos 

Este estudo visa modelar e prever os desembarques mensais do Katsuwonus pelamis (bonito-listrado) no Oceano Atlântico, utilizando modelos de séries temporais do tipo SARIMA e abordagens híbridas com redes neurais artificiais (RNA). Foram utilizados os dados da Tarefa II da ICCAT (International Commission for the Conservation of Atlantic Tunas), que organiza informações pesqueiras por espécie, mês, país, tipo de isca e local de pesca, segmentadas em quatro quadrantes espaciais (Q1 a Q4). Inicialmente foram ajustados modelos SARIMA para captura de componentes lineares da série temporal. Após avaliar os resíduos, e com o objetivo de captar padrões não lineares residuais, ajustou-se modelos híbridos SARIMA + RNA. A previsão final do modelo híbrido resulta da soma das previsões de ambas as etapas. Foram ajustados modelos individualmente para cada um dos quadrantes do Atlântico. A seguir, os desempenhos dos modelos foram avaliados por meio das métricas MAPE, MSE e MAE: Q1 e Q4 tiveram melhor desempenho com o SARIMA, Q2 e Q3 tiveram melhor desempenho com o modelo híbrido. Com base nos melhores modelos de cada quadrante, foi realizada a previsão dos desembarques para os 12 meses subsequentes. As previsões demonstraram boa aderência à tendência recente dos dados históricos, com variações notáveis entre quadrantes Q2 e Q4, que apresentaram maior volume e variabilidade. A abordagem híbrida mostrou-se promissora, especialmente quando havia sinais de não linearidade residual, o que é um diferencial em relação ao SARIMA. Essa flexibilidade evidencia a importância de avaliar múltiplas abordagens em problemas com diferentes padrões temporais e estruturais. 

Palavras-chave: Séries temporais; atuns; SARIMA; modelos híbridos; seleção de modelo.

Autores
Rafaela Rodrigues            Helena Mouriño              Valderio Anselmo Reisen 

Phytoplankton play a vital role in aquatic ecosystems, serving as a primary food source for a wide range of marine organisms. However, excessive nutrient input can lead to harmful algal blooms that produce toxic compounds, posing risks to marine birds, mammals, and humans. Among these, diatoms of the genus Pseudo-nitzschia are particularly concerning due to their ability to produce domoic acid—a potent neurotoxin responsible for outbreaks of Amnesic Shellfish Poisoning worldwide. Understanding the seasonal and spatial dynamics of Pseudo-nitzschia blooms is therefore essential for evaluating their ecological and public health impacts. This study analyzes weekly water samples collected in Cascais (Lisbon Bay) from June 2001 to May 2005 to determine Pseudo-nitzschia spp. concentrations. While previous research employed a Zero-Inflated Generalized Poisson Regression Model to characterize Pseudo-nitzschia variability and assess the influence of environmental factors such as sea surface temperature and upwelling indices, the present study extends the analysis by incorporating Generalized Autoregressive Conditional Heteroscedasticity (GARCH) models to capture time-series volatility. 

Keywords: Pseudo-nitzschia; Time series of counts; Overdispersion; Zero-Inflated Generalized Poisson distribution; GARCH models.

Autores
Renata Rojas Guerra       María Agustina Gonzalez

This work proposes a new generalized autoregressive score (GAS) model based on the Unit-Lindley distribution for modeling the Normalized Difference Vegetation Index (NDVI) curve throughout the soybean growth cycle. The NDVI is a widely used remote sensing indicator of vegetation health, with values naturally bounded between –1 and 1, making double-bounded continuous distributions particularly suitable for modeling its dynamics. The Unit-Lindley distribution is a one-parameter model for double-bounded random variables. One of its main advantages is the possibility of reparameterization in terms of the mean, enabling a flexible yet interpretable way to model the conditional expectation of NDVI over time. Another advantage of considering this distribution under the GAS framework is its parsimony when compared with the beta distribution, which is the most commonly used double-bounded GAS model in the literature. Parameters are estimated via conditional maximum likelihood, and a Monte Carlo simulation study is conducted to evaluate estimator performance in finite samples. The model’s predictive ability is assessed using MODIS satellite-derived real NDVI data from soybean fields in southern Córdoba, Argentina. This approach offers a novel contribution to the analysis of double-bounded time series, with practical applications in environmental monitoring and precision agriculture.

Keywords: double-bounded random variables; Generalized Autoregressive Score models; remote sensing; time series analysis; unit distributions; unit-Lindley distribution.

Autores
Alex Monito Nhancololo            Airlane Alencar Pereira               Giovani Festa Paludo            Katerine Zuniga          
 
André Silvestre Cuinica              Welson Antônio de Oliveira              Gean Damaceno               Elias Sabe                
Valderine  Ferreira             Minelda Arao Lhone             João Domingos Scalon

Since 2017, Mozambique’s Cabo Delgado province has experienced sustained insurgent violence. While the exploitation of mineral resources is frequently cited as a primary driver, this study challenges such oversimplified narratives through a spatio-temporal analysis spanning 2017–2024. By integrating Armed Conflict Location and Event Data with demographic variables from the U.S. Census International Database, the study employs Spatial Autoregressive with Autoregressive Disturbances and Geographically Weighted Regression models. These are combined with Generalized Autoregressive Moving Average forecasts to identify associated factors and project fatality trends through 2030. Results reveal that 76.9% of fatalities cluster near strategic resource hubs such as Palma’s gas projects, Balama’s graphite mines, and Mocímboa da Praia’s deep-water port, as well as in artisanal gold mining areas (Muidumbe and Nangade), coastal zones, and international borders. The Spatial Lag of X model (AIC: 8750.19) highlights border dynamics: Nampula border districts exhibit 36.2% lower fatality rates, while spillover effects amplify risks near internal borders and the Tanzanian border. Non-state armed groups including the Dyck Advisory Group, Islamic State Mozambique, and Southern African Development Community forces—demonstrate significantly higher fatality rates compared to Rwandan forces. Population growth correlates with increased fatalities, though socio-demographic factors, such as a higher female-to-male ratio, marginally attenuate this effect. Forecasts suggest declining post-2024 fatalities, signaling potential stabilization; however, biases from political underreporting necessitate caution.

Keywords: Armed conflict in northern Mozambique; fatality rate modeling;  SARAR; GARMA; Impacts of state and non-state armed forces in Cabo Delgado.

Autores
Alvaro Alexander Burbano Moreno

This study presents a Bayesian hierarchical model for analyzing spatially correlated functional data and handling irregularly spaced observations. The model uses Bernstein polynomial (BP) bases combined with autoregressive random effects, allowing for nuanced modeling of spatial correlations between sites and dependencies of observations within curves. Moreover, the proposed procedure introduces a distinct structure for the random effect component compared to previous works. Simulation studies conducted under various challenging scenarios verify the model’s robustness, demonstrating its capacity to accurately recover spatially dependent curves and predict observations at unmonitored locations. The model’s performance is further supported by its application to real-world data, specifically PM10 particulate matter measurements from a monitoring network in Mexico City. This application is of practical importance, as particles can penetrate the respiratory system and aggravate various health conditions. The model effectively predicts concentrations at unmonitored sites, with uncertainty estimates that reflect spatial variability across the domain. This new methodology provides a flexible framework for the FDA in spatial contexts and addresses challenges in analyzing irregular domains with potential applications in environmental monitoring. 

Keywords: Bayesian Hierarchical Modeling; Spatial Functional Data; Irregular Sampling; Bernstein Polynomials.

Autores
Francisco Gustavo-Silva              Cristele Chevalier               Marine Laval              Luc Courtrai               Alex Costa de Silva               Jacques Descloitres              Yamina Aimene              Adan Salazar               Audrey Minghelli               Vincent Vantrepotte               Paulo Duarte-Neto

This study proposes an innovative approach to analyzing aggregations of Sargassum spp. in the Western Mid-Atlantic Region (WCWA) using multifractal analysis of segmented images from the OLCI sensor of the Sentinel-3 satellite. Using products from the SargAlert project, classified into presence or absence of Sargassum, the methodology applied multifractal analysis to 289 image partitions to extract parameters such as dominant singularity (α0), spectrum asymmetry (f(Δα)), spectrum width (Δα) and lacunarity (Λ). The spatial distribution of these parameters made it possible to identify distinct morphological patterns associated with the density and organization of the aggregations. The results showed that the parameter α0 correlates with the amount of cover, while negative values of f(Δα) were associated with dense, spiral structures, possibly ocean vortices. The analysis also revealed morphologically coherent groupings such as absence of algae (SN), low density (QSN), dispersed distribution (SD), intense agglomeration (PREV), and spiral structures (VRT). The detection of VRT groups highlighted the multiscale complexity of these formations and their association with multiple oceanographic processes, such as turbulence and detachment of algal masses. This work contributes to advancing methods for the detection and spatial interpretation of Sargassum aggregations, offering new metrics for understanding ocean dynamics and mitigation strategies. 

Keywords: Dominant singularity; Vortices; Ocean dynamics; Central-West Atlantic.

Café

Sessões Temáticas 5 e 6 e Tutorial 3

Alfredo José Barreto Luiz (Chair)

Embrapa Meio Ambiente
Minicurrículo

José Eduardo Macedo Pezzopane

UFES
Minicurrículo

Fernando Antônio Macena da Silva

Embrapa
Cerrados
Minicurrículo
Com influências de diferentes comunidades, a Ciência de Dados evoluiu para fornecer percepções em muitos ambientes diferentes orientados por dados, incluindo as ciências agrária e climática. Nesta sessão, será apresentada uma breve revisão da Ciência de Dados e sua conexão com a agrometeorologia. Além disso, serão discutidos os rumos da área para quantificar os riscos das mudanças climáticas e discutidas algumas áreas chave de pesquisa em Estatística e métodos quantitativos na análise de riscos climáticos na agricultura. Especialistas explanarão sobre as técnicas usadas em zoneamentos agrícolas de risco climático, em análise de risco de doenças e de incêndios florestais e suas relações com as  variáveis agrometeorológicas e as mudanças climáticas. O objetivo será mostrar como a Ciência de Dados é vital na nossa luta contra as alterações climáticas, através da criação de  modelos e da análise de dados que permitem a avaliação de riscos, redução de perigos, adaptação às mudanças e orientação de políticas, na busca de um futuro sustentável.

Palavras-chave: Mudanças climáticas, análise de risco, agrometeorologia, zoneamento agrícola e florestal.

Marcos Oliveira Prates (Chair)

UFMG
Minicurrículo

Alexandre Loureiros Rodrigues

UFES
Minicurrículo

Deisy Morselli Gysi

UFPR
Minicurrículo
A integração entre a Estatística e a área da Saúde possui, há muitos anos, um papel crucial no desenvolvimento de métodos, técnicas e modelos estatísticos. Tais pesquisas, também impulsionam avanços significativos em pesquisa e prática clínica. Em um cenário de crescente complexidade dos dados de saúde e a facilidade da coleta dos mesmos provenientes de fontes como registros hospitalares, ensaios clínicos e dados de sensores, a Estatística fornece as ferramentas adequadas para transformar esses dados em informações que auxiliem à tomada de decisões e na formulação de políticas de saúde mais eficazes.  A necessidade de avanços em modelagem estatística para dados médicos torna-se evidente frente aos desafios contemporâneos, como a análise de dados de larga escala, dados espaciais e informações de alta dimensionalidade. Essas novas demandas exigem modelos estatísticos inovadores, capazes de lidar com a estrutura do sistema de saúde, heterogeneidade dos dados e com incertezas inerentes à fatores biológicos.  Além disso, a aplicação de métodos estatísticos na área da saúde é fundamental para alcançar os Objetivos de Desenvolvimento Sustentável (ODS) da ONU, fornecendo evidências e análises necessárias para enfrentar os desafios de saúde, reduzir as desigualdades e promover o bem-estar em uma escala global. Especificamente nossa proposta de Seção Temática apresenta técnicas estatísticas que atuam diretamente nas ODS 3, 10 e 17.

Palavras-chave: Aprendizado Estatístico, Biomarcadores, Câncer, Correspondência de Dados, Estatística  Espacial, Modelos de Linguagem de Grande Porte.

Beatriz Milz

UFABC
Minicurrículo
Este tutorial apresenta uma abordagem prática para acessar dados do SIDRA/IBGE diretamente no R, utilizando o pacote SIDRAR para interagir com a base de dados oficial do IBGE. Focaremos na obtenção da série histórica de Produção Agrícola Municipal (PAM) relacionadas à agricultura como exemplo prático, demonstrando como essas informações podem ser utilizadas para análises que contribuem com os Objetivos de Desenvolvimento Sustentável (ODS). Além disso, utilizaremos pacotes do tidyverse para organizar e transformar os dados, facilitando a preparação para análises mais complexas. O objetivo é capacitar os participantes a extrair dados por meio da API do SIDRA e prepará-los de maneira eficiente e estruturada. 

Palavras-chave:  importação de dados, produção agrícola municipal, tidyverse, séries históricas.

Espaço Parceiro - Grupo Autoglass

Do Dado à Ação: Como aplicamos Ciência de Dados para Gerar Resultados na Maxpar

Conferência 5

C5 - Statistical Pitfalls in Measuring Biological Aging with Epigenetic Clocks: Insights from a Chronic Disease Setting

Fernanda Schumacher

Ohio State University, US
Minicurrículo

The third goal of the United Nations 2030 Agenda for Sustainable Development is to “Ensure healthy lives and promote well-being for all at all ages”. Its targets are a good representation of how vast health care is, covering maternal mortality, epidemics of infectious diseases, premature mortality from chronic diseases, prevention and treatment of substance abuse, access to sexual and reproductive health care, and affordable health care, just to name a few. In addition to the essential and undeniable role of statisticians in measuring all the diverse indicators related to this goal, how can statisticians contribute to reaching the targets?

In this talk, I will focus on statistical challenges faced when working with chronic diseases, with particular emphasis on people with Multiple Sclerosis (MS). Beyond chronological age, biological age reflects the cumulative damage to a person’s cells over time and is increasingly recognized as a critical factor in understanding health disparities and the progression of chronic conditions. Several biomarkers have recently been proposed to measure biological age and assess the cumulative burden of aging, which directly affect not only life expectancy but also quality of life, especially for people with debilitating diseases. As one of the popular markers, epigenetic “clocks” are based on statistical and machine learning tools to detect DNA methylation (DNAm) patterns. 

Epigenetic modifications represent a reversible mechanism in regulating the function of the genome without altering the underlying DNA sequence and have been linked to aging through several factors, allowing DNAm to be affected by environmental exposures and lifestyle habits. Since the first proposed epigenetic clock model in 2011, multiple epigenetic clocks have been reported with increasing accuracy, precision, and broader application prospects in aging research. Still, they are based on regression coefficients determined on general training populations, which are then used for out-of-sample prediction. Commonly, the predictions are then regressed on chronological age and technical variables, and the corresponding residuals are called Epigenetic Age Acceleration (EAA), which are then often used for hypothesis testing. 

The lack of interval estimates for individual predictions, the availability of several algorithms, the lack of a gold standard measure of biological age, and the use of prediction-based inference add to the statistical challenges of these markers. This talk will discuss such challenges, illustrated using data from a clinical study on biological aging in people with MS. I will also discuss the role of statisticians in ensuring that such issues are properly considered, especially when such measures could evolve to be outcomes in clinical trials for anti-aging treatment and the prevention of chronic diseases progression.

Miniconferência 3

Y3 - Um novo modelo de fração cura com causas concorrentes Geométrica Zero-Inflacionada

Marcia Brandão

UFAM
Minicurrículo

Uma nova modelagem para análise de sobrevivência é proposta, ao considerar que o número de causas concorrentes relacionadas à ocorrência do evento de interesse pode ser correlacionado. Diferentemente da suposição tradicional de independência entre essas causas, o modelo reconhece a complexidade biológica observada em pacientes com câncer testicular, onde diferentes fatores interagem de forma não observável.

Especificamente, considera-se que o número de causas competitivas segue uma distribuição geométrica inflacionada em zero (ZIG) com dependência estrutural, permitindo capturar aspectos latentes específicos deste tipo de câncer que não podem ser diretamente quantificados. São apresentadas propriedades estatísticas do modelo, e a estimação dos parâmetros é realizada por intermédio do método da máxima verossimilhança.

Adicionalmente, um estudo de simulação de Monte Carlo é conduzido para avaliar o comportamento dos estimadores e a precisão dos intervalos de confiança obtidos. Por fim, o modelo é aplicado a um conjunto de dados reais, referentes a casos de câncer testicular registrados em São Paulo, Brasil, demonstrando seu desempenho competitivo em relação a modelos clássicos e reforçando sua utilidade em aplicações práticas.

Conferência 6

C6 - Árvore de decisão para identificação dos indicadores determinantes da desnutrição no Brasil

Alcione Miranda dos Santos

UFMA
Minicurrículo

A desnutrição infantil (DI) é caracterizada pela deficiência de nutrientes básicos que culminam em déficits de peso e estatura, sendo considerado um problema de saúde pública nos países de média e baixa renda. A partir do sucesso no alcance de muitas metas dos Objetivos de Desenvolvimento do Milênio (ODM), foi instituída a Agenda 2030, com 17 Objetivos do Desenvolvimento Sustentável (ODS). Uma das metas internacionais é, até 2030, acabar com todas as formas de desnutrição, e até 2025 atingir as metas internacionais sobre atraso no crescimento (reduzir 40%) e baixo peso (reduzir e manter <5%) em crianças menores de 5 anos. Dessa forma, torna-se relevante o desenvolvimento de estudos que busquem identificar e monitorar os fatores determinantes da desnutrição, a fim de avaliar as intervenções necessárias que possam contribuir para o alcance das metas. Nesta palestra, apresentaremos os principais indicadores que determinam a ocorrência da desnutrição no país, utilizando a técnica de árvore de decisão. Todos os indicadores determinantes da DI estão relacionados à pobreza e às desigualdades sociais, dificultando o alcance da meta para a DI no país.

Café

Assembléia RBras

Premiação Destaque RBras

Sessão Pôsteres 2

Na SP2, serão apresentados os trabalhos das seguintes áreas temáticas:

  1. Análise de Sobrevivência
  2. Dados Funcionais, Dados em Alta Dimensão e Aprendizado Estatístico de Máquinas
  3. Educação Estatística
  4. Estatística Aplicada em Agronomia e Biologia 2
  5. Estatística Aplicada em Arquitetura e Urbanismo, Engenharias e Ciências Exatas
  6. Estatística Aplicada em Ciências Sociais Aplicadas e Demografia e Estatísticas Públicas
  7. Estatística Computacional
  8. Modelos lineares generalizados e modelos não lineares
  9. Planejamento de Experimento e Controle Estatístico de Qualidade
  10. Probabilidade e Processos Estocásticos


Veja a lista completa das apresentações da SP2 (quarta-feira, dia 06/08) clicando neste link.

Comunicações Orais 5

CO5 - Métodos estatísticos em Agronomia e Biologia

Autores
Verônica Manhães Saint’Clair                Marciel Lelis Duarte               Sebastião Martins Filho

A proteção de cultivares assegura direitos de propriedade intelectual sobre novas variedades vegetais por meio do Certificado de Proteção de Cultivar. No entanto, eventos como renúncia, cancelamento e anulação podem encerrar essa proteção antes do prazo legal, configurando um cenário de riscos competitivos. Esta pesquisa investiga como as características do titular (instituição pública, setor privado e parcerias) e do cultivar (presença de transgenia e tipo de cultura), influenciam a duração do certificado. Foram analisadas 3421 proteções obtidas da plataforma CultivarWeb do Ministério da Agricultura, Pecuária e Abastecimento, entre 1997 e 2024. O evento de interesse (expiração por prazo) e os eventos competitivos (renúncia, cancelamento e anulação da proteção) foram analisados por meio do modelo de Fine-Gray. Os resultados indicaram que cultivares transgênicas apresentam menor incidência tanto de expiração quanto dos eventos competitivos. Proteções do setor privado têm menor incidência de expiração, mas com maior propensão à renúncia, cancelamento e anulação. Cultivares ornamentais registraram as maiores incidências de renúncia, independentemente do ciclo da cultura. Dessa forma, conclui-se que características do titular e da cultivar impactam a duração da proteção e que o modelo de Fine-Gray se mostra promissor para modelar a duração do certificado de proteção de cultivares. 

Palavras-chave: dados censurados; modelo de Fine-Gray; propriedade intelectual.

Autores
Sara Silvério         Marciel Lelis Duarte          Carla Regina Guimarães Brighenti        Lausanne Soraya de Almeida         Sebastião Martins Filho 

Devido à presença de dados censurados nos ensaios de germinação, métodos convencionais de análise de dados podem não ser a escolha mais apropriada. Uma alternativa é a aplicação da análise de sobrevivência. Entretanto, em alguns casos, o momento exato da germinação não é conhecido, pois as observações ocorrem em intervalos de tempo, caracterizando censura intervalar. Neste trabalho, foram utilizados dois conjuntos de dados distintos sobre a germinação de sementes de pitaia (Hylocereus spp.) com o objetivo de exemplificar e avaliar a aplicação de diferentes abordagens na análise de sobrevivência intervalar paramétrica, não paramétrica e semiparamétrica. O primeiro conjunto referese a um experimento que analisou o efeito de diferentes temperaturas sobre sementes armazenadas por 12, 13 e 14 meses. O segundo envolveu a germinação de sementes armazenadas por diferentes períodos, em dois ambientes: câmara fria e condições ambiente. A partir dos resultados obtidos com a abordagem não paramétrica, a 15 ºC a germinação foi significativamente inferior e diminuiu com o aumento do tempo de armazenamento. Na análise paramétrica a interação entre tempo e local de armazenamento foi significativa (-0,1593), indicando que a câmara fria reduz o impacto do tempo de armazenamento nas sementes, em comparação com as condições ambiente. Na análise semiparamétrica a razão de taxas de falha de aproximadamente 1,174 (exp(0,16)) indica que, a cada mês adicional de armazenamento, o risco de germinação das sementes aumenta aproximadamente 17,4% quando as sementes são armazenadas em câmara fria. Os métodos utilizados mostraram-se valiosos para analisar a germinação das sementes com censura intervalar. 

Palavras-chave: Hylocereus spp; armazenamento; temperatura; análise de sobrevivência.

Autores
Hozana Francielle do Nascimento Borges            Luiz Antonio Martinelli           Paulo José Duarte Neto          
Antonio Samuel Alves da Silva           Francisco Gustavo da Silva

Este estudo investigou a aplicação do Support Vector Machine (SVM) como classificador para a determinação da origem geográfica de amostras de maconha (Cannabis sativa), combinando técnicas de aprendizado de máquina com análise de isótopos estáveis. Foram testados quatro kernels do SVM: linear, sigmoide, polinomial e radial, com tamanhos de amostra variando de 50 a 500. O kernel sigmoide, com tamanho de amostra 50, apresentou o melhor desempenho, alcançando uma acurácia de 0,79. Além disso, foram calculadas métricas como Precisão Média, Recall Médio, F1-Score Médio, Desvio Padrão (SD) da Acurácia, e intervalos de confiança (inferior e superior) para avaliar a robustez do modelo. O kernel sigmoide destacou-se não apenas pela acurácia, mas também por valores elevados de Precisão Média, Recall Médio e F1-Score Médio, com baixo desvio padrão e intervalos de confiança consistentes. Conclui-se que o SVM com kernel sigmoide é uma abordagem eficaz e confiável para a classificação da origem geográfica de amostras de maconha, sendo uma ferramenta promissora para aplicações forenses e científicas. 

Palavras-chave: Análise isotópica; Aprendizado de Máquina; Cannabis; Biomas.

Autores
Idemauro Antonio Rodrigues de Lara            Gabriel Rodrigues Palma           Victor José Bon           Carolina Reigada           Rafael de Andrade Moral

O percevejo marrom Euschistus heros é uma das pragas potenciais da cultura da soja. Neste trabalho, apresenta-se um estudo experimental desenvolvido para avaliar as mudanças comportamentais dos parasitoides de acordo com a qualidade dos hospedeiros, ou seja, quando previamente parasitados ou não, bem como os efeitos do parasitismo prévio dos ovos do Euschistus heros na taxa de parasitismo das espécies Trissolcus basalis e Telenomus podisi. Assim, foram implementados modelos markovianos multi-estados para modelar sucessivamente a escolha dos ovos (não parasitados, parasitados por T. podisi e parasitados por T. basalis) e o comportamento condicional dada a escolha (caminhar, tamborilar, ovipositar ou marcar). Neste trabalho, enfatizamos a contribuição metodológica de transições duplas devido a dois estágios sucessivos de respostas ao longo do tempo. A metodologia estatística é baseada em processos estocásticos de tempo contínuo e no procedimento de máxima verossimilhança. Usando o modelo de Cox e assumindo um processo estacionário, verificou-se que o efeito do tratamento foi significativo para a escolha, indicando que as duas espécies de parasitoides têm padrões de escolha diferentes. Numa segunda etapa, os resultados também mostraram a influência da espécie no comportamento condicional, especialmente, que o agente T.podisi evita a competição intraespecífica. O método estatístico usado contribuiu para seleção do melhor agente de controle biológico da praga da soja, que é uma prática da agricultura sustentável e ecologicamente correta.

Palavras-chave: Telenomus podisi; Trissolcus basalis; comportamento de forrageamento; controle do percevejo marrom, processos estocásticos.

Autores
Gabriel Edson Sousa da Silva          Louiziane Ribeiro Carvalho          Joel Augusto Muniz           Edilson Marcelino Silva

Este estudo avaliou o acúmulo de nitrogênio em plantas de chicória sob diferentes formas de cultivo, utilizando modelos não lineares. A chicória é uma hortaliça importante, rica em inulina, com potencial para a saúde humana. O nitrogênio é um nutriente essencial para o crescimento das plantas, influenciando diretamente a fotossíntese e o desenvolvimento. Modelos não lineares, como Logístico, Gompertz e Von Bertalanffy, foram utilizados para analisar o acúmulo de nitrogênio ao longo do tempo. O experimento foi conduzido com duas cultivares de chicória, com e sem cobertura de tecido de polipropileno. Os resultados indicaram que o modelo Logístico foi o mais adequado para descrever o acúmulo de nitrogênio na maioria das cultivares. Não houve diferença significativa no acúmulo máximo de nitrogênio entre as cultivares, mas houve diferença no ponto de inflexão entre a cultivar AF-218 coberta e a crespa descoberta. 

Palavras-chave: Chicória; Macronutrientes; Modelos não lineares; Acúmulo de nitrogênio; Polipropileno.

Autores
Felipe Augusto Fernandes

As curvas de crescimento de animais, em geral, possuem formato de “S”, conhecidas também como curvas sigmoidais. Este tipo de curva é bem ajustada por modelos de regressão não linear, dentre eles o de von Bertalanffy que tem sido muito aplicado em diversas áreas, sendo apresentado na literatura por meio de diferentes parametrizações, que na prática, pode além de complicar seu entendimento, afetar as medidas de não linearidade e as inferências sobre os parâmetros. Para quantificar a não linearidade presente em um modelo Bates e Watts utilizaram um conceito geométrico de curvatura. O objetivo deste trabalho foi desenvolver analiticamente três parametrizações do modelo não linear de von Bertalanffy, referente à sua não linearidade, as implicações nas inferências e estabelecer relações entre os parâmetros nas diferentes formas de expressar os modelos. Estas parametrizações foram ajustadas à dados de crescimento de ovinos. Para cada parametrização foram calculadas as medidas de curvatura intrínseca e paramétrica descritas por Bates e Watts. A escolha da parametrização afeta as medidas de não linearidade, consequentemente, influencia na confiabilidade e nas inferências sobre os parâmetros estimados. As formas mais utilizadas na literatura apresentaram os maiores afastamentos da linearidade, evidenciando a importância de se analisar estas medidas em qualquer estudo sobre curva de crescimento. Deve ser utilizada a parametrização na qual a estimativa de b representa a abscissa do ponto de inflexão por apresentar menores desvios de linearidade e interpretação biológica direta para todos os parâmetros. 

Palavras-chave: Interpretação biológica; medidas de curvatura; regressão não linear; reparametrizações

Comunicações Orais 6

CO6 - Estatística Aplicada à Saúde e ao Meio Ambiente

Autores
Beatriz Milz          Sandra Momm          Gabriel Machado Araujo 

A pandemia de COVID-19 evidenciou desigualdades socioespaciais profundas, sobretudo em grandes centros urbanos como São Paulo. O projeto “Impacto da COVID-19 no modo de vida, mobilidade e acessibilidade dos grupos marginalizados” (ICOLMA) investiga os impactos da COVID-19 na mobilidade de grupos marginalizados em três cidades: São Paulo (Brasil), Cidade do Cabo (África do Sul) e Dortmund (Alemanha). Neste projeto, utilizamos o software Maptionnaire para aplicar um questionário baseado em mapas (map-based survey). Esta comunicação oral tem como objetivo apresentar os desafios enfrentados na preparação e análise dos dados geográficos, enfatizando a importância da linguagem R para garantir a reprodutibilidade da análise dos dados. Serão apresentados desafios nos processos de validação, limpeza e integração dos dados, com destaque para as estratégias de correção de inconsistências nas coordenadas geográficas e a unificação de informações oriundas de múltiplos arquivos. Em seguida, detalharemos a aplicação de técnicas de análise geoespacial, como o cálculo de distâncias entre residências e pontos de atividade coletados. Também apresentaremos o dashboard interno em Shiny, desenvolvido com o objetivo de facilitar a exploração dos dados e a visualização dos resultados, além de facilitar a identificação de possíveis erros de coleta. As lições aprendidas durante este processo oferecem importantes contribuições metodológicas, servindo de referencial para futuras pesquisas que utilizam questionários baseados em mapas. 

Palavras-chave: map-based survey, mobilidade urbana, COVID-19, grupos marginalizados. 

Autores
Eduardo V. Moraes          Magda C. Pires          Guilherme F. Nascimento          Leonardo C. D. Rocha          Marcos A. Gonçalves          Unaí Tupinambas          Milena S. Marcolino

COVID-19 vaccines effectively prevent infection and hospitalization. This study aimed to compare the clinical characteristics and outcomes of vaccinated and unvaccinated COVID-19 in hospital patients using advanced statistical methods: propensity score analyses, covariate adjustment and feature importance by permutation. The retrospective cohort included adult COVID-19 patients admitted from March 2021 to August 2022 from 27 hospitals across five Brazilian states during the Delta and Omicron waves. From the 3,188 patients, 1,963 (61.6%) were unvaccinated and 1,225 (38.4%) were fully vaccinated. Among these, 558 vaccinated individuals were matched with 558 unvaccinated ones. Vaccinated patients had lower rates of mortality (19.4% vs. 33.3%), invasive mechanical ventilation (IMV-18.3% vs. 34.6%), noninvasive mechanical ventilation (NIMV-10.6% vs. 22.0%), intensive care unit admission (ICU-32.0% vs. 44.1%) vasoactive drug use (21.1% vs. 32.6%), dialysis (8.2% vs. 14.7%) hospital length of stay (7.0 vs. 9.0 days), and thromboembolic events (3.9% vs.7.7%), p<0.05 for all. Risk-adjusted multivariate analysis demonstrated a significant inverse association between vaccination and in-hospital mortality (adjusted odds ratio [aOR] = 0.42, 95% confidence interval [CI]: 0.31-0.56; p < 0.001) as well as IMV (aOR = 0.40, 95% CI: 0.30-0.53; p < 0.001). These results were consistent in all analyses, including feature importance by permutation. In conclusion, vaccinated patients admitted to hospital with COVID-19 had significantly lower mortality and other severe outcomes than unvaccinated ones during the Delta and Omicron waves. These findings have important implications for public health strategies and support the critical importance of vaccination efforts, particularly in low-income countries, where vaccination coverage remains suboptimal.

Keywords: COVID-19; vaccine; severe illness; propensity score; machine learning

Autores
Louiziane Ribeiro Carvalho         Valdeline de Paula Mequelino Ferreira           Maria Vitória Neves           Thelma Sáfadi           Joel Augusto Muniz

A sífilis é uma infecção crônica e sistêmica, de distribuição global, transmitida entre humanos. Apesar da redução na sua prevalência com o uso da penicilina, observa-se um aumento nos casos, especialmente de sífilis congênita. A sífilis congênita é provocada pela bactéria espiroqueta Treponema pallidum ocorrendo por via transplacentária e também durante o parto e a amamentação se houver contato com lesões maternas. O objetivo do estudo foi analisar e fazer previsão da série dos casos de sífilis congênita em Minas Gerais. Trata-se de um estudo de séries temporais considerando para análise o estado de Minas Gerais, a partir do número de casos de sífilis congênita e de nascidos vivos (NV), registrados entre 2007 e 2024. Calculou-se as taxas de incidência da doença expressa como o número de casos por 1000 NV por ano. Ajustou-se o modelo para a série e foi feita a previsão para o período de julho de 2024 a dezembro de 2025. No período de janeiro de 2007 a junho de 2024, foram notificados 22.464 casos de sífilis congênita. A taxa de incidência variou entre 0,69/1000 NV em 2007 a 9,71/1000 NV em 2023. Observou-se uma tendência temporal na série, com um aumento no número de casos até o ano de 2019, decréscimo nos anos de 2020 e 2021, seguido de um novo aumento. Os resultados indicam que a sífilis congênita permanece um problema de saúde pública, visto que o número de casos foi crescente para o período analisado e com previsão de aumento para 2025. 

Palavras-chave: Séries temporais; sífilis congênita; previsão; modelo ARMA; tendência.

Autores
Fernando Antonio Moala           Adriano Buran Moala          Nixon Jerez-Lillo          Pedro Luiz Ramos

The selection of priors is a critical aspect of Bayesian analysis, although the literature lacks studies concerning the application of the Gumbel distribution using different objective priors. We derive objective priors for the two-parameter Gumbel distribution and present a fully Bayesian analysis. Our primary goal is to choose a prior that represents a state of “little knowledge” a priori for both parameters. To yield this, we implement Markov Chain Monte Carlo algorithms to sample from the posterior distribution and to calculate the Bayes estimators. This investigation is made in the context of extreme weather events, using maximum rainfall data. 

Keywords: Gumbel distribution; Bayesian inference; objective priors; reference prior; Jeffreys.

Autores
Paulo Canas Rodrigues 

Incêndios florestais estão entre os desastres naturais mais comuns em muitas regiões do mundo e têm impacto ativo na qualidade de vida. Esses eventos tornaram-se mais frequentes devido às mudanças climáticas, outras políticas locais e ao comportamento humano. Nesta palestra, considero os dados históricos com as localizações geográficas de todos osfocos de incêndiodetectados pelos satélites de referência que cobrem o território brasileiro entre janeiro de 2011 e dezembro de 2022, totalizando mais de 2,2 milhões de focos. Inicialmente, apresentarei os resultados de um modelo linear generalizado espaço-temporal para dados de unidades espaciais, cujas inferências sobre seus parâmetros são realizadas por meio de uma abordagem Bayesiana, utilizando variáveis meteorológicas (precipitação, temperatura do ar, umidade e velocidade do vento) e uma variável humana (transição e ocupação do uso da terra) como covariáveis. Em seguida, apresentarei os resultados para a previsão hierárquica de séries temporais, onde os seis biomas brasileiros e os 5570 municípios formam a hierarquia. (Trabalho conjunto com Jonatha Pimentel, Rodrigo Bulhões e Ana Pinheiro). 

Palavras-chave: modelagem espaço-temporal, previsão de séries temporais hierárquicas, incêndios florestais

Autores
Giovani L. Silva              André Nunes             Luzia Gonçalves

Na análise de dados longitudinais, são geralmente adotados efeitos aleatórios gaussianos para controlar a heterogeneidade não observada dos indivíduos ao longo do tempo. Neste trabalho, questiona-se essa suposição gaussiana numa análise de variáveis respostas binárias que são conjuntamente distribuídas e com estrutura de dependência via efeitos aleatórios sob uma abordagem bayesiana não paramétrica (BNP). Estatística bayesiana não paramétrica não impõe uma dada distribuição de probabilidade para as variáveis respostas ou efeitos aleatórios ou ambas. Considera-se modelos BNP para os efeitos aleatórios e modelos paramétricos (distribuição de Bernoulli) para as variáveis respostas binárias. Relativamente ao modelo BNP, uma variedade de processos tais como o processo de Dirichlet (DP), o processo de quebra-vara (=stick-breaking process), o processo de Pitman-Yor e a árvore de Polya que estão implementados no pacote R NIMBLE. São também empregues métodos de Monte Carlo via cadeias de Markov (MCMC) para fazer inferência sobre os parâmetros do modelo. Por fim, a motivação deste trabalho devese a um estudo de dados binários de um ensaio longitudinal aleatorizado em paralelo com quatro braços e conduzido na província de Bengo – Angola, envolvendo um total de 121 crianças com infecções parasitárias intestinais que receberam tratamento inicial. Um dos objetivos do estudo é investigar os efeitos de quatro intervenções nas variáveis respostas de malnutrição aguda e crônica. 

Palavras-chave: Estatística não paramétrica bayesiana; modelo misto; malnutrição.

Comunicações Orais 7 e Apresentações Hackixaba

CO7 - Aprendizado de Máquina

Autores
Rafael Magalhães             Anderson Andolfato             Eduardo Portela            Anderson Ara 

This study presents an integrated methodology that combines Active Learning and Process Mining to enhance the efficiency of CRM systems, focusing on reducing unnecessary calls and improving dialer performance. Unlike traditional model-centric approaches, the method proposes the use of t-SNE for dimensionality reduction and entropy as a criterion for informative sample selection (GSx), reducing dependence on large labeled datasets. The methodology was applied during the transition of a Brazilian company from a telephony-based system to an omnichannel CRM platform. Event logs, call history, and dialer activity were analyzed to identify patterns and estimate success rates. Four predictive models were evaluated — Linear Regression (LR), Support Vector Regression (SVR), Random Forest (RF), and Multilayer Perceptron (MLP) — with LR and SVM using a linear kernel demonstrating superior performance in minimizing inefficient calls. Process mining complemented the analysis by identifying critical variables impacting success rates. The results indicate that integrating entropy and t-SNE with active learning allows for the selection of more representative samples, improves predictive model performance, and significantly reduces computational cost. This approach stands out for its practical applicability in real-world CRM environments and promotes a more intelligent use of data in decision-making and process optimization. 

Keywords: Active Learning, Process Mining, Software CRM

Autores
 Cristian Pessatti dos Anjos            Anderson Ara

No cenário do aprendizado de máquina, os modelos de classificação assumem um papel fundamental, apresentando grande relevância na Estatística e na Ciência de dados. Suas aplicações na extração de padrões a partir de dados complexos têm sido de grande importância para classificação tanto de variáveis binárias como multiclasse. A classificação multiclasse é crucial no aprendizado de máquina, permitindo a categorização de dados em várias classes distintas. Isso é essencial em muitas aplicações do mundo real, como diagnóstico médico, classificação de espécies e análise de sentimentos em texto. Dentro desse contexto, o modelo de ensemble Máquinas Aleatórias se apresenta entre os modelos de aprendizado de máquina com uma notável capacidade preditiva em comparação com abordagens tradicionais. O pacote randomMachines é uma implementação em R do algoritmo  Máquinas Aleatórias,  disponível no CRAN desde 14 de dezembro de 2023. Em suma, o algoritmo utiliza da técnica de  bagging para modelos base de Support Vector Machines (SVM), utilizando uma amostragem aleatória adicional de funções kernel para sua construção fazendo uso da biblioteca kernlab. Em sua forma mais básica, os modelos de SVM não modelam classificação multiclasse nativamente, assim executam classificação binária somente em duas classes, e para a classificação multiclasse, o mesmo princípio é utilizado, decompondo o problema de multiclassificação em vários problemas de classificação binária. Atualmente, o pacote randomMachines está preparado exclusivamente para tarefas de classificação em classes binárias. Neste trabalho, propomos uma extensão da metodologia bem como a atualização no pacote randomMachines para lidar com tarefas de classificação envolvendo duas ou mais classes. 

Palavras-chave: Machine Learning; SVM; Classificação.

Apresentações Hackixaba

Mesa Redonda 4 e Sessão Temática 7

Stéfane Rossoni (Chair)

CONRE-4
Minicurrículo

Doris Satie Maruyama Fontes

CONRE-3
Minicurrículo

Hildete Costa

CONRE-5
Minicurrículo

A mesa-redonda “Desafios e Avanços na Fiscalização e Regulamentação da Profissão de Estatístico” propõe um debate sobre os principais entraves enfrentados na consolidação e valorização da profissão no Brasil. Serão abordados temas como a baixa adesão ao registro profissional, a contratação de estatísticos sob outras denominações para burlar direitos trabalhistas, a escassez de fiscais nos Conselhos Regionais e a importância do engajamento coletivo da categoria para garantir o exercício ético e legal da Estatística. A discussão também destacará iniciativas em andamento, propostas de modernização e o papel dos órgãos de classe na defesa da profissão.

Tales Jesus Fernandes (Chair)

UFLA
Minicurrículo

Jesús Alberto Peña Guillén

Universidad de Los Andes, Venezuela
Minicurrículo

Eder Silva de Brito

Instituto Federal de Educação, Ciência e Tecnologia de Goiás
Minicurrículo

Será feita uma breve apresentação da história e contexto atual da BJB, enquanto revista oficial da RBras. Além disso, serão apresentados os 2 melhores artigos publicados na BJB durante o ano de 2024.

Café

Sessões Temáticas 8 e 9 e Tutorial 4

Anderson Ara (Chair)

UFPR
Minicurrículo

Gabriela Maria Rodrigues

ESALQ/USP
Minicurrículo

Eufrásio de Lima Neto

UFPB
Minicurrículo
As técnicas de Aprendizado Estatístico de Máquina, do inglês Statistical Machine Learning,  têm recebido muita atenção nos últimos anos devido ao fato de automatizarem modelos  analíticos com um bom poder preditivo e que podem ser aplicados para resolução de diversos  problemas. Nesta sessão temática serão apresentados algumas metodologias de  Aprendizado Estatístico e suas aplicações. 

Palavras-chave: Aprendizado Estatístico; Aprendizado de Máquina.

Allison Queiroz de Oliveira (Chair)

ESALQ/USP
Minicurrículo

Elisangela Aparecida da Silva Lizzi

Universidade Tecnológica Federal do Paraná
Minicurrículo

Doris Satie Maruyama Fontes

CONRE-3
Minicurrículo

A tomada de decisões pelo estado, governo ou qualquer órgão competente impacta diretamente o caminho trilhado pela comunidade. Contudo tais decisões devem ser feitas de forma clara, inteligente, precisa e que considere as consequências (sejam elas positivas ou negativas) geradas. Com isso o papel de um profissional que alinhe as demandas sociais e suas complexidades à técnicas que auxiliem nas melhores escolhas possui um impacto crucial neste processo. No atual contexto, com a alta geração de dados informativos acerca da sociedade, o uso de métricas e técnicas matemáticas e estatísticas são indispensáveis. Diante disso, durante esta mesa redonda traremos à luz como está a formação atual dos profissionais de estatística e ciência de dados e se de fato esta está colaborando para que o mercado receba profissionais qualificados para a tomada de decisões em políticas públicas e, caso contrário, o que deve ser proposto em termos de ensino para que o perfil do novo profissional destas áreas venha a ser condizente com tal demanda. Além deste eixo, também iremos abordar quais os impactos na qualidade da formação de tais profissionais quando se refere à políticas relacionadas principalmente ao crescimento econômico, da garantia de alimento no prato de todos, qualidade de vida e redução da pobreza em nosso país.

Elizabeth Gonzalez Patiño

Butantan
Minicurrículo

Marcos Alves de Lima

Butantan
Minicurrículo
Este tutorial possui a intenção de demonstrar o papel da Estatística nas atividades científicas pela busca de tratamentos mais eficazes e seguros para algumas doenças. No desenvolvimento clínico de novos produtos, tais como vacinas e medicamentos, o uso de métodos estatísticos específicos, surgem como ferramentas fundamentais para proporcionar e apoiar tomadas de decisões. Para que um novo medicamento ou vacina sejam aprovados para uso, é necessário comprovar que este novo produto traz benefícios, que seja seguro e no caso de comparações com outros produtos, que seja similar ou até mesmo superior. Desta forma, a comparação entre dois ou mais medicamentos ou vacinas podem possuir objetivos distintos, tais como: determinar se há evidência de diferença estatística na comparação dos tratamentos (um produto é superior a outro), demonstrar que há uma padronização e/ou uma consistência na fabricação de um medicamentos (equivalência) ou até mesmo mostrar que um novo produto não é inferior clinicamente em relação a outro tratamento (não-inferioridade).  Neste tutorial, iremos nos aprofundar nos conceitos e nas formulações de hipóteses para testes de superioridade, não-inferioridade e equivalência, explorando suas aplicações e limitações. Além disso, traremos exemplos práticos de estudos do Centro de Ensaios Clínicos e Farmacovigilância do Instituto Butantan que utilizaram tais técnicas estatísticas.  Ao final deste tutorial, espera-se que os participantes, compreendam os diferentes tipos de testes de hipóteses utilizados em ensaios clínicos para o desenvolvimento de vacinas e consigam avaliar criticamente os resultados de estudos clínicos já publicados.

Palavras-chave: Vacinas; ensaios clínicos; teste de hipótese; superioridade; não-inferioridade; equivalência.

Espaço Parceiro - SEBRAE/ES

Caminhos Sustentáveis: o papel dos Dados no avanço das Práticas ESG do Sebrae/ES

A palestra abordará como os dados vêm desempenhando um papel fundamental na evolução das práticas ESG (ambientais, sociais e de governança) dentro do Sebrae. Serão apresentados os caminhos adotados pela instituição para utilizar a inteligência de dados tanto na construção de suas ações internas de sustentabilidade quanto na oferta de soluções mais alinhadas às necessidades dos clientes. A proposta é demonstrar como a análise e o uso estratégico de dados permitem decisões mais responsáveis, eficientes e alinhadas aos compromissos ESG, fortalecendo o impacto positivo do Sebrae na sociedade e no meio ambiente.

Conferência 7

C7 - Influência de Ancestralidade Local na Expressão Gênica de Tipos Celulares da População Brasileira

Benilton de Sá Carvalho

UNICAMP
Minicurrículo

A diversidade genética da população brasileira, resultante de um complexo histórico de migração e miscigenação, oferece uma oportunidade única para estudar como a ancestralidade genética influencia a expressão gênica. Este estudo propõe uma análise integrada de dados de RNA-seq de célula única (scRNA-seq) e de sequenciamento do genoma completo (WGS) para investigar a relação entre ancestralidade local e expressão diferencial de genes em diferentes tipos celulares. Neste trabalho, serão discutidos métodos de pré-processamento de dados de scRNA-seq, incluindo a filtragem de células de baixa qualidade, normalização, remoção de efeitos de lote e anotação de tipos celulares. Paralelamente, serão também apresentados métodos de pré-processamento de dados de sequenciamento de genoma completo, genotipagem e inferência de ancestralidade local. Um modelo de regressão  para respostas do tipo binomial negativa será discutido e utilizado na integração de ambas modalidades de dados, permitindo a comparação da expressão gênica entre os grupos de diferentes ancestrais locais. Extensões que permitam o uso de variáveis medidas com erros e também o uso de observações correlacionadas serão discutidas. Esta estratégia permitirá a identificação de genes cuja expressão é significativamente influenciada pela ancestralidade local em diferentes tipos celulares. Esses achados podem fornecer novos insights sobre as bases genéticas das diferenças fenotípicas observadas na população brasileira e contribuir para a compreensão das interações entre genética e ambiente. Este estudo demonstra uma abordagem inovadora e integrada para explorar a influência da ancestralidade genética na expressão gênica em nível celular, utilizando dados de scRNA-seq e WGS. A aplicação dessas metodologias pode abrir novas perspectivas para pesquisas em genética populacional e medicina personalizada, especialmente em populações geneticamente diversas como a brasileira.

Financiamento: BRAINN/FAPESP 2013/07559-3

Miniconferência 4

Y4 - A Bayesian joint model of multiple longitudinal and categorical outcomes with application to multiple myeloma using permutation-based variable importance

Danilo Alvares

University of Cambridge, UK
Minicurrículo

Joint models have proven to be an effective approach for uncovering potentially hidden connections between various types of outcomes, mainly continuous, time-to-event, and binary. Typically, longitudinal continuous outcomes are characterized by linear mixed-effects models, survival outcomes are described by proportional hazards models, and the link between outcomes are captured by shared random effects. Other modeling variations include generalized linear mixed-effects models for longitudinal data and logistic regression when a binary outcome is present, rather than time until an event of interest. However, in a clinical research setting, one might be interested in modeling the physician’s chosen treatment based on the patient’s medical history to identify prognostic factors. In this situation, there are often multiple treatment options, requiring the use of a multiclass classification approach. Inspired by this context, we develop a Bayesian joint model for longitudinal and categorical data. In particular, our motivation comes from a multiple myeloma study, in which biomarkers display nonlinear trajectories that are well captured through bi-exponential submodels, where patient-level information is shared with the categorical submodel. We also present a variable importance strategy to rank prognostic factors. We apply our proposal and a competing model to the multiple myeloma data, compare the variable importance and inferential results for both models, and illustrate patient-level interpretations using our joint model.

Conferência 8

C8 - Recurrent Event Process Models: change point models and clustering of events

Elizabeth Juarez-Colunga

University of Colorado, US
Minicurrículo

Recurrent event data arise when an event may occur repeatedly over time. Examples include recurrence of bladder cancer tumors, epileptic seizures, or pulmonary exacerbations. This talk will main discuss two projects. The first focuses on modeling pulmonary exacerbations and their relationship to a longitudinal binary outcome, and the second aims to understand the clustering of events within individuals.

The first project was motivated by a study of cystic fibrosis, a hereditary lung disease characterized by progressive loss of lung function. Chronic Pseudomonas aeruginosa (PA) infection is associated with worse clinical outcomes, including more frequent pulmonary exacerbations (PE). The longitudinal progression of PA infection and recurrent PE events are likely intrinsically linked, but their temporal interrelationship has not been fully characterized. It is known that the rate of PA progression increases as individuals age, with potential sharp changes in its trajectory. Using data from the Early Pseudomonas Infection Control Observational Study, we propose a joint model to examine longitudinal PA and recurrent PE events. This model incorporates individual-specific random effects in the longitudinal sub-model, linked to those in the recurrent event sub-model. The longitudinal sub-model includes two change points to represent sharp changes in the trajectory, while the recurrent event sub-model employs a counting process for recurrent events and accommodates delayed entry. The results indicate that children experience a modest increase of 5.13% per year in the odds of PA starting at age 6.9, followed by a more pronounced rise of 27.12% around age 14.5. Additionally, an increased probability of PA is associated with a higher risk of experiencing subsequent PE events. The second project focuses on epileptic seizures, with the primary goal of understanding the clustering of seizures within individuals. We model clustering using a self-exciting stochastic process.

Café

Conferência 9 (Encerramento)

C9 - Causal Inference on Flexible Non-mixture Cure Rate Modeling with Piecewise Hazard and Gaussian Process

Dipak Dey

University of Connecticut, US
Minicurrículo

In the field of oncology, survival analysis often requires the inclusion of a cure fraction to account for individuals who are effectively cured of their disease. The concept of a cure fraction in survival analysis was introduced in a study examining long term survival following cancer therapy. The early work laid the foundation for defining cured individuals who were not at risk of experiencing the cancer recurrence after a certain period. Recently, there has been increasing interest in semiparametric mixture cure models, which relax some parametric assumptions.

The non-mixture cure rate model, which is another branch of the cure rate modeling, represents a significant advance in cure rate modeling. The non-mixture cure rate model, unlike the traditional mixture cure rate model, addresses this need by introducing a latent variable, often interpreted as the unobserved count of cancer cells, to indirectly estimate an individual’s cure status. This latent factor approach offers several benefits, including the flexibility to integrate a proportional hazards structure and enhanced computational efficiency. Over time, the non-mixture cure rate model has been extensively extended to handle complex data, leveraging semiparametric methods for modeling survival function. The non-mixture cure rate model typically incorporates covariates into the cure rate parameter through a log-linear form, assuming a Poisson distribution for the unobserved cancer cell count. Additionally, the common use of a linear functional form for covariate effects can be restrictive, particularly for continuous covariates that often display nonlinear relationships.

In modeling cure rates, it is often assumed that the effects of continuous covariates vary smoothly over their domain. However, the exact relationship between these covariates and the event of interest is not typically known a priori and may exhibit complex, nonlinear patterns. To flexibly capture these nonlinear covariate effects, we impose a Gaussian Process prior over the effects of the continuous covariates.

In this presentation, we consider non-mixture cure rate models in presence of Gaussian Process and further develop causality approach to decide the order of treatment procedures. The methodology is exemplified on a breast cancer study.

Encerramento e Premiações do Hackixaba

Sessão Expandida para Conexões Científicas

Na sexta-feira, 8 de agosto, encerramos a programação do evento com uma proposta diferente: a Sessão Expandida para Conexões Científicas.

A ideia surgiu a partir de experiências promovidas pela International Biometric Society (IBS), especialmente durante a International Biometric Conference (IBC) de 2022, realizada em Riga, na Letônia. Na ocasião, foram organizados passeios que incentivaram interações entre os participantes, promovendo conexões valiosas e momentos de troca. Inspirados por essa vivência, decidimos adaptar a iniciativa ao contexto da RBras & SEAGRO 2025.

Serão oferecidos dois passeios diferentes: um que acontecerá apenas pela manhã, terminando por volta das 12h, e outro que seguirá até o fim da tarde, com retorno previsto para 17h30. Os detalhes de ambas as atividades podem ser vistos abaixo.

A empresa responsável pelas atividades será a FlluIr Turismo. Os preços de cada passeio podem ser consultados nas informações abaixo. Inscrições e pagamento devem ser feitos entrando em contato com a agência, por meio de seu WhatsApp, telefone ou email. Ao entrar em contato com a empresa, informe que a reserva será feita para o passeio do evento RBras.

Vitória, a encantadora capital do Espírito Santo, é um verdadeiro tesouro escondido no sudeste do Brasil. Além de suas belas praias a cidade é famosa por sua gastronomia com destaque para os pratos deliciosos a base de frutos do mar sempre frescos. A caminho de Vila Velha, a primeira cidade do estado, cruzaremos a 3ª Ponte, que oferece uma vista deslumbrante das duas cidades e o cenário perfeito para aquela foto de tirar o fôlego. O Convento da Penha, Patrimônio Histórico e Artístico Nacional que visitaremos em seguida, faz parte desta paisagem.

Categoria Até 15/07/2025, às 23:59h Após 15/07/2025

Adulto

Obs.: Crianças de colo não pagam.

Serviços Incluídos: Transporte em ônibus executivo de turismo, subida e descida de van no Convento da Penha e acompanhamento de guia de turismo durante todo o percurso.

Santa Teresa é a primeira colônia de italianos do Brasil, conhecida por sua rica cultura e gastronomia, com destaque para os vinhos e queijos artesanais produzidos na região. O Instituto Nacional da Mata Atlântica (Museu Mello Leitão), é outro ponto de interesse que atrai visitantes de todas as idades. Com sua combinação de história, cultura e natureza, a cidade é um destino imperdível para quem visita o Espírito Santo. A Caminho de Santa Teresa, faremos uma parada para apreciar o maior Buda do ocidente, na cidade de Ibiraçu. Com 35m de altura e quase 350 toneladas, a estátua magnífica está cercada por uma extensa área de preservação ambiental, proporcionando belos clicks e tornando esta visita um momento único de relaxamento e reflexão!

Categoria Até 15/07/2025, às 23:59h Após 15/07/2025

Adulto

Obs.: Crianças de colo não pagam.

Serviços Incluídos: Transporte em ônibus executivo de turismo e acompanhamento de guia de turismo durante todo o percurso. 

Serviços Não Incluídos: Almoço.

O almoço deste passeio ocorrerá em Santa Teresa, que possui restaurantes que atendem a diferentes faixas de preço.

Adèle Helena Ribeiro​

Universidade de Münster, Alemanha

Dra. Adèle H. Ribeiro é pesquisadora no Instituto de Informática Médica da Universidade de Münster, Alemanha. Ela possui Bacharelado em Matemática Aplicada e Computacional, além de Mestrado e Doutorado em Ciência da Computação, todos pelo Instituto de Matemática e Estatística (IME) da Universidade de São Paulo (USP), Brasil. Durante o doutorado, realizou um estágio de pesquisa no Departamento de Neurociência da Princeton University. Após seu doutoramento, trabalhou como pós-doutoranda no Instituto do Coração (InCor) da USP, no Brasil, e no Causal AI Lab da Columbia University, nos Estados Unidos. Sua pesquisa aborda desafios fundamentais em inferência causal e contrafactual, com o objetivo de facilitar e tornar mais robusta a aplicação prática dessas ferramentas, contribuindo para o avanço do conhecimento científico e a melhoria dos processos de tomada de decisão. Mais informações sobre seu trabalho estão disponíveis em sua página: https://adele.github.io/.

Currículo Lattes

Júlia Maria Pavan Soler

IME-USP

Profa. Dra. Júlia M. P. Soler é professora associada no Instituto de Matemática e Estatística (IME) da Universidade de São Paulo (USP), Brasil, desde 1995, dedicando-se integralmente ao ensino e à pesquisa em Estatística. Seu trabalho concentra-se no entendimento de dados multi-ômicos, com foco no desenvolvimento e na aplicação de ferramentas estatísticas e de bioinformática. Dada a natureza multifatorial dos desafios nesta área e às altas demandas computacionais, seus principais interesses incluem metodologias multivariadas para redução de dimensionalidade, integração de dados heterogêneos e aprendizado de estruturas causais entre variáveis, especialmente em cenários com dependência entre observações e alta dimensionalidade. Além de ser orientadora nos programas de pós-graduação em Estatística e Bioinformática do IME-USP, participa de diferentes projetos colaborativos com o InCor-USP, a Faculdade de Saúde Pública da USP, a Mayo Clinic (Rochester, EUA) e o Instituto de Informática Médica da Universidade de Münster (Alemanha).

Currículo Lattes

Resumo completo


Apesar dos avanços notáveis no aprendizado de máquina e na inteligência artificial e tarefas de reconhecimento de padrões e classificação, a maioria desses métodos ainda enfrenta limitações significativas em fornecer explicações causais para suas decisões e comportamentos.  Além disso, essas técnicas frequentemente não conseguem lidar adequadamente com vieses presentes nos dados, como aqueles decorrentes de variáveis de confusão, do processo de coleta ou até mesmo das decisões históricas e estruturais da sociedade. Sem uma clara compreensão dessas influências, interpretações e tomadas de decisões baseadas nesses modelos podem levar à perpetuação de vieses, distorções nos resultados e até à adoção de soluções ineficazes ou injustas, reforçando preconceitos e desigualdades existentes. Uma abordagem bem fundamentada para superar essas limitações é a adoção de inferência causal. Neste minicurso, adotaremos uma abordagem prática para apresentar os conceitos fundamentais para inferência causal a partir de dados observacionais, demonstrando como diferentes técnicas nessa área podem expandir as possibilidades de inferência, indo além da identificação de associações estatísticas (inferências do nível 1), avançando para explicações dos processos de decisão, incluindo a identificação tanto efeitos de intervenções quanto contrafactuais (inferências dos níveis 2 e 3, respectivamente). Entre as técnicas que exploraremos estão os algoritmos de aprendizado de estrutura causal, capazes de identificar, ao menos parcialmente, relações de causa efeito entre variáveis. Discutiremos, em particular, o algoritmo Fast Causal Inference (FCI) [2], que se destaca pelo seu rigor metodológico e pela menor dependência de suposições não realistas em comparação com outros métodos de descoberta causal. Notavelmente, o FCI é capaz de corretamente identificar relações causais, mesmo na presença de confundimento latente e viés de seleção. No entanto, assume-se que há um teste estatístico adequado disponível para a identificação das relações de independência condicional entre as variáveis aleatórias envolvidas. Neste contexto, discutiremos os desafios e possíveis soluções para aplicações que envolvem variáveis heterogêneas (quantitativas, categóricas, de contagem, etc.), avaliações longitudinais e a presença de dados faltantes. Além de algoritmos de aprendizado causal, também discutiremos técnicas para identificabilidade e estimação dos efeitos, apresentando um pipeline de inferência causal inteiramente baseado em dados observacionais. As metodologias abordadas serão amplamente discutidas e avaliadas por meio de implementações computacionais e estatísticas. Serão fornecidos recursos, principalmente do R, e dados longitudinais e heterogêneos, simulados de forma realista e inspirados na estrutura dos dados extraídos do projeto temático da FAPESP #2017/05125-7, intitulado “Variação individual no risco de malária: causas e consequências em populações amazônicas”, com o objetivo de motivar e ilustrar os conceitos discutidos.

Palavras-chave: inferência causal, aprendizado de estrutura causal, dados longitudinais, dados heterogêneos, dados faltantes, variabilidade do risco de malária.

Apoio Recebido: O presente trabalho foi realizado com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), Brasil. Processo nº 2022/11963-3. As opiniões, hipóteses e conclusões ou recomendações expressas nesse material são de responsabilidade dos autores e não necessariamente refletem a visão da FAPESP.

Com qual(is) ODS o minicurso proposto se relaciona?


Este minicurso está relacionado com o ODS 10 (“Redução das desigualdades) e o ODS 13 (“Ação contra a mudança global do clima”).   Métodos de inferência causal são fundamentais para a compreensão de questões factuais relevantes e para a formulação de decisões mais informadas e eficazes, dado que permitem explicar a natureza causal ou espúria das associações observadas nos  dados. Pesquisadores e analistas de dados, ao se apropriarem dessas ferramentas e entenderem como aplicá-las, podem contribuir para com o processo de tomada de decisões em diferentes áreas críticas como saúde pública, educação e justiça social,  promovendo mudanças significativas e positivas na sociedade. Dentro desse contexto, o minicurso ilustra os possíveis desafios encontrados em análises de dados com estruturas específicas e envolvendo múltiplas fontes de confundimento. Em particular, trabalharemos com dados simulados, inspirados no estudo de malária do projeto  temático da FAPESP #2017/05125-7, que tem como foco a identificação de fatores associados ao risco individual. Os resultados dessas análises ilustram o potencial das  metodologias causais. Ao revelar diferentes fatores ambientais, climáticos, socioeconômicos, genéticos e de estilo de vida que contribuem diretamente no risco de malária, é possível desenvolver políticas e intervenções para prevenção, controle, diagnóstico e tratamento, não só mais efetivas no nível de saúde pública, mas também  destinadas a grupos de diferentes riscos, assim minimizando desigualdades.

Sumário/programa


Este minicurso cobrirá os seguintes tópicos:  
  1. Introdução aos conceitos fundamentais em causalidade: desenho do estudo, confundimento, aleatorização, três níveis de inferência de Pearl, modelo causal estrutural, diagrama causal, independência condicional, classes de equivalência de Markov. 
  2. Aprendizado de estrutura causal: visão geral dos tipos de algoritmos, discussão detalhada do algoritmo FCI e suas variações e uso de diferentes tipos de testes de independência condicional adequados para dados heterogêneos, longitudinais e na  presença de observações faltantes.  
  3. Identificabilidade e estimação de efeitos: visão geral dos critérios gráficos de identificabilidade (critério backdoor e critério generalizado de ajuste) e introdução ao algoritmo ID para classes de equivalência de Markov.
  4. Análise causal usando dados simulados, inspirados na estrutura dos dados extraídos do projeto temático da FAPESP #2017/05125-7. Além dos dados, serão fornecidos códigos em R para a realização das análises. 

Público-alvo


Este é um curso introdutório em inferência causal a partir de dados observacionais,  formulado para alunos e pesquisadores de diferentes áreas e com conhecimento básico de estatística e programação em R, que gostariam de aprofundar o conhecimento  em aprendizagem de causalidade.

Deoclecio Jardim Amorim

USP

Professor Doutor de Ciência de Dados Agroambientais do Centro de Energia Nuclear na Agricultura (CENA) da Universidade de São Paulo (USP). Graduação em Agronomia pela UFMA em 2016, com Mestrado em Agricultura pela UNESP em 2019. Doutorado em Estatística e Experimentação Agronômica pela ESALQ/USP concluído em 2023. No período de 2021 a 2022, desempenhou função de orientador no MBA em Data Science & Analytics da ESALQ/USP, trabalhando em diversas temáticas na área de Ciência de Dados. Suas principais competências incluem o design e análise de experimentos, regressão não linear, modelos lineares generalizados, modelos mistos e métodos estatísticos multivariados, aprendizado de máquina e desenvolvimento de pacotes R.

Currículo Lattes

Maria Gabriella da Silva Araújo

USP

Graduação em Engenheira Ambiental formada pela Universidade Federal Rural da Amazônia (UFRA), com mestrado e doutorado em Ciências, na área de Ecologia Aplicada, pela Universidade de São Paulo (USP). Trajetória acadêmica e profissional marcada pela atuação em hidrobiogeoquímica de ambientes aquáticos tropicais, especialmente na Amazônia. Experiência em pesquisas sobre dinâmica de carbono e gases de efeito estufa em sistemas aquáticos e no uso de isótopos estáveis como ferramentas analíticas para estudos ecológicos e forenses. Mais recentemente aprimorando competências em programação, análise de dados, estatística e geoprocessamento, com foco em geoestatística.

Currículo Lattes

Resumo completo


O curso oferece uma introdução aos princípios fundamentais da teoria do geoprocessamento e dos Sistemas de Informações Geográficas (SIG). Serão abordadas as principais bases de dados geoespaciais ambientais, além da aplicabilidade, importância e desafios na utilização desses dados em diferentes contextos. Os alunos aprenderão a obter e manipular dados geoespaciais de maneira eficaz, combinando habilidades de  manipulação de dados e programação para realizar análises robustas. As técnicas apresentadas serão aplicáveis em áreas como monitoramento ambiental, planejamento territorial, gestão de recursos naturais, estudos de mudanças climáticas, análise de padrões espaciais e modelagem de cenários futuros, promovendo uma visão integrada para tomada de decisões em contextos científicos e de gestão ambiental. Portanto, objetiva-se introduzir os conceitos iniciais referente a coleta de dados geoespaciais das principais bases de dados, envolvendo a aquisição de dados, organização e integração de dados e visualização utilizando linguagem de programação R. A abordagem adotada busca equilibrar teoria e prática, proporcionando uma compreensão abrangente e aplicada dos métodos de coleta e análise de dados.  

Palavras-chave: Geoestatística; Análise espacial; Machine Learning; Análise de dados.

Com qual(is) ODS o minicurso proposto se relaciona?


Este minicurso está relacionado com o ODS 13 (“Ação contra a mudança global do clima”), o ODS 14 (“Vida na água”) e o ODS 15 (“Vida terrestre”). O minicurso está diretamente relacionado aos ODS citadas, pois promove a capacitação na obtenção e interpretação de dados ambientais, ferramentas fundamentais para subsidiar  processos decisórios informados e efetivos. Esses dados são essenciais para: 
  • ODS 13 (Ação contra a mudança global do clima): Monitorar e entender os impactos das mudanças climáticas, apoiar estratégias de mitigação e adaptação, e orientar políticas públicas voltadas para a redução dos impactos climáticos.
  • ODS 14 (Vida na água): Avaliar a qualidade e a sustentabilidade de ecossistemas aquáticos, contribuindo para a proteção da biodiversidade marinha e a gestão responsável de recursos hídricos.
  • ODS 15 (Vida terrestre): Mapear e monitorar a saúde de ecossistemas terrestres,  permitindo a implementação de medidas de conservação, restauração e uso sustentável da biodiversidade.
Dessa forma, o minicurso reforça a integração entre o conhecimento científico e ações práticas, fornecendo subsídios técnicos para a conservação de ecossistemas e o enfrentamento de desafios ambientais globais, fundamentais para o alcance das metas desses ODS.

Sumário/programa


Este minicurso cobrirá os seguintes tópicos:  
  1. Definições; 
  2. Dados geoespaciais; 
  3. Pacotes R; 
  4. Wordclim; 
  5. Extração de dados; 
  6. Estudo de caso; 
  7. Prática; 
  8. Ferramentas: QGIS; 
  9. Ferramentas: R.

Público-alvo


Este curso é voltado para estudantes de graduação, pós-graduação e pesquisadores nas áreas de Estatística, Ciências Agronômicas e Ambientais que possuam conhecimento básico em análise de dados e que desejam aprimorar suas habilidades em geoprocessamento e linguagens de programação.

Darshana Jayajumari

Maynooth University, Ireland
Website pessoal

Niamh Mimnagh

Maynooth University, Ireland

Niamh Mimnagh is a researcher specialising in disease modelling and predictive analytics, with a particular focus on improving health outcomes in Irish cattle populations. During their PhD, they developed innovative methods for estimating animal population sizes, leveraging extensions to the N-mixture model to account for the complexities of real-world ecological systems, such as imperfect detection and environmental variability. They are passionate about applying advanced statistical techniques and machine learning methods to solve real-world problems in agriculture and wildlife conservation.

Website pessoal

Resumo completo


This short course provides a comprehensive introduction to handling imbalanced data in machine learning, a critical challenge in fields like fraud detection, medical diagnosis, and anomaly detection. Participants will explore effective techniques to address class imbalance, focusing on resampling methods (both oversampling and undersampling), weighted classification, and multi-class classification strategies. The course will also cover anomaly detection approaches for rare event prediction, such as Local Outlier Factors, Isolation Forests, Angle-Based Outlier Detectors and Minimum Covariance Determinants, as well as performance metrics tailored for imbalanced datasets, such as Precision-Recall curves, F1 score, and AUC. Through hands-on case studies and examples in R, attendees will gain practical experience in implementing these techniques and evaluating model performance in real-world scenarios. The course is designed for data scientists and analysts seeking to build robust predictive models when faced with skewed data distributions, offering insights into both theory and practical applications.

Keywords: Imbalanced data, anomaly detection, classification, AUC, F1-scores, Precision-Recall curves, machine learning

Com qual(is) ODS o minicurso proposto se relaciona?


This short course is related to SDG 3 (“Good health and well-being”), SDG 9 (“Industry, Innovation, and Infrastructure”), SDG 11 (“Sustainable Cities and Communities”), SDG 13 (“Climate Action”), SDG 15 (“Life on Land”) and SDG 16 (“Peace, Justice, and Strong Institutions”).
  • SDG 3: Predictive models and anomaly detection techniques are commonly used in healthcare for tasks such as early disease detection, predicting outbreaks, and improving diagnostics. For example, anomaly detection can identify rare but critical medical conditions or help manage imbalanced healthcare datasets.
  • SDG 9: Machine learning methods like multi-class classifiers and anomaly detection are vital for fostering innovation in industries such as manufacturing (e.g., detecting defects), transportation (e.g., anomaly detection in logistics), and infrastructure (e.g., monitoring structural integrity).
  • SDG 11: Anomaly detection is used in urban systems for monitoring air quality, managing traffic, and detecting energy consumption patterns, which are essential for building sustainable cities.
  • SDG 13: Machine learning helps us to monitor and predict environmental changes, detect anomalies in climate data, and classify weather patterns. Analysing imbalanced datasets (e.g., rare climate events) is critical for accurate predictions and timely action.
  • SDG 15: Classification techniques Applied to ecological and environmental data help in promoting sustainable use of ecosystems and foster biodiversity (e.g., data on endangered species, camera trap images).
  • SDG 16: Anomaly detection is used in cybersecurity to detect fraud, corruption, and irregularities in governance systems. Multi-class classifiers can help categorise risk levels in conflict zones or detect anomalies in justice systems data.

Sumário/programa


  1. Understanding Imbalanced Data
    • Definition and challenges.
    • Examples of imbalanced datasets in real-world applications.
    • Impact on predictive modeling and evaluation metrics.
  2. Overview of Techniques to Handle Imbalanced Data
    • Resampling strategies: oversampling, undersampling, and synthetic data generation (e.g., SMOTE).
    • Algorithmic techniques: cost-sensitive learning and ensemble methods
  3. Key Concepts in Multi-Class Classification
    • Differences between binary and multi-class problems.
    • One-vs-All and One-vs-One strategies.
  4. Algorithms for Multi-Class Classification
    • Random Forest, Gradient Boosting Machines (e.g., XGBoost), and Support Vector Machines.
    • Handling imbalance within these algorithms.
  5. Practical Example in R
    • Walkthrough of a multi-class classification problem.
    • Dataset preparation, feature engineering, and resampling.
    • Model training using caret or tidymodels.
  6. Understanding Anomaly Detection
    • What constitutes an anomaly?
    • Application areas: fraud detection, manufacturing defects, disease identification.
  7. Methods for Anomaly Detection
    • Statistical methods: Z-score and IQR-based detection.
    • Machine learning approaches: Isolation Forest, Local Outlier Factor (LOF), autoencoders, Angle-based outlier detectors (ABOD), Mahalanobis Distance, Minimum Covariance Determinants.
  8. Practical Example in R
    • Using the isotree package for Isolation Forest.
    • Evaluating anomaly detection results: Precision, Recall, F1-score.
  9. Challenges with Traditional Prediction Metrics
    • Limitations of accuracy and the need for alternative metrics.
  10.  Metrics for Imbalanced Data
    • Precision, Recall, F1-score, and their multi-class generalisations.
    • Area Under the ROC Curve (AUC) and Precision-Recall Curve.
  11.  Choosing the Right Metric
    • Aligning metrics with the problem’s goals (e.g., high recall for medical diagnostics).
  12.  Practical Example in R
    • Calculating and visualising metrics for imbalanced datasets.
    • Comparing models using cross-validation and appropriate metrics.
  13.  Conclusion and Q&A
    • Recap of Key Points.
    • Resources for Further Learning (books, papers, R packages).

Público-alvo


This short course is designed for students in their 3rd/4th year of an undergraduate degree in Statistics and for postgraduates in related areas.

Iris Pigeot

Leibniz Institute, Germany

Prof. Dr. Iris Pigeot is the Director of the Leibniz Institute for Prevention Research and Epidemiology – BIPS and a professor at the University of Bremen. Prof. Pigeot is the president of the International Biometric Society (IBS). Her research focuses on innovative statistical approaches in areas such as pharmacoepidemiology, prevention research, and complex data analysis. Prof. Pigeot is widely recognized for her dedication to advancing biostatistics and fostering collaboration among researchers globally.

Website pessoal

Ana Julia Alves Câmara

UFES

Graduada, mestre e doutora em Estatística pela Universidade Federal de Minas Gerais com período sanduíche na Université Paris-Saclay (CentraleSupélec). É professora do Departamento de Estatística da Universidade Federal do Espírito Santo. Suas áreas de interesse incluem Séries temporais, Métodos de regressão, Métodos robustos e Análise multivariada, com aplicações em saúde, meio ambiente e economia. Participou de projetos interdisciplinares como o AsmaVix, que investiga o impacto da poluição na saúde respiratória de crianças e adolescentes, e participa de iniciativas que promovem a igualdade de gênero em STEM, como do capítulo R-Ladies na cidade de Vitória/ES.

Currículo Lattes

Leonardo Soares Bastos

FIOCRUZ

Leo Bastos é pesquisador titular do Programa de Computação Científica da Fundação Oswaldo Cruz. Atua no desenvolvimento e aplicação de aprendizagem bayesiana na epidemiologia das doenças infecciosas. Coordena os sistemas de monitoramento de casos de arboviroses, InfoDengue, e de hospitalizações e óbitos pela síndrome respiratória aguda grave, InfoGripe. É Cientista Nosso Estado da FAPERJ e bolsista de produtividade do CNPq.

Currículo Lattes

Elisângela Rodrigues​

UFC/Cidacs-Fiocruz-BA

Professora de Estatística e Ciência de Dados na Universidade Federal do Ceará (UFC) e pesquisadora associada no Cidacs/Fiocruz-BA na área de Estatística e Ciência de Dados para saúde. Pós-doutorado em estatística aplicada à saúde pelo Cidacs/Fiocruz-BA. Doutora em Estatística pela Universidade de São Paulo (IME-USP). Mestre em Matemática Aplicada e Estatística pela Universidade Federal do Rio Grande do Norte (UFRN). Bacharel em Estatística e Especialista em Matemática Pura e Aplicada pela Universidade Estadual da Paraíba (UEPB). Áreas de interesse em pesquisa: Análise de Sobrevivência, Modelos de Regressão, Aprendizado de máquinas e Big Data. Atualmente é vice-coordenadora do RESET Lab - Laboratório de Pesquisa e Desenvolvimento em Ciência do Software e Integração de Dados e membro da equipe do Mental Health For All Lab da Faculdade de Medicina de Harvard.

Currículo Lattes

Maria Yury Travassos Ichihara

Cidacs/Fiocruz-BA

Doutora em Saúde Pública, é professora colaboradora do Programa de Pós-graduação e pesquisadora colaboradora do Instituto de Saúde Coletiva, Foi vice-coordenadora do Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS),unidade do Instituto Gonçalo Moniz/FIOCRUZ, que realiza o manejo de grande volume de dados para avaliação de determinantes sociais e de impacto de politicas públicas na saúde no período de 2016 a 2023. Atualmente, é assessora especial e líder do planejamento estratégico e de sustentabilidade do Cidacs e atua como líder na área de Desenvolvimento de Capacidades no projeto SEDHI em parceria com pesquisadores do Equador e Glasgow. Dentre os projetos nos quais participa como pesquisadora, destaca-se o projeto da Coorte de 100 milhões de brasileiros para análise de efeitos de determinantes sociais e políticas públicas na saúde da população brasileira, com ênfase na saúde materno-infantil, na ocorrência de doenças infecciosas e doenças crônicas e mortalidade.Colaborou no desenvolvimento oo ìndice Brasileiro de Privação, medida de privação material em setores censitários brasileiros.Também coordenou a construção do Indice de desigualdades sociais na Covid-19 e colabora na construção do Indice Brasileiro de Promoção da Saúde conduzido pelo Instituto de Saúde Coletiva da UFBa. Participou de estudos de determinantes sociais e avaliação do impacto do Programa Bolsa Família na incidência de sífilis gestacional e congênita, avaliação de efetividade da vacinas (BCG, influenza, rotavirus, Covid-19), avaliação de capacidades básicas de vigilância e resposta para atendimento ao Regulamento Sanitário Internacional, além dos seguintes temas: tuberculose, saúde materno-infantil, IST, e vigilância epidemiológica). Concebeu e apoiou o desenvolvimento da Plataforma de dados agregados (PDD) com o objetivo de captar dados públicos demográficos, indicadores socioeconômicos, saúde, cobertura e oferta de serviços de saúde, para realizar análises utilizando desenhos ecológicos para avaliação de determinantes sociais e avaliação de impacto de intervenções, programas e políticas sociais. Tem conhecimento no uso de dados governamentais nos seus aspectos de curadoria, transformação em dados de pesquisa, privacidade dos dados pessoais. Desenvolveu experiência na elaboração e execução de projetos com parceiros internacionais como a London School of Hygiene and Tropical Medicine, University of Glasgow, Fundação Bill Melinda Gates, com instituições nacionais de ensino e pesquisa, e com o MInistério da Saúde, o Ministério de Desenvolvimento Social, Ministério das Cidades, entre outros. Faz parte do advisory board do Lancet Global Health.

Currículo Lattes

Laís Picinini Freitas

PROCC- FIocruz-RJ

Pesquisadora no Programa de Computação Científica, Fundação Oswaldo Cruz (PROCC/Fiocruz). Possui mestrado e doutorado em Epidemiologia em Saúde Pública pela Escola Nacional de Saúde Pública Sergio Arouca (ENSP/Fiocruz), pós-doutorado no PROCC/Fiocruz e no Centre de recherche en santé publique (CReSP), Université de Montréal, Canadá. Sua pesquisa centra-se na utilização de modelos Bayesianos inovadores para estudar a distribuição espacial e espaço-temporal de doenças transmissíveis, em particular arboviroses, e a sua relação com fatores socioeconômicos, climáticos e ambientais. Integrante do projeto CALMAS (Clima e América Latina: Modelagem de Agravos em Saúde) e do Grupo de Métodos Analíticos em Vigilância Epidemiológica (MAVE), e colaboradora do InfoDengue e do InfoGripe.

Currículo Lattes

Raphael de Freitas Saldanha

ICICT - Fiocruz-RJ

Raphael Saldanha é geógrafo, especialista em Métodos Estatísticos Computacionais, mestre em Saúde Coletiva e doutor em Informação e Comunicação em Saúde. Contribui com a comunidade R desde 2009 com scripts, pacotes e aplicações em R Shiny, incluindo o pacote {microdatasus} para download e pré-processamento de dados de saúde.

Currículo Lattes

Resumo completo



Na sessão temática “Fiocruz: Saúde com Dados”, destacamos avanços e aplicações na análise de dados voltados para a saúde pública, apresentando abordagens inovadoras em modelagem estatística e estudos sobre desigualdades sociais.

Na palestra “Modelos Bayesianos espaço-temporais para dados de vigilância: distribuição, fatores associados, e predição de epidemias de arboviroses”, foi abordada a utilização de modelos estatísticos bayesianos para analisar padrões espaço-temporais de epidemias, como dengue, zika e chikungunya. Os pesquisadores exploraram a capacidade desses modelos de identificar fatores de risco, prever surtos e auxiliar na alocação de recursos para vigilância epidemiológica.

Já a palestra “Desigualdades sociais em saúde e impacto de políticas sociais no Brasil: evidências produzidas no Cidacs” trouxe à tona os resultados de estudos realizados pelo Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs). As análises revelaram que esses estudos vêm produzindo evidências robustas sobre desigualdades sociais e avaliação de políticas sociais a partir do uso de grandes bases de dados integradas e o desenvolvimento de tecnologias de Big Data. Serão apresentadas as evidências que foram produzidas pelos pesquisadores do Cidacs em relação à saúde materno-infantil, doenças infecciosas, nutrição e doenças crônicas não transmissíveis como câncer, por exemplo.

Na terceira palestra, “Democratização de acesso a dados de saúde, ambiente e clima com o R: a experiência do LIS/ICICT/Fiocruz”, destacamos o uso da linguagem de programação R como ferramenta para facilitar o acesso a dados de saúde e clima, promovendo a transparência e o uso de informações em pesquisas e políticas públicas. A combinação dessas temáticas ilustra como a estatística e a ciência de dados podem ser uma ferramenta poderosa para enfrentar desafios complexos de saúde pública, desde a previsão de epidemias até a promoção de equidade no acesso à saúde, além de reforçar a importância de dados e tecnologias como bases para ações mais eficazes e equitativas em saúde pública. 


Palavras-chave: Modelagem bayesiana; Vigilância Epidemiológica, Desigualdades sociais; Big data; Saúde pública; Estatística; Ciência de dados, Dados ambientais e climáticos, Linguagem de programação R.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 1 (“Erradicação da pobreza”), o ODS 3 (“Saúde e Bem-Estar”), o ODS 9 (“Parcerias e meios de implementação”), o ODS 10 (“Redução das desigualdades”) e o ODS 17 (“Parcerias e meios de implementação”). A sessão temática “Fiocruz: Saúde com Dados” está fortemente alinhada aos Objetivos de Desenvolvimento Sustentável (ODS), ao integrar ciência de dados, tecnologia e políticas públicas para enfrentar desafios de saúde e promover a equidade. Contribui diretamente para o ODS 3, ao apresentar soluções como modelos espaço-temporais para o controle de arboviroses e ferramentas para democratizar o acesso a dados de saúde e clima, essenciais para ações preventivas e políticas baseadas em evidências. Relaciona-se ao ODS 10, ao tratar do impacto de políticas públicas na redução de disparidades em saúde, e ao ODS 1, ao explorar como intervenções sociais beneficiam populações vulneráveis. A democratização do acesso a dados, promovida pelo uso do R, reflete o avanço em inovação e tecnologia, contribuindo para o ODS 9, ao mesmo tempo em que fortalece o ODS 17, ao incentivar o uso colaborativo de dados para a tomada de decisões e o avanço da pesquisa. Dessa forma, a sessão ilustra como ciência e tecnologia podem ser aliadas para alcançar os ODS de maneira inclusiva e sustentável.

Palestrantes e palestras


  • Maria Yury Travassos Ichihara (Cidacs/Fiocruz-BA) – Desigualdades sociais em saúde e impacto de políticas sociais no Brasil: evidências produzidas no Cidacs
  • Laís Picinini Freitas (PROCC – Fiocruz-RJ) – Modelos Bayesianos espaço-temporais para dados de vigilância: distribuição, fatores associados, e predição de epidemias de arboviroses
  • Raphael de Freitas Saldanha (ICICT – Fiocruz-RJ) – Democratização de acesso a dados de saúde, ambiente e clima com o R: a experiência do LIS/ICICT/Fiocruz

Waldomiro Barioni Júnior

Embrapa Pecuária Sudeste

Doutorado – USP/UFscar (2019, trancado); Mestre em Estatística e Experimentação Agronômica pela Esalq/USP, Campus de Piracicaba (1995), Bacharel em Estatística pela Universidade Estadual de Campinas - Unicamp, Campinas (1987). É pesquisador da Embrapa há 34 anos, desde 1989, na área de Estatística Experimental. Desde 2004 atua na Embrapa Pecuária Sudeste/São Carlos/SP e de 1989 a 2003 na Embrapa Suínos e Aves/Concórdia/SC, onde foi também supervisor de 1996 a 2000. É Secretário da Comissão de Estudos de Normas ISO – ABNT de identificação eletrônica de animais por rádio frequência. Atua em projetos de Rastreabilidade e identificação eletrônica de animais desde 2005. Foi Consultor de programas do MAPA (1996 a 2018). Membro do Conselho Diretor da RBRAS em várias gestões. Atuou como criador da primeira Sessão Temática Embrapa na RBRAS e SEAGRO (2001). Foi também pesquisador na Embrapa Territorial (1989). Foi professor na UNOCHAPECO/Chapecó/SC, Universidade do Contestado – Concórdia/SC e SENAC/Concórdia/SC.

Currículo Lattes

Betúlia de Morais Souto

Embrapa Sede

Atualmente trabalha na coordenação da Rede ODS Embrapa (Agenda 2030) na Embrapa Sede, Supervisão de Parcerias Públicas. Analista da Empresa Brasileira de Pesquisa Agropecuária (Embrapa), onde atuou nas áreas de Biologia Molecular, Microbiologia e Enzimologia no Laboratório de Genética e Biotecnologia de Microrganismos da Embrapa Agroenergia. Possui graduação em Ciências Biológicas e mestrado em Biologia Molecular pela Universidade de Brasília e especialização pela Escola Fiocruz de Governo.

Currículo Lattes

Wilson Tadeu Lopes da Silva

Embrapa Instrumentação

Possui graduação em Química pela Universidade de São Paulo, com mestrado e doutorado em Ciências (Química Analítica) pela mesma Universidade. Foi cientista visitante na Universidade de Nantes (França), de setembro de 1997 a agosto de 1998. Entre março/2000 e fevereiro/2002, foi professor de Química (Geral e Analítica) na Universidade Federal de Uberlândia (UFU). Ingressou na Embrapa Instrumentação em Junho/2002, onde atualmente é Pesquisador. Tem experiência na área de Química, com ênfase em Química Ambiental e Engenharia Sanitária. Atua principalmente nos seguintes temas: química de solos e águas, tecnologias e processos aplicados saneamento básico rural, reúso de agrícola de efluentes e resíduos orgânicos, matéria orgânica do solo e métodos analíticos aplicados aos problemas ambientais. Coordenou a elaboração do curso virtual em Saneamento Básico Rural, lançado pela Embrapa. Exerceu no período de março/2015 a junho/2018, a função de Chefe Adjunto de Pesquisa e Desenvolvimento da Embrapa Instrumentação.

Currículo Lattes

Daniel de Castro Victoria

Embrapa Agricultura Digital

Pesquisador da Embrapa Agricultura Digital, possui graduação em Engenharia Agronômica pela Universidade de São Paulo (2002), mestrado em Ecologia Aplicada pela Universidade de São Paulo (2004) e Doutorado em Ciências pelo Centro de Energia Nuclear na Agricultura, CENA-USP (2010). Tem experiência na área de agrometeorologia, geoprocessamento, sensoriamento remoto, mudanças no uso e cobertura das terras e modelagem hidrológica. Atua no Zoneamento Agrícola de Risco Climático (ZARC), na curadoria das bases de dados meteorológicos e no impacto das mudanças climáticas.

Currículo Lattes

Resumo completo



A Empresa Brasileira de Pesquisa Agropecuária – EMBRAPA, vinculada ao Ministério da Agricultura, Pecuária e Abastecimento – MAPA, tem como missão “Viabilizar soluções de pesquisa, desenvolvimento e inovação para a sustentabilidade da agricultura, em benefício da sociedade brasileira”. A EMBRAPA implantou na empresa a politica vinculada a Agenda 2030 da ONU que procura alinhar as suas ações de pesquisa a cada um dos 17 ODS de forma a promover a agropecuária brasileira como um importante setor para o protagonismo do desenvolvimento humano, econômico e ambiental, com foco na segurança alimentar e em alimentos seguros, produzidos com responsabilidade social e saúde única. A Embrapa instituiu a sua Rede ODS com olhar corporativo, tanto estratégico como operacional. Durante a sessão será feito uma abordagem geral sobre os ODS, suas metas e indicadores, com destaque de alguns casos de sucesso, de tecnologias e ações, desenvolvidas pela Embrapa, associadas a um ou mais ODS. Serão discutidas, também, algumas estatísticas dos ODS a nível mundial. Bem como, de que maneira a ciência de dados pode auxiliar no cumprimento das metas.


Palavras-chave: Agenda 2030, ODS, Agricultura, Sustentabilidade e Embrapa.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com a maior parte dos ODS. O trabalho da Embrapa se  vincula a maioria dos 17 ODS, com foco na produção de alimentos alinhado à geração de inovação sustentável no campo e na contribuição para a melhoria da qualidade de vida das pessoas. 

Palestrantes e palestras


  • Betúlia de Morais Souto (Embrapa Sede) – Implantação da rede ODS na Embrapa, metas, indicadores e casos de sucesso;
  • Wilson Tadeu Lopes da Silva (Embrapa Instrumentação) – Dados e informações atuais do Saneamento rural e ações para a universalização;
  • Daniel de Castro Victoria (Embrapa Agricultura Digital) – Gestão e processamento dos dados para geração do Zoneamento Agrícola de Risco Climático (ZARC).

Doris Satie Maruyama Fontes

CONRE-3

Bacharel em Estatística pelo IME-USP; tem atuado como conselheira do CONRE-3 (Conselho Regional de Estatística da 3ª Região) desde 2004, sempre com o foco na maior divulgação e fortalecimento dos Bacharelados em Estatística e dos profissionais Estatísticos. Os principais meios de divulgação têm sido as Feiras de Profissões (Ensino médio público/privado e na USP), eventos estatísticos dos Bacharelados em Estatística, Tenda da Estatística nas reuniões anuais e regionais da SBPC, Feiras de Ciências, entre outras atividades. Atualmente exerce o cargo de Tesoureira.

Website pessoal

Geovane Carlos Barbosa

IFES

Bacharel em Estatística pela UFES, mestre em Engenharia Ambiental pela UFES, Doutorado no Programa de Pós- Graduação em Ensino de Ciências e Matemática pela UNICSUL e Pós Doutorando em Educação Matemática pela UFOP. Atualmente é professor do IFES/Cachoeiro de Itapemirim. Atua no curso de Licenciatura em Matemática e participa dos seguintes grupos de pesquisa: Grupo de Estudos em Matemática, Estatística e Probabilidade Aplicada (GEMEPA) do IFES, Grupo de Pesquisa em Educação Estatística (GPEE) da Unesp/Bauru, Líder do Grupo Interdisciplinar de Pesquisa em Educação Estatística e Matemática (GIPEEM), UNICSUL/SP, Núcleo de Estudos, Pesquisas e Práticas de Formação de professores que ensinam Matemática (NEPEFEM) – UFOP, Membro do Grupo de Trabalho em Educação Estatística do GT-12 e Membro da SBEM. É professor permanente do Programa de Pós-Graduação em Educação, Ciências e Matemática do IFES, com foco na linha de pesquisa Educação Estatística.

Currículo Lattes

Mário Hissamitsu Tarumoto

Unesp

Estatístico pela Universidade Estadual Paulista Júlio de Mesquita Filho (Unesp). Possui mestrado em Estatística e doutorado em Matemática Aplicada pela Universidade Estadual de Campinas (Unicamp). É professor na área de Estatística do Depto de Estatística da Unesp e atuando como Docente no Curso de Estatística da FCT/Unesp e no Programa de Pós-Graduação em Matemática Aplicada e Computacional na área de Modelagem Estatística. Tem experiência na área de Probabilidade e Estatística, Técnicas de Amostragem e Modelagem Estatística, com ênfase em Análise de Dados e Métodos Computacionais, atuando principalmente nos seguintes temas: análise de sobrevivência, modelos de regressão, modelos de riscos competitivos, modelos de riscos de crédito, avaliação educacional e modelos de markov aplicados em dados de poluição ambiental. Tem orientado projetos na área de modelagem estatística ao nível de mestrado, de Iniciação Científica na graduação e também de Iniciação Científica no Ensino Médio. Colabora com o CONRE-3 como conselheiro desde sua primeira eleição após o período sob administração do CONFE. Foi eleito efetivo para as gestões de 2011-2013, 2014-2016, 2017-2019, 2020-2022 e 2023-2025. Tem atuado na divulgação da Profissão de Estatístico no Ensino Médio das escolas públicas e privadas e também pelo fortalecimento de Empresas Juniores da área de estatística para os alunos de Graduação em Estatística, com foco na atuação do estatístico no mercado de trabalho. Ministra palestras e auxilia os alunos a entenderem como funciona burocraticamente e na prática uma Empresa Jr. e as responsabilidades que surgem com o empreendimento. Atualmente é Assessor da Pró reitoria de Graduação da Unesp.

Currículo Lattes

Resumo completo



Estamos vivendo uma era onde, de forma muito rápida, a tecnologia vem ganhando espaço no cotidiano do cidadão, seja dentro das escolas, do mercado de trabalho, no lazer, no convívio familiar. No entanto, grande parte dessas tecnologias demanda um mínimo de conhecimento técnico e/ou cultural do usuário para melhor aproveitamento da “inteligência artificial”. Vamos dizer que as novas tecnologias demandam um Pensamento Crítico ou Pensamento Estatístico minimamente desenvolvido do usuário. Um ChatGPT só produzirá uma resposta aproveitável se o prompt tiver sido bem elaborado. No entanto, para elaborar um prompt aproveitável, é necessário que o usuário tenha um mínimo de conhecimento do assunto.

Uma parte significante dos problemas hoje gira em torno da dificuldade de se desenvolver pensamentos lógicos, principalmente pela falta de compreensão numérica (numeracia). As falhas no aprendizado iniciam-se já no EF1 por um ensino fraco em matemática e, muito pior, senão nulo, em estatística e probabilidade, que vai seguir se agravando ao longo de todo o EF2 e EM.

Quando o jovem ingressa num curso superior, na grande maioria dos cursos, a estatística e probabilidade serão lecionadas como curso introdutório. No entanto, o formato frequentemente utilizado, baseado em modelos dos anos 70 ou 80, além de não atrair a atenção dos alunos, exige um conhecimento mínimo de matemática que os alunos nunca tiveram. Mais uma etapa onde há desperdício de oportunidade para aprender a pensar criticamente.

Assim, uma EDUCAÇÃO DE QUALIDADE, sobretudo em Matemática, Estatística e Probabilidade, é fundamental para que cada pessoa possa exercer plenamente a sua cidadania, seja nas decisões pessoais para sua sobrevivência, seja na leitura de notícias e ter capacidade/discernimento para decidir se é legítimo ou fake-news.


Palavras-chave: ensino de estatística; uso de tecnologias para ensino;
pensamento crítico e cidadania; pensamento estatístico.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 4 (“Educação de qualidade”).

Luiz Alexandre Peternelli

UFV

Possui graduação em Agronomia (1988) e mestrado em Genética e Melhoramento (1992) pela Universidade Federal de Viçosa (1992), e doutorado em Statistics And Plant Breeding pela Iowa State University of Science and Technology (1999). Realizou três afastamentos sabáticos nas áreas de métodos estatísticos avançados aplicados ao melhoramento de plantas, genética estatística e genômica, e Modelos de Aprendizado Estatístico. Foi Pró-Reitor de Pesquisa e Pós-Graduação na UFV de março/2015 a maio/2019. Atualmente é professor titular da Universidade Federal de Viçosa e pesquisador sênior do Programa de Melhoramento da cana de açúcar na UFV. Atua, como pesquisador, em outros programas de melhoramento na UFV. Revisor científico de várias revistas nacionais e internacionais, além de consultor de agências de fomento. Tem experiência na área de Probabilidade e Estatística Aplicada, com ênfase em Estatística, atuando principalmente nos seguintes temas: Modelos Mistos, delineamentos experimentais, simulação estocástica, cana-de-açúcar, melhoramento vegetal, seleção genômica, modelos preditivos para dados de NIR, aprendizado estatístico (Statistical learning) e análise de imagens multiespectrais.

Currículo Lattes

Maicon Nardino

UFV

Professor adjunto da Universidade Federal de Viçosa (UFV), campus Viçosa, e está lotado no Departamento de Agronomia (DAA). Atua como docente e orientador nos programas de pós-graduação em Genética e Melhoramento (PPGGM) e Fitotecnia (PPGFit) da UFV. Tem seus projetos e pesquisas voltados para a área de genética e melhoramento de plantas. É o coordenador de pesquisa do Programa Trigo da UFV e presidente da Diretoria Regional de Minas Gerais da Sociedade Brasileira de Melhoramento de Plantas, 2024-2025.

Currículo Lattes

Tiago Olivoto

UFSC

Professor Adjunto no Departamento de Fitotecnia da Universidade Federal de Santa Catarina (UFSC), onde coordena o programa de melhoramento genético do linho do Núcleo de Estudos e Pesquisas em Experimentação e Melhoramento Vegetal (NEPEM). Desenvolve atividades relacionadas ao planejamento, condução e análise de experimentos com culturas anuais, com foco no aprimoramento de métodos estatísticos e experimentais para a avaliação de ensaios multi-ambientes no contexto do melhoramento genético de plantas. É autor dos pacotes metan e pliman para o software R, amplamente utilizados em análises estatísticas e fenotípicas, e do aplicativo PlimanShiny, voltado para a implementação de pipelines de fenotipagem de alto rendimento.

Currículo Lattes

Resumo completo



O aumento populacional gera a necessidade de aumento da oferta de alimentos dos mais diversos. Em especial, em se tratando de alimentos de origem vegetal, destacam-se diversas culturas como o milho, a soja, o trigo e a cana-de-açúcar. Especificamente, o trigo é a base para a produção de pães e massas alimentícias, enquanto que a cana-de-açúcar contribui tanto para a produção de açúcar quanto para etanol. O aumento da produção alimentícia sem maiores danos ou invasões de áreas é possível quando se pensa no aumento da produtividade, de modo mais eficiente e econômico. Nesse sentido podemos falar sobre o melhoramento como forma de  melhorar a oferta de alimentos sem ter que aumentar a área cultivada, mas sim melhorando a produtividade por meio de variedades geneticamente superiores. Atualmente tem-se buscado otimizar os programas de melhoramento genético por  meio de técnicas de fenotipagem de alto rendimento e que, por meio de algoritmos computacionais, possam auxiliar o melhorista na tomada de decisão quanto à seleção dos genótipos mais adequados. Nesta sessão temática, serão abordados exemplos de aplicação, na cultura do trigo e da cana-de-açúcar, de uso de tecnologias de imagens multiespectrais e de espectros no infravermelho próximo como meio de otimizar as coletas de dados “indiretos” para seleção de genótipos nas etapas iniciais dos programas de melhoramento. Fechando a sessão, será apresentado um pacote computacional que permite, de maneira fácil, rápida e eficiente, as análises dos dados obtidos de imagens digitais.


Palavras-chave: eficiência de seleção; ganho genético; modelos de predição.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 2 (“Fome zero e agricultura sustentável”). O melhoramento de plantas é o caminho mais seguro para o aumento da oferta de alimentos de maneira sustentável, sem avanço na área de exploração agrícola. Com o aumento da produtividade de culturas importantes, é possível acabar com a fome e alcançar a segurança alimentar e melhoria da nutrição.

Palestrantes e palestras


  • Luiz Alexandre Peternelli (UFV) – Otimização do programa de melhoramento da cana com dados espectrais 
  • Maicon Nardino (UFV) – Como posso otimizar meu programa de melhoramento: uma visão de HTP para trigo
  • Tiago Olivoto (UFSC) – Recursos computacionais para as análises de imagens

Clécio da Silva Ferreira

UFJF e Diretoria da ABE
Currículo Lattes

Fernanda Schumacher

Ohio State University, US

Fernanda Lang Schumacher is an assistant professor at the Division of Biostatistics of The Ohio State University College of Public Health. She completed her Ph.D. in Statistics in 2021 at the University of Campinas, Brazil, where she also obtained a master’s degree in Statistics in 2016. Her research interests include robust models, longitudinal data, skewed distributions, models for censored data, missing data, variable selection for mixed models, and multiple sclerosis disease.

Website pessoal

Márcio Diniz

Mount Sinai, NY

Marcio Diniz, PhD is an Associate Professor in the Department of Population Health Science and Policy at the Icahn School of Medicine at Mount Sinai. He currently co-directs the Biostatistics and Clinical Informatics Shared Resource at Tisch Cancer Institute. Previously, he was an Associate Professor of the Department of Medicine at Cedars-Sinai Medical Center and member of the Biostatistics Shared Resource at Samuel Oschin Cancer Institute. His research area is focused on efficient statistical designs, adaptive clinical trials and statistical methods to analyze treatment tolerability. As a biostatistician for the last 10 years, he has dedicated himself to the design and analysis of clinical data using a spectrum of study designs, from pilot studies to community intervention trials, in a variety of clinical areas, including cancer, cardiology, psychiatry, gerontology, health services and gastroenterology.

Website pessoal

Victor Hugo Lachos

University of Connecticut, US

Victor Hugo Lachos Dávila é professor na University of Connecticut (UConn) e doutor em Estatística pela Universidade de São Paulo. Sua pesquisa concentra-se em modelos de efeitos mistos, análise de dados censurados, distribuições assimétricas e modelos de mistura, com aplicações que envolvem modelagem robusta e estruturas complexas de dados. É autor de dezenas de artigos publicados em periódicos internacionais de prestígio, como Journal of Multivariate Analysis, Biometrics e Statistics in Medicine, além de coautor do livro Finite Mixture of Skewed Distributions publicado pela Springer. Também atua como editor associado de periódicos relevantes na área de estatística e participa ativamente da comunidade acadêmica internacional, com colaborações frequentes em universidades brasileiras e estrangeiras.

Currículo Lattes

Resumo completo


 
O objetivo é discutir o uso de novas tecnologias baseadas em inteligência artificial no ambiente de trabalho, tanto em termos de pesquisa como em aplicações.

Palavras-chave: ChatGPT, Inteligência artificial, ensaios clínicos.

Com qual(is) ODS a Sessão Temática proposta se relaciona?



A Sessão Temática está relacionada com o ODS 4 (“Educação de qualidade”).

Fernando Almeida Barbalho

Ministério da Fazenda

Doutor em Administração pela Universidade de Brasília (2014). É auditor federal de finanças e controle da Secretaria do Tesouro Nacional (STN), atualmente em exercício na Diertoria de Assuntos Econômicos e Sociais da Vice-Presidência da República . A trajetória profissional e acadêmica mais recente está principalmente relacionada a dados abertos e desenvolvimento de produtos que resultem em maior transparência do Setor Público brasileiro. Nos finais de semana costuma utilizar o R para investigar perguntas de pesquisa que escapam ao mundo das finanças públicas.

Currículo Lattes

Resumo completo



Proponho um tutorial que explore a intersecção entre os Objetivos de Desenvolvimento Sustentável (ODS) 6 e 10, com foco na análise estatística de  dados sobre acesso a água potável e saneamento no Brasil, à luz das desigualdades regionais e raciais. O ODS 6 aborda o acesso universal e equitativo a água potável e segura, além do saneamento e higiene, com atenção especial às necessidades de mulheres, meninas e populações vulneráveis. Já o ODS 10  destaca a redução das desigualdades, um tema central quando se avalia a  situação brasileira, marcada por profundas disparidades. 

Com base nos dados do Censo 2022 divulgados pelo IBGE, é possível conduzir análises detalhadas considerando características dos domicílios, acesso a redes de água, presença de banheiros, tipos de esgotamento sanitário, bem como informações sobre cor e raça dos moradores e a localização regional das  residências, incluindo favelas. Esses dados permitem um panorama abrangente das desigualdades no acesso a recursos básicos em diferentes cidades brasileiras. 

O tutorial proposto seguirá um fluxo estruturado, começando com a coleta automática de dados usando o pacote R {sidrar}, avançando para uma análise exploratória de dados para compreender padrões e tendências, e culminando em  análises avançadas, como a clusterização de cidades com base em critérios de acesso a água e saneamento. O objetivo é capacitar os participantes a realizar análises robustas e aprofundadas, que possam embasar políticas públicas e  intervenções direcionadas para melhorar o acesso equitativo a esses recursos essenciais. 


Palavras-chave: Linguagem de Programação R, ODS 6, ODS 10, SIDRA, Censo 2022.

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 6 (“Água potável e saneamento”) e o ODS 10 (“Redução das desigualdades”).   O tutorial conecta os ODS 6 e 10 ao abordar o acesso a água potável e saneamento no Brasil sob a ótica das desigualdades regionais e raciais. Utilizando  dados do Censo 2022, propõe análises que evidenciam disparidades e exclusões,  alinhando-se aos objetivos da Agenda 2030. Assim, oferece ferramentas para embasar políticas públicas mais inclusivas e equitativas.

Público-alvo


Este tutorial é voltado para estudantes de graduação e pós-graduação.

Fábio Prataviera

ESALQ/USP

Professor Doutor no Departamento de Ciências Exatas da Escola Superior de Agricultura "Luiz de Queiroz" - Universidade de São Paulo (ESALQ - USP). Realizou pós-doutorado pela Universidade Federal de Pernambuco (UFPE). É Doutor e Mestre em Ciências na área de Estatística e Experimentação Agronômica pela Escola Superior de Agricultura "Luiz de Queiroz" - Universidade de São Paulo (ESALQ - USP) e Graduado em Bacharelado em Estatística pela Universidade Federal de São Carlos (UFSCar). Atuou como Consultor Técnico no Ministério da Saúde, desenvolvendo estudos estatísticos para auxiliar na construção de um sistema de classificação de pacientes (casemix) baseado em critérios clínicos. Possui experiência em Probabilidade e Estatística Aplicada, com ênfase em Análise de Sobrevivência, e atua principalmente nos seguintes temas: análise de dados censurados, modelos de regressão, novas distribuições de probabilidade, diagnóstico para modelos de regressão. Além disso, trabalha com modelos de Séries Temporais e análise de dados aplicados às Ciências Agrárias.

Currículo Lattes

Andressa Cerqueira

UFSCar

Andressa Cerqueira é professora no Departamento de Estatística da Universidade Federal de São Carlos desde 2020. Seus interesses de pesquisa incluem inferência estatística para grafos e redes aleatórias com aplicações em ciências biológicas. Ela obteve seu doutorado em Estatística pela Universidade de São Paulo em 2018. Durante o doutorado, foi estudante visitante no Institut de Mathématiques de Toulouse, na França. Realizou um pós-doutorado na Universidade de Campinas e, posteriormente, ocupou uma posição de pós-doutorado na University of Michigan.

Currículo Lattes

Patricia Emilia Braga

Butantan

Graduada em Licenciatura em Matemática pela Universidade de São Paulo (1989). Mestre (2000) e Doutora (2006) em Saúde Pública pela Universidade de São Paulo, ambos com ênfase em Bioestatística/Epidemiologia. Participou do Programa Nacional de Pós-Doutorado (PNPD) da Capes, com projeto desenvolvido na Escola de Enfermagem da USP e do Programa Nacional de Pós-Doutorado do Núcleo de Apoio à Pesquisa da USP desenvolvido no Departamento de Medicina Preventiva da Faculdade de Medicina da USP. Atualmente é Gerente de Bioestatística na Fundação Butantan.

Currículo Lattes

Elizabeth Gonzalez Patiño

Butantan

Possui graduação em Tecnologia em Sistemas de Informação em Saúde - Universidad de Antioquia (2003), graduação em Estatística - Universidad Nacional de Colombia - Sede Medellín (2009), mestrado em Estatística pelo Instituto de Matemática e Estatística (2012) e doutorado em Estatística pela Universidade de São Paulo (2018). Atualmente é Coordenadora de Bioestatística na Fundação Butantan.

Currículo Lattes

João Italo Dias França

Butantan

Possui graduação em Estatística pela Universidade Federal do Ceará (2006), mestrado em Estatística pela Universidade de São Paulo (2010) e doutorado em Epidemiologia pela Faculdade de Saúde Pública-USP (2024). Trabalhou no Hospital das Clínicas-USP (2009 a 2011) e no Instituto Dante Pazzanese de Cardiologia (2011 a 2021). Atualmente é Coordenador de Bioestatística na Fundação Butantan.

Currículo Lattes

Marcos Alves de Lima

Butantan

Mestre em Inovação em Saúde pela Faculdade de Ciências da Saúde de Barretos Dr. Paulo Prata (2021). Bacharel em Estatística pela Universidade Federal de Juiz de Fora (2015). Atualmente é Coordenador de Bioestatística na Fundação Butantan.

Currículo Lattes

Marco Antonio de Oliveira

Butantan

Mestre em Inovação em Saúde - Fundação PIO XII/FACISB (2021). Possui Especialização em Matemática pela UFSJ (2011), Bacharelado em Estatística pelo Instituto de Ciências Matemáticas e de Computação - USP/São Carlos (2014) e Licenciatura Plena em Matemática pela Universidade Estadual Paulista , UNESP, São Jose do Rio Preto, Brasil (2002). Atualmente é Coordenador de Bioestatística na Fundação Butantan compondo o setor de Ciência de Dados.

Currículo Lattes

Resumo completo



A vacina é uma estratégia eficiente de prevenção primária contra diversas doenças. No processo de desenvolvimento de uma nova vacina, são empregados métodos estatísticos para avaliar a relação risco/benefício. 

O Instituto Butantan (IB) é o principal produtor de imunobiológicos do Brasil, trata-se de um grande centro de referência em: pesquisas biológicas, produção de soros e vacinas. O IB possui como objetivo pesquisar, desenvolver, fabricar e fornecer produtos e serviços para a saúde da população, além de ter como política: melhorar a eficiência na produção de biológicos, intensificar a produção de biológicos buscando parcerias, buscar a melhoria contínua do sistema de gestão, minimizar os desvios dos processos produtivos e divulgar e popularizar o ensino de ciências. Assim o IB visa proteger a saúde pública e proporcionar o acesso a vacinas para todos. 

O IB, dentro do processo de desenvolvimento de imunobiológicos, realiza ensaios clínicos de Fase I, II, III e IV. Nesses estudos são avaliados desfechos tais como: segurança, eficácia/efetividade e imunogenicidade. Para a avaliação destes desfechos são aplicados métodos estatísticos que subsidiam as tomadas de decisão para aprovação da nova vacina junto à ANVISA. 

Nesta sessão temática, iremos apresentar alguns estudos desenvolvidos, pelo IB, contra COVID-19, infecção pelo vírus da dengue e influenza, com ênfase nos delineamentos dos estudos e nas metodologias empregadas. 

Ao final, espera-se que os participantes desta sessão temática tenham acesso a aplicações da ciência estatística em estudos reais de relevância à saúde pública.


Palavras-chave: COVID-19; vacinas; Dengue; Influenza; Saúde pública; Ensaio clínico; Estatística.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 3 (“Saúde e Bem-Estar”). Esta sessão temática se enquadra na ODS 3 (3.3 e 3.b), pois os estudos desenvolvidos pelo IB a serem apresentados visam a prevenção de doenças transmissíveis e doenças tropicais negligenciadas.

Palestrantes e palestras


  • Elizabeth Gonzalez Patiño (Butantan) – Estudo de eficácia e segurança de uma vacina: pontos de atenção
  • Marcos Alves Lima (Butantan) – Planejamento e desenho do estudo da vacina CoronaVac em Serrana
  • Patrícia Emília Braga (Butantan) – Papel do Butantan na Pandemia
  • João Ítalo Dias França (Butantan) – Estatística com foco em Ensaios Clínicos de vacinas

Rafaela Figueiredo Rodrigues

Unifal-MG

Farmacêutica Generalista pela Universidade Federal de Alfenas (UNIFAL-MG/ 2014) Mestre e Doutora em Ciências Farmacêuticas pela mesma universidade (2016/2021). Especialista em Docência de Ensino Superior para a Saúde pela Faculdade Campos Elísios (2019). Especialista em Homeopatia pelo Instituto Hahnemanniano do Brasil (2023). Realizou estágio pós-doutoral na Faculdade de Ciências Farmacêuticas da Universidade Federal de Alfenas (2022 a 2024). Foi professora substituta da Faculdade de Ciências Farmacêuticas da UNIFAL-MG (de 2022 a 2024), ministrando aulas de toxicologia, orientadora de estágio em dispensação/manipulação e Farmacêutica assistente na Farmácia Universitária. Possui ampla experiência em estudos pré-clínicos e clínicos, principalmente da área da dor. É avaliadora de alguns periódicos na área de farmácia. Foi coordenadora de pesquisa do Sinpain (2022-2024), fazendo parte da fundação da revista PainBrazil. Atualmente sou administradora da Revista Sigmae.

Currículo Lattes

Eric Batista Ferreira

Unifal-MG

Professor Titular do Departamento de Estatística da Universidade Federal de Alfenas (Unifal-MG), do Programa de Pós-graduação Stricto Sensu em Estatística Aplicada e Biometria (PPG-EAB), do Programa de Pós-graduação Stricto Sensu em Nutrição e Longevidade (PPG-NL) e do Programa de Pós-graduação Lato Sensu em Tecnologia e Qualidade na Produção de Alimentos (TecQuali). Possui formação em Laticínios (Instituto Cândido Tostes, 1998), Engenharia Agronômica (UFLA, 2002), Matemática Licenciatura (UNIFAL-MG, 2012), Física Licenciatura (UNIFAL-MG, 2020), Mestrado em Estatística e Experimentação Agropecuária (UFLA, 2004), Doutorado em Estatística e Experimentação Agropecuária (UFLA/Open University - Inglaterra, 2007), Pós-doutorado em Estatística Multivariada (UFLA, 2009) e Pós-doutorado em Sensometria (NOFIMA - Noruega, 2013). Tem experiência em Sensometria, Estatística Multivariada, Estatística Experimental, Probabilidade e Estatística aplicadas, Controle Estatístico de Processo e Cientometria.

Currículo Lattes

Tales Jesus Fernandes

UFLA

Mestre e Doutor em Estatística e Experimentação Agropecuária (2016) pela Universidade Federal de Lavras. Possui graduação em Matemática (2010) também pela UFLA. Atualmente é Professor Adjunto no Departamento de Estatística da UFLA, Coordenador do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária do DES/ICET/UFLA. É o editor-in-chief da Brazilian Journal of Biometrics (Revista Brasileira de Biometria) que é a revista oficial da RBras e atua como revisor de periódicos nacionais e internacionais. Desenvolve pesquisas com orientações de Iniciação Científica, Mestrado e Doutorado nas seguintes áreas: planejamento e análise de experimentos, curvas de crescimento, modelos de regressão lineares e não lineares, análise de regressão com desvio de pressupostos e inferência bayesiana.

Currículo Lattes

Resumo completo



A revista científica Sigmae, que desde 2012 contribui para o avanço da Matemática e Estatística por meio da divulgação de pesquisas de qualidade, propõe a realização de uma mesa redonda para explorar o impacto das tecnologias emergentes e novas práticas na comunicação acadêmica. Com o tema Publicações Científicas, Inteligência Artificial e Pré prints, a ideia da mesa é buscar reunir editores experientes para debater os desdobramentos dessa interseção tecnológica e metodológica. 

A mesa redonda contará com a participação de três editores de revistas científicas e um moderador, de diferentes áreas, que discutirão os seguintes aspectos: 

  1. A influência da inteligência artificial nas publicações científicas: abordando o uso de ferramentas de IA para revisão por pares, detecção de plágio e análise de dados submetidos, além dos dilemas éticos associados. 
  2. O papel dos pré-prints no ciclo de publicação: discutindo as vantagens e desafios relacionados à disseminação de resultados antes da revisão por pares, com ênfase em questões de credibilidade, priorização de ideias e o impacto na produção acadêmica tradicional.
  3. Como as revistas podem se posicionar: explorando as políticas editoriais diante dessas transformações e como o uso de tecnologias como IA pode contribuir para a transparência, a inclusão e a eficiência no processo editorial. 


A discussão será moderada por uma pesquisadora, garantindo que os debates abordem perspectivas variadas e atendam às demandas do público presente. A revista Sigmae propõe essa atividade como uma forma de fomentar reflexões relevantes para a comunidade acadêmica, promovendo o diálogo sobre como as publicações científicas podem evoluir em tempos de mudanças tecnológicas aceleradas.

Espera-se que o evento ofereça insights práticos e estratégicos tanto para pesquisadores quanto para outros atores envolvidos no ecossistema da comunicação científica, contribuindo para o aperfeiçoamento das práticas editoriais e a adoção de soluções inovadoras


Palavras-chave: Publicações Científicas; Inteligência Artificial; Pré-prints; Revisão Editorial; Comunicação Acadêmica.

Jodavid de Araújo Ferreira

UFPE

Atualmente é professor do Departamento de Estatística da Universidade Federal de Pernambuco (UFPE) e do Programa de Pós-Graduação em Estatística da UFPE (PPGEST). Realizou um Pós-Doutorado no Programa de Pós-Graduação em Modelos de Decisão e Saúde na UFPB (2021-2024). Possui doutorado em em Estatística pela UFPE (2021), mestrado em Estatística pela UFPE (2017) e graduação em Estatística pela UFPB (2015). É entusiasta de software livre e de código aberto (free and open-source software - FOSS) e procura estar sempre atualizado em avanços tecnológicos e temas relacionados à Inteligência Artificial, Deep Learning e Machine Learning. Desenvolve pesquisas em áreas da estatística como distribuições de Probabilidade, Probabilidade Fuzzy, Aprendizado Supervisionado (classificação), Aprendizado Não Supervisionado (segmentação, clusterização), testes de hipótese, inferência estatística, teoria da informação e IA Generativa aplicados a dados estruturados e não estruturados como processamento de imagens e áudio.

Currículo Lattes

Resumo completo


Neste tutorial, será utilizado uma abordagem para fazer correspondência de imagens utilizando a similaridade do cosseno com o algoritmo Vision Transformer (ViT) (Dosovitskiy, Alexey. “An image is worth 16×16 words: Transformers for image recognition at scale.” arXiv preprint arXiv:2010.11929, 2020). O objetivo é demonstrar uma técnica de deep learning para realizar correspondência de imagens, que se refere ao processo de identificar e emparelhar partes semelhantes ou correspondentes em duas ou mais imagens. Esta tarefa pode ser considerada complexa devido a variações de iluminação, ângulo de captura e qualidade da imagem, especialmente em cenários do mundo real, como o reconhecimento de objetos, animais ou pessoas em diferentes imagens.  A arquitetura ViT adapta o modelo Transformer – originalmente desenvolvido para tarefas de Processamento de Linguagem Natural (NLP) – para o processamento de dados de imagem utilizando embeddings, que são vetores que capturam a informação semântica, permitindo mapear dados semelhantes para pontos próximos em um espaço vetorial de alta dimensionalidade. Na correspondência de imagens, o desafio está em como representar as imagens de forma eficaz como embeddings, capturando as características relevantes. Ao aplicar técnicas de pré-processamento, como a remoção de fundo ajuda a isolar o objeto de interesse, o que auxilia em tais tarefas de reconhecimento de objetos, segmentação de imagens e correspondência.  A partir dos embeddings, a similaridade entre diferentes imagens é calculada utilizando a similaridade do cosseno. A imagem de interesse é comparada a uma base de dados de imagens, e os resultados são retornados com um score de similaridade. O score de similaridade do cosseno quantifica a semelhança entre duas imagens em termos de suas características extraídas. Essa métrica varia de -1 a 1, onde, quanto mais próximo de 1, mais alinhados estão os vetores que representam as imagens, indicando que elas compartilham características comuns. Um valor de 0 indica que os vetores de embeddings das imagens são ortogonais, o que significa que as imagens têm pouco em comum, e quanto mais próximo de -1, mais opostos são os vetores, significando que as imagens são diferentes.  Assim, este tutorial tem como objetivo abordar as etapas de pré-processamento de imagens, geração de embeddings usando Vision Transformers e cálculo de similaridade através da similaridade do cosseno com a linguagem de programação python. Espera-se que, ao final, os participantes entendam como aplicar esses métodos tanto em contextos acadêmicos quanto práticos no Mercado de Trabalho.

Palavras-chave: Vision Transformers, similaridade de imagens, deep learning, embeddings, Python.  

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 9 (“Indústria, inovação e infraestrutura”) e o ODS 15 (“Vida terrestre”).   A proposta de tutorial aborda o uso de tecnologias de deep learning para reconhecimento e similaridade de imagens, que é diretamente aplicável em setores de inovação tecnológica e infraestrutura, que são aplicações utilizadas pela ODS 9. Além disso, ao focar na identificação de animais e terrenos, por exemplo, o tutorial pode ser útil em projetos de conservação da vida terrestre (ODS 15), permitindo o desenvolvimento de soluções para monitoramento e proteção da biodiversidade.

Público-alvo


Este tutorial é voltado para estudantes de graduação, pós-graduação e pesquisadores na área da Estatística e afins.

Alfredo José Barreto Luiz

Embrapa Meio Ambiente

Alfredo Luiz, Pesquisador na Embrapa Meio Ambiente, em Jaguariúna, SP, com doutorado e pós-doutorado em Sensoriamento Remoto no Instituto Nacional de Pesquisas Espaciais (INPE), é mestre em Estatística e Métodos Quantitativos pela Universidade de Brasília (UnB) e Engenheiro Agrônomo pela Universidade Federal de Lavras (UFLa), com quase 4 décadas de atuação na interface entre estatística e pesquisa agropecuária. É autor de trabalhos técnico-científicos entre os quais destacam-se as participações nos livros: Economia do meio ambiente: teoria, políticas e a gestão de espaços regionais, 1997; Sistema de Informações Geográficas: Aplicações na Agricultura, 1998; Impacto Agroambiental: perspectivas, problemas e prioridades, que recebeu o Prêmio Jabuti 2000; Mudanças Climáticas Globais e a Agropecuária Brasileira, 2001; e Impacto Ambiental da Agricultura Irrigada em Guaíra, SP, 2006; Agricultura de precisão: um novo olhar na era digital, 2024; e Agricultura & meio ambiente: a busca pela sustentabilidade, 2024. Colaborou na elaboração do Inventário Nacional de Emissão de Gases de Efeito Estufa e na publicação Comunicação Nacional Inicial do Brasil à Convenção-Quadro das Nações Unidas sobre Mudança do Clima, editada pelo MCT em 2004. Atuou como editor do livro Computational Methods for Agricultural Research: Advances and Applications, 2011. Sua principal área de atuação é no estudo dos cenários e da dinâmica agrícola no Brasil e na realização de análises estatísticas e quantitativas de dados da pesquisa agropecuária. Atualmente, Alfredo participa de vários projetos de pesquisa da Embrapa com destaque para a análise das mudanças climáticas e as relações com a produção agropecuária.

Currículo Lattes

José Eduardo Macedo Pezzopane

UFES

José Eduardo Macedo Pezzopane, é Professor Titular na Universidade Federal do Espírito Santo (UFES), possui graduação em Engenharia Florestal (Universidade Federal de Viçosa - UFV), Mestrado em Física do Ambiente Agrícola (Universidade de São Paulo - USP), Doutorado em Ciência Florestal (Universidade Federal de Viçosa - UFV). Realizou Pós-Doutorado na Universidade de Córdoba - UCO (Espanha) e treinamento na Universidade do Estado do Kansas - KSU (Estados Unidos). Atualmente, desenvolve trabalhos na área de silvicultura, com pesquisas em meteorologia e ecofisiologia florestal. Na UFES ele atua como orientador no Programa de Pós-Graduação em Ciências Florestais (mestrado e doutorado).

Currículo Lattes

Fernando Antônio Macena da Silva

Embrapa Cerrados

Fernando Antônio Macena da Silva, Pesquisador na Embrapa Cerrados, em Brasília, DF, possui graduação em Agronomia pela Universidade Federal da Paraíba, mestrado em Ciências da Engenharia Ambiental pela Universidade de São Paulo, doutorado em Engenharia Agrícola pela Universidade Estadual de Campinas e Pós Doutorado pelo Centre de Coopération Internationale en Recherche Agronomique pour le Développement - CIRAD/França. Foi chefe de Pesquisa, Desenvolvimento e Inovação da Embrapa Cerrados e Presidente do Comitê Técnico Interno (CTI), entre os anos 2008 e 2010. É membro suplente da Câmara Temática de Gestão de Risco Agropecuário do Ministério da Agricultura e Pecuária e Abastecimento (Mapa) e membro titular do Comitê do Programa Zoneamento Agrícola de Risco Climático (ZARC). Tem experiência na área de Agronomia, com ênfase em Plantio Direto, modelagem de desenvolvimento e crescimento de plantas, impactos das mudanças climáticas na produtividade das culturas e zoneamento agrícola de risco climático para o Brasil. Publicou 37 artigos em periódicos indexados, sendo 4 artigos, nos últimos 2 anos, sobre modelagem e mudanças climáticas globais, 9 capítulos de livro, nas seguintes linhas temáticas: Manejo do solo em sistema de integração lavoura pecuária-floresta, Clima do Bioma Cerrado e Zoneamento agrícola de Risco climático. Atualmente é coordenador de projeto no Sistema Embrapa de Gestão intitulado “Avaliação de Risco e Resiliência Agroclimática – Etapa II e, liderou vários outros já concluídos. Sua pesquisa atual concentra-se na avaliação de risco e resiliência agroclimática da agricultura brasileira para o desenvolvimento de instrumentos de políticas públicas. Principalmente, no que diz respeito à indicação das melhores épocas para a realização de plantios/semeaduras como forma de viabilizar a produção agrícola com mais sustentabilidade e segurança aos pequenos, médios e grandes produtores do país.

Currículo Lattes

Resumo completo



Com influências de diferentes comunidades, a ciência de dados evoluiu para fornecer
percepções em muitos ambientes diferentes orientados por dados, incluindo as ciências
agrária e climática. Nesta sessão, será apresentada uma breve revisão da ciência de dados e sua conexão com a agrometeorologia. Além disso, serão discutidos os rumos da área para quantificar os riscos das mudanças climáticas e discutidas algumas áreas chave de pesquisa em estatística e métodos quantitativos na análise de riscos climáticos na agricultura. Com o crescente reconhecimento dos impactos e custos devidos às alterações climáticas, há uma procura crescente de avaliações práticas dos riscos climáticos. Estas avaliações podem ser utilizadas numa variedade de casos. Será discutido o impacto crítico das ciências estatísticas na análise agroclimática, como um campo em crescimento, assim como as oportunidades para estatísticos e cientistas de dados. O aquecimento global e os seus impactos sobre o clima são desafios prementes e graves que enfrentamos. A ciência de dados é uma ferramenta poderosa que se utiliza de diferentes métodos, como a identificação de anomalias, análise de séries temporais, detecção de eventos extremos, visualização de dados, identificação de relações entre causas e efeitos, aprendizagem automática, análise de cenários e avaliação de risco, para estudar os detalhes e compreender os componentes mais desafiantes das alterações climáticas. A ciência de dados permite trabalhar com grandes quantidades de informações sobre o clima, nos ajudando a compreender como as  alterações climáticas impactam a produção agrícola. Especialistas explanarão sobre as técnicas usadas em zoneamentos agrícolas de risco
climático, em análise de risco de doenças e de incêndios florestais e suas relações com as variáveis agrometeorológicas e as mudanças climáticas. O objetivo será mostrar como a
ciência de dados é vital na nossa luta contra as alterações climáticas, através da criação de modelos e da análise de dados que permitem a avaliação de riscos, redução de perigos, adaptação às mudanças e orientação de políticas, na busca de um futuro sustentável.


Palavras-chave: Mudanças climáticas, análise de risco, agrometeorologia, zoneamento agrícola e florestal.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 2 (“Fome zero e agricultura sustentável”) e o ODS 13 (“Ação contra a mudança global do clima”). A produção agrícola brasileira, conduzida em maior parte ao ar livre e sem irrigação, é altamente dependente das condições climáticas naturais que vêm sofrendo impactos do aquecimento global. Eventos extremos e mudanças climáticas podem afetar fortemente a segurança alimentar e a sustentabilidade das atividades agrícolas, temas afetos ao Objetivo 2 dos ODSs. Para compreender as mudanças climáticas, avaliar seus impactos e os riscos das atividades agrícolas decorrentes, um fator determinante é a análise precisa dos dados agrometeorológicos, que produzidos em grande quantidade dada a necessidade de monitoramento contínuo e frequente no tempo e a grande área do território brasileiro. Nesse sentido a sessão proposta se alinha com o Objetivo 13 dos ODSs.

Palestrantes e palestras


  • Prof. Dr. José Eduardo Macedo Pezzopane (UFES) – As mudanças climáticas e os riscos florestais
  • Dr. Fernando Antônio Macena da Silva (Embrapa Cerrados) – Avaliação de Riscos e Resiliência Agroclimática

Marcos Oliveira Prates​

UFMG

Em 2006 obteve seu bacharelado em Matemática Computacional pela Universidade Federal de Minas Gerais (UFMG) e seu mestrado em Estatística em 2008 pela mesma instituição. Em 2011 recebeu seu título de Doutor pela University of Connecticut aonde foi professor visitante de 2019 à 2020. Atualmente é professor Associado da UFMG e atua nos programas de graduação e pós-graduação em Estatística. Suas principais áreas de interesse de pesquisa são Aprendizado de Máquina, Estatística Bayesiana, Estatística Espacial e Modelos Lineares Generalizados Mistos. Foi Coordenador do programa de pós-graduação em Estatística da UFMG (2016-2018), foi secretário do ISBRA capítulo Brasileiro do ISBA (2015-2016) , foi Presidente da Associação Brasileira de Estatística (2020-2022), e, atualmente é tesoureiro so ISBRA capítulo Brasileiro do ISBA (2023-2024).

Currículo Lattes

Alexandre Loureiros Rodrigues

UFES

É bacharel em Estatística pela Universidade Federal do Espírito Santo (2003), mestre em Estatística pela Universidade Federal de Minas Gerais (2005) e doutor em Estatística pela Universidade de Lancaster (Inglaterra, 2010). Atualmente, é professor do Departamento de Estatística da Universidade Federal do Espírito Santo. Seus temas de interesse incluem modelos de aprendizado profundo e modelos de linguagem de grande porte (LLM), com aplicações em diversos campos, como energia, petróleo e saúde.

Currículo Lattes

Deisy Morselli Gysi

UFPR

Deisy Gysi is a Professor of Statistics at the Federal University of Paraná (UFPR) since 2023, specializing in the development and application of computational and statistical methods to address complex problems in science and medicine. Her research spans machine learning, network science, bioinformatics, and personalized medicine, with a focus on improving diagnostic tools and discovering therapeutic targets. She holds a degree in Statistics from UFPR (2012) and in Biotechnology from PUCPR (2011), a Ph.D. in Computer Science from Leipzig University (2019), and completed postdoctoral training at Northeastern University and Harvard Medical School (2019–2023). Passionate about interdisciplinary collaboration, she strives to bridge quantitative methodologies with applications in mental health, genomics, and other biomedical fields

Currículo Lattes

Resumo completo



A integração entre a Estatística e a área da Saúde possui, há muitos anos, um papel crucial
no desenvolvimento de métodos, técnicas e modelos Estatísticos. Tais pesquisas, também
impulsionam avanços significativos em pesquisa e prática clínica. Em um cenário de
crescente complexidade dos dados de saúde e a facilidade da coleta dos mesmos
provenientes de fontes como registros hospitalares, ensaios clínicos e dados de sensores, a
Estatística fornece as ferramentas adequadas para transformar esses dados em
informações que auxiliem à tomada de decisões e na formulação de políticas de saúde mais
eficazes.

A necessidade de avanços em modelagem estatística para dados médicos torna-se
evidente frente aos desafios contemporâneos, como a análise de dados de larga escala,
dados espaciais e informações de alta dimensionalidade. Essas novas demandas exigem
modelos estatísticos inovadores, capazes de lidar com a estrutura do sistema de saúde,
heterogeneidade dos dados e com incertezas inerentes à fatores biológicos.

Além disso, a aplicação de métodos estatísticos na área da saúde é fundamental para
alcançar os Objetivos de Desenvolvimento Sustentável (ODS) da ONU, fornecendo
evidências e análises necessárias para enfrentar os desafios de saúde, reduzir as
desigualdades e promover o bem-estar em uma escala global. Especificamente nossa
proposta de Seção Temática apresenta técnicas estatísticas que atuam diretamente nas
ODS 3, 10 e 17.


Palavras-chave: Aprendizado Estatístico, Biomarcadores, Câncer, Correspondência de Dados, Estatística Espacial, Modelos de Linguagem de Grande Porte.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 1 (“Erradicação da pobreza”), o ODS 2 (“Fome zero e agricultura sustentável”), o ODS 3 (“Saúde e Bem-Estar”), o ODS 10 (“Redução das desigualdades”) e o ODS 17 (“Parcerias e meios de implementação”).
  • ODS 1: A pobreza é um dos fatores determinantes da saúde e está associada a um maior risco de doenças. Uma compreensão mais profunda das desigualdades em saúde, permite identificar populações vulneráveis e monitorar a eficácia de programas de apoio. Assim, políticas de saúde pública baseadas em análises estatísticas podem ser mais direcionadas e eficazes, ajudando a reduzir as disparidades e apoiar o combate à pobreza. 
  • ODS 2: A análise de dados estatísticos em saúde inclui também o estudo de dados nutricionais e a avaliação de programas de segurança alimentar. Ao identificar deficiências nutricionais e monitorar a saúde das populações mais carentes, a Estatística ajuda na implementação de políticas de nutrição que reduzem a fome e melhoram o acesso a uma alimentação saudável.  
  • ODS 3: Métodos estatísticos permitem analisar grandes volumes de dados de saúde, identificar padrões de doenças, avaliar a eficácia de tratamentos e criar modelos preditivos para melhorar o diagnóstico e o tratamento. A análise estatística também é essencial para monitorar indicadores de saúde pública e auxiliar governos e instituições a direcionarem recursos e políticas de maneira mais eficiente, promovendo a saúde em escala global.
  • ODS 10: A interface entre Estatística e Saúde possibilita uma análise detalhada das desigualdades de saúde em diversos grupos populacionais, considerando fatores como localização geográfica, status socioeconômico, raça e idade. Isso permite que políticas de saúde pública sejam ajustadas para reduzir as disparidades e fornecer cuidados de saúde acessíveis e de qualidade para todos, especialmente em populações vulneráveis.
  • ODS 17: A coleta e análise de dados de saúde dependem da colaboração entre governos, instituições de pesquisa, setor privado e organizações internacionais. A Estatística é uma ferramenta chave para unificação de diferentes fontes de dados e monitoramento que permitem entender e quantificar o progresso dos ODS. A cooperação entre os setores e a transparência na coleta e uso dos dados fortalecem as capacidades institucionais, apoiando uma governança baseada em evidências.

Palestrantes e palestras


  • Alexandre Loureiros Rodrigues (DEST/UFES) – Matching de Procedimentos Médicos: Soluções Inteligentes com Modelos de Linguagem de Grande Porte 
  • Deisy Morselli Gysi (DEST/UFPR) – Integrando dados para diagnóstico e tratamento de transtornos mentais 
  • Marcos Oliveira Prates (DEST/UFMG) – Latent Archetypes of the Spatial Patterns of Cancer

Beatriz Milz

UFABC

Beatriz Milz é doutora em Ciência Ambiental e pesquisadora de pós-doutorado na Universidade Federal do ABC (UFABC), Brasil. Ela é co-organizadora da R-Ladies São Paulo e liderou a tradução voluntária pela comunidade da segunda edição do livro "R for Data Science" em Portuguese e também da tradução de bases de dados no pacote dados, disponível no CRAN. É editora de revisão por pares de software (software peer review editor) na rOpenSci.

Currículo Lattes

Resumo completo


Este tutorial apresenta uma abordagem prática para acessar dados do SIDRA/IBGE diretamente no R, utilizando o pacote SIDRAR para interagir com a base de dados oficial do IBGE. Focaremos na obtenção da série histórica de Produção Agrícola Municipal (PAM) relacionadas à agricultura como exemplo prático, demonstrando como essas informações podem ser utilizadas para análises que contribuem com os Objetivos de Desenvolvimento Sustentável (ODS). Além disso, utilizaremos pacotes do tidyverse para organizar e transformar os dados, facilitando a preparação para análises mais complexas. O objetivo é capacitar os participantes a extrair dados por meio da API do SIDRA e prepará-los de maneira eficiente e estruturada. 

Palavras-chave: importação de dados, produção agrícola municipal, tidyverse, séries históricas.

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 2 (“Fome zero e agricultura sustentável”).   A PAM fornece dados sobre produtividade agrícola municipal, que são fundamentais para monitorar e analisar o desempenho dos pequenos produtores de alimentos e a evolução de sua renda. Esses dados ajudam a identificar desigualdades e a promover políticas públicas voltadas ao aumento da produtividade e à inclusão de pequenos agricultores. A disponibilidade de dados detalhados por município permite ações localizadas e direcionadas, essenciais para garantir o acesso igualitário a recursos e oportunidades.

Público-alvo



Este tutorial é voltado para estudantes de graduação e pós-graduação. É desejável que os  participantes possuam experiência inicial com R, incluindo conhecimentos como: instalar e carregar pacotes; criar e manipular objetos; utilizar funções básicas, entre outros.

Marcia Brandão

UFAM

Márcia Brandão possui bacharelado em Estatística pela Universidade Federal do Amazonas, mestrado em Matemática com concentração em Estatística pela UFAM e doutorado em Matemática Aplicada pelo programa de doutorado em matemática UFPA/UFAM (2024). Atualmente, é Professora Adjunta III do Departamento de Estatística do Instituto de Ciências Exatas da Universidade Federal do Amazonas. Suas principais áreas de atuação são Análise de Sobrevivência e Modelos de Regressão.

Currículo Lattes

Alcione Miranda dos Santos

UFMA

Graduada em Estatística pela Universidade Federal de Pernambuco, mestrado em Estatística pela Universidade Federal do Rio de Janeiro e doutorado em Engenharia de Produção pela Universidade Federal do Rio de Janeiro. Atualmente é professora titular do Departamento de Saúde Pública da Universidade Federal do Maranhão (DSP-UFMA), no qual vem desenvolvendo atividades de pesquisas nas seguintes áreas da Ciência de Dados e Estatística, Análise de Sobrevivência, Teoria de Resposta ao Item e Aprendizado de Máquina. Professora permanente do Programa de Pós-Graduação em Saúde Coletiva-UFMA e Coordenadora do Núcleo de Informática Biomédica do DSP-UFMA. Bolsista Produtividade FAPEMA.

Currículo Lattes

Stéfane Rossoni

CONRE-4

Stéfane Rossoni é assessora estatística no apoio à pesquisa científica na Strategic Way e Conselheira Titular do Conselho Regional de Estatística do Sul do Brasil (CONRE4). Concluiu a graduação em Estatística e o mestrado em Bioestatística na Universidade Estadual de Maringá. Atualmente, cursa o doutorado em Ciências da Saúde na mesma instituição. Além da assessoria em pesquisa, atua no Grupo de Estudos em Tecnologias Digitais e Geoprocessamento em Saúde (GETS).

Currículo Lattes

Hildete Costa

CONRE-5
Currículo Lattes

Jesús Alberto Peña Guillén

Universidad de Los Andes, Venezuela

Professor de Estatística, Universidad de Los Andes, Mérida, Venezuela.

Eder Silva de Brito

Instituto Federal de Educação, Ciência e Tecnologia de Goiás

Possui graduação em Matemática pela Universidade Federal de Goiás (2011), mestrado em Matemática pela Universidade de Brasília (2014) e doutorado em Estatística pela Universidade Federal de São Carlos e Universidade de São Paulo (2023). Atualmente é professor do Instituto Federal de Educação, Ciência e Tecnologia de Goiás - Campus Anápolis. Tem experiência nas áreas de Matemática, Probabilidade e Estatística, com ênfase em Probabilidade e Estatística, atuando principalmente nos temas de análise de sobrevivência e confiabilidade.

Currículo Lattes

Palestrantes e palestras


  • Jesús Alberto Peña Guillén (Universidad de Los Andes, Venezuela) – A bivariate survival model for events with dependent failure times based on Archimedean copula functions. Application case: A sample of HIV patients
    • Resumo: This paper proposes a bivariate survival model for dependent failure times based on copula functions of the Archimedean family and the mean cumulative function for non-recurrent events of different types (MCFR ̅E) and uses it to estimate the probability of survival from the occurrence of events of different types on the same HIV/AIDS patient. The copula functions evaluate the dependence structure between the failure times of the events experienced by the same patient throughout their follow-up period, and the MCFR ̅E generates the marginal survival function for each event. The marginal function is a nonparametric estimator that gives the same estimated survival probability as the Kaplan-Meier estimator if the failure times of the different types of events are independent. If each patient experiences at least one event, a subset of them generates a compound event that affects the estimated probability of survival. The results show that the traditionally estimated survival probabilities are biased if dependent failure times are treated as independent.


  • Eder Silva de Brito (Instituto Federal de Educação, Ciência e Tecnologia de Goiás) –Reliability of repairable systems with Non-Central Gamma frailty
    • Resumo: Maintenance actions on industrial equipment are essential to reduce expenses associated with equipment failures. Based on a well-fitted model, it is possible, through the estimated parameters, to predict several functions of interest, such as the cumulative average and reliability functions. In this paper, a new frailty model is proposed to analyze failure times of repairable systems subject to unobserved heterogeneity actions. The Non-Central Gamma distribution is assumed to the frailty random variable effect. The class of minimal repair models for repairable systems is explored considering an approach that includes the frailty term to estimate the unobserved heterogeneity over the systems’ failure process. Classical inferential methods were used to parameter estimation and define the reliability prediction functions. A simulation study was conducted to confirm the properties expected in the estimators. Two real-world data known in literature were used to illustrate the estimation procedures and validate the proposed model as a viable alternative to those already established in the literature. The results obtained highlight the potential of our proposed approach, particularly for industries dealing with such systems, where unquantifiable factors may impact equipment failure times.

Anderson Ara

UFPR

Professor Adjunto da Universidade Federal do Paraná (UFPR), campus Curitiba-PR, Departamento de Estatística (DEst) do Setor de Ciências Exatas. Graduado (2009) e Mestre (2011) em Estatística pela Universidade Federal de São Carlos (UFSCar). Doutor em Estatística (2016) através dos Programas de Pós-graduação em Estatística (PPGEst-UFSCar) e Pós-graduação em Ciência da Computação (PPG-CC-UFSCar). Foi Professor Visitante na University of Toronto (UofT), Toronto-ON, Canadá (2023), Professor Adjunto da Universidade Federal da Bahia (2017-2021) e Professor da Faculdade de Tecnologia SENAI-SP (2009-2015). Docente da Especialização em Data Science & Big Data (DSBD-UFPR) e MBA em Advanced Analytics e Business Optimization (AABO-UFPR). Pesquisador do Programa de Pós-Graduação em Informática (PPGInf-UFPR) e do Programa de Pós-Graduação em Métodos Numéricos (PPGMNE-UFPR). Coordenador do DataSci Labs UFPR. Atua principalmente nas seguintes áreas: Aprendizado Estatístico de Máquina, Inferência Estatística e Métodos Computacionais. Possui mais de 45 artigos publicados na área de aprendizado de máquina e 17 prêmios nacionais e internacionais. Bolsista MEC/FNDE (2022-2028). Maiores detalhes em leg.ufpr.br/~ara.

Currículo Lattes

Gabriela Maria Rodrigues

ESALQ/USP

Professora Doutora no Departamento de Ciências Exatas da Escola Superior de Agricultura "Luiz de Queiroz" - Universidade de São Paulo (ESALQ - USP). Doutora e Mestra em Ciências, área: Estatística e Experimentação Agronômica, pela Escola Superior de Agricultura "Luiz de Queiroz" - Universidade de São Paulo (ESALQ-USP) (2021 e 2024). Licenciada em Matemática pela Universidade Metodista de Piracicaba (2018) e tecnóloga em Gestão de Recursos Humanos pela Universidade Metodista de Piracicaba (2014). Teve sua tese de doutorado premiada em 1º lugar na 68ª Anual da Região Brasileira da Sociedade Internacional de Biometria (RBras) em 2024. Atualmente cursa uma Especialização em Data Science e Analytics (Pecege/ESALQ-USP). Tem experiência na área de Estatística e Ciência de dados, atuando principalmente nos seguintes temas: novas distribuições de probabilidade, modelos de regressão, dados censurados e algoritmos de aprendizado de máquina.

Currículo Lattes

Eufrásio de Lima Neto

UFPB

Associate Professor in the Department of Statistics and a faculty member of the Graduate Program in Decision Models and Health at the Federal University of Paraíba. He was a Senior Lecturer in Data Analytics at De Montfort University (UK, 2023-2024) and a Research Associate in Data Science in the Department of Computer Science at Loughborough University (UK, 2022/2023). He has Bachelor’s and Master’s degrees in Statistics and a PhD in Computer Science (Machine Learning) from the Federal University of Pernambuco (Brazil). His main research interests are statistical modelling, regression, generalized linear models, robust regression, clusterwise regression, symbolic data analysis, interval-valued data, kernel methods, machine learning (ML) and fairness assessment in ML models. He is the author of over 50 technical papers in international journals and conferences. He was a Member of the Board of Directors of the LARS-IASC, Executive Secretary of the ABE and Member of the Board of Directors of the ABE. Currently, He is an ISI Elected Member.

Currículo Lattes

Resumo completo



As técnicas de Aprendizado Estatístico de Máquina, do inglês Statistical Machine Learning,  têm recebido muita atenção nos últimos anos devido ao fato de automatizarem modelos  analíticos com um bom poder preditivo e que podem ser aplicados para resolução de diversos  problemas. Nesta sessão temática serão apresentados algumas metodologias de  Aprendizado Estatístico e suas aplicações. 


Palavras-chave: Aprendizado Estatístico; Aprendizado de Máquina.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 1 (“Erradicação da pobreza”), o ODS 3 (“Saúde e Bem-Estar”), o ODS 4 (“Educação de qualidade”) e o ODS 8 (“Trabalho decente e crescimento econômico”). As aplicações estão direcionadas prioritariamente a solução de problemas na área da saúde, tendo impacto relacionado a erradicação da pobreza, educação de qualidade e a busca por trabalho decente e crescimento econômico.

Palestrantes e palestras



  • Gabriela Maria Rodrigues (ESALQ/USP) – New regression model and machine learning with application to human development index
  • Anderson Ara (DEST-UFPR) – Identifying 124 new anti-HIV drug candidates in a 37 billion compound database: An integrated approach of machine learning (QSAR), molecular docking, and molecular dynamics simulation
  • Eufrásio de Lima Neto (DEST-UFPB) – Identifying early help referrals for local authorities with machine learning and bias analysis

Allison Queiroz de Oliveira

ESALQ/USP

Técnico em Aquicultura pelo Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo - IFES (2014). Bacharel em Zootecnia pela Universidade Federal do Espírito Santo - UFES (2019). Realizou o seu estágio obrigatório na Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA), na Unidade Gado de Leite, Juiz de Fora - MG. Mestre em Estatística e Experimentação Agronômica pela Universidade de São Paulo, onde trabalhou com modelagem de dados zootécnicos por meio da técnica de modelos lineares mistos e a avaliação do uso dos resíduos de confundimento mínimo no diagnóstico dos mesmos. É estudante de doutorado em Estatística e Experimentação Agronômica na mesma instituição, com período sanduíche na Universidade de Limerick, Irlanda. Tem experiência na área de Estatística Experimental, trabalhando principalmente com modelos generalizados mistos e extensões, analisando dados oriundos de experimentos agronômicos e zootécnicos.

Currículo Lattes

Elisangela Aparecida da Silva Lizzi

Universidade Tecnológica Federal do Paraná

Bacharel em Estatística pela Universidade Federal de São Carlos. Mestre e doutora em Saúde Pública pela Faculdade de Medicina da USP, com trainee no exterior pela John Hopkins University. É professora adjunta e pesquisadora da Universidade Tecnológica Federal do Paraná, campus Cornélio Procópio. É pesquisadora e professora credenciada no Programa de Pós Graduação em Bioinformática - UTFPR-CP. Mãe de um filho nascido em 2008 e atuante na causa de mulheres na ciência. Trabalha com estatística aplicada, bioestatística e epidemiologia. É editora associada da Revista de Epidemiologia e Serviços de Saúde do Sistema Único de Saúde ( SUS). Profissional no ranking de pesquisadores influentes da América Latina. Consultora do Ministério da Saúde e da Organização Panameriacana de Saúde em cursos de formação especializada para profissionais de vigilância em saúde no Programa de Fortalecimento da Epidemiologia(PROFEPi).

Currículo Lattes

Resumo completo


A tomada de decisões pelo estado, governo ou qualquer órgão competente impacta diretamente o caminho trilhado pela comunidade. Contudo tais decisões devem ser feitas de forma clara, inteligente, precisa e que considere as consequências (sejam elas positivas ou negativas) geradas. Com isso o papel de um profissional que alinhe as demandas sociais e suas complexidades à técnicas que auxiliem nas melhores escolhas possui um impacto crucial neste processo. No atual contexto, com a alta geração de dados informativos acerca da sociedade, o uso de métricas e técnicas matemáticas e estatísticas são indispensáveis. Diante disso, durante esta mesa redonda traremos à luz como está a formação atual dos profissionais de estatística e ciência de dados e se de fato esta está colaborando para que o mercado receba profissionais qualificados para a tomada de decisões em políticas públicas e, caso contrário, o que deve ser proposto em termos de ensino para que o perfil do novo profissional destas áreas venha a ser condizente com tal demanda. Além deste eixo, também iremos abordar quais os impactos na qualidade da formação de tais profissionais quando se refere à políticas relacionadas principalmente ao crescimento econômico, da garantia de alimento no prato de todos, qualidade de vida e redução da pobreza em nosso país.

Com qual(is) ODS a Sessão Temática proposta se relaciona?


A Sessão Temática está relacionada com o ODS 1 (“Erradicação da pobreza”), o ODS 2 (“Fome zero e agricultura sustentável”), o ODS 3 (“Saúde e Bem-Estar”), o ODS 4 (“Educação de qualidade”) e o ODS 8 (“Trabalho decente e crescimento econômico”). Quando o profissional responsável tem uma sólida formação visando as demandas acerca do tratamento de dados e as informações obtidas através destes, o processo da tomada de decisão se torna mais fluido e os desafios mais fáceis de serem superados. Tal trabalho impacta diretamente não só a decisão que irá ser tomada como também as consequências da mesma, afetando áreas fundamentais para a sociedade, tais como a educação (ODS 4), saúde (ODS 3) combate à pobreza (ODS 2) e a fome (ODS 1) e desenvolvimento econômico (ODS 8) do grupo alvo. De modo geral, os objetivos demarcados pela Organização das Nações Unidas ficam mais palpáveis e fáceis de serem atingidos desde que os profissionais envolvidos no processo tenham competência e habilidades necessárias.

Palestrantes e palestras


Elisangela Aparecida da Silva Lizzi (Universidade Tecnológica Federal do Paraná) – Ensino de estatística para profissionais de tomada de decisões em saúde pública e vigilância em saúde. Qual nossa missão nesse cenário? Doris Satie Maruyama Fontes (Conre-3) – Há Descompasso entre Formação e Necessidades do Mercado de Trabalho?

Resumo completo



Este tutorial possui a intenção de demonstrar o papel da Estatística nas atividades científicas pela busca de tratamentos mais eficazes e seguros para algumas doenças. No desenvolvimento clínico de novos produtos, tais como vacinas e medicamentos, o uso de métodos estatísticos específicos, surgem como ferramentas fundamentais para proporcionar e apoiar tomadas de decisões. Para que um novo medicamento ou vacina sejam aprovados para uso, é necessário comprovar que este novo produto traz benefícios, que seja seguro e no caso de comparações com outros produtos, que seja similar ou até mesmo superior. Desta forma, a comparação entre dois ou mais medicamentos ou vacinas podem possuir objetivos distintos, tais como: determinar se há evidência de diferença estatística na comparação dos tratamentos (um produto é superior a outro), demonstrar que há uma padronização e/ou uma consistência na fabricação de um medicamentos (equivalência) ou até mesmo mostrar que um novo produto não é inferior clinicamente em relação a outro tratamento (não-inferioridade). 

Neste tutorial, iremos nos aprofundar nos conceitos e nas formulações de hipóteses para testes de superioridade, não-inferioridade e equivalência, explorando suas aplicações e limitações. Além disso, traremos exemplos práticos de estudos do Centro de Ensaios Clínicos e Farmacovigilância do Instituto Butantan que utilizaram tais técnicas estatísticas. 

Ao final deste tutorial, espera-se que os participantes, compreendam os diferentes tipos de testes de hipóteses utilizados em ensaios clínicos para o desenvolvimento de vacinas e consigam avaliar criticamente os resultados de estudos clínicos já publicados.


Palavras-chave: Vacinas; ensaios clínicos; teste de hipótese; superioridade; não-inferioridade; equivalência.

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 3 (“Saúde e bem-estar”).   Este tutorial, se enquadra na ODS 3, visto que, o conhecimento sobre ensaios clínicos na produção de novos medicamentos pode promover a busca e o interesse pelo estudo e combate de doenças.

Público-alvo


Este tutorial é voltado para estudantes de graduação e pós-graduação.

Benilton de Sá Carvalho

UNICAMP

Benilton Carvalho é Professor Associado e Chefe do Departamento de Estatística da UNICAMP, com doutorado em Bioestatística pela Johns Hopkins University, pós-doutorados nas Universidade de Cambridge e UNICAMP, com extensa atuação na integração entre estatística e genômica. Ele é pioneiro no desenvolvimento de ferramentas computacionais como os pacotes oligo e crlmm, amplamente usados para análises genômicas. Além disso, é cofundador da Iniciativa Brasileira de Medicina de Precisão (BIPMed), que promove o compartilhamento de dados genômicos de populações sub-representadas.

Atualmente, Benilton é Pesquisador Principal em dois grandes projetos de impacto internacional. No projeto JAGUAR, financiado pela Chan Zuckerberg Initiative, ele coordena os esforços de "admixture mapping", eQTL e genotipagem para mapear a diversidade de células imunológicas na América Latina, contribuindo para avanços na medicina de precisão em populações diversas. Já no INCT Model3D, ele combina inovação em bioinformática e biologia para compreender mecanismos de doenças crônicas.

Currículo Lattes

Danilo Alvares

University of Cambridge, UK

Possui graduação em Matemática Aplicada e Computação Científica e mestrado em Ciência da Computação e Matemática Computacional pela Universidade de São Paulo, Brasil (2011 e 2013), mestrado em Bioestatística e doutorado em Estatística pela Universitat de València, Espanha (2015 e 2017), e pós-doutorado em Bioestatística pela Harvard School of Public Health, Estados Unidos (2018). Foi Professor Assistente no Departamento de Estatística da Pontificia Universidad Católica de Chile (2018-2022). Desde 2022 é Pesquisador na Unidade de Bioestatística da University of Cambridge (Reino Unido) e seus tópicos de pesquisa são métodos Bayesianos, modelos conjuntos de dados longitudinais e de sobrevivência, bioestatística e estudos educacionais.

Website pessoal

Elizabeth Juarez-Colunga

University of Colorado, US

Elizabeth Juarez-Colunga is an Associate Professor in the Department of Biostatistics and Informatics at the Colorado School of Public Health, University of Colorado Anschutz Medical Campus. Originally from Mexico, she earned her undergraduate degree in Applied Mathematics from the Universidad Autónoma de Querétaro and her MSc in Mathematical Sciences from the Universidad Nacional Autónoma de México. She obtained her PhD in Statistics from Simon Fraser University in Canada.

Dr. Juarez-Colunga’s research areas of interest include survival analysis, recurrent events, longitudinal data, and joint models. She has been a collaborative biostatistician at the University of Colorado Anschutz Medical Campus since 2012. She has collaborated on projects in geriatrics, palliative care, seizures, and health services research in general. Additionally, she has served in various roles within the Western North American Region (WNAR) of the International Biometric Society, including president.

Website pessoal

Dipak Dey

University of Connecticut, US

Prof. Dipak K. Dey is a Board of Trustees Distinguished Professor in the Department of Statistics at the University of Connecticut (UConn). A prominent statistician, he is most known for his pioneering work in Bayesian analysis, decision science, and model selection. With over 320 research articles published in reputable national and international journals, and over 10 books and edited volumes to his name, he has made a significant impact on the field of statistics and data science. Prof. Dey earned his Bachelor's and Master's degrees in Statistics from the Indian Statistical Institute and a Ph.D. in Statistics from Purdue University, under the supervision of Prof. Jim Berger. Before joining the UConn in 1985, Prof. Dey held academic positions at Stanford University, the University of Kentucky, and Texas Tech University, and has also held visiting appointments at several universities and institutions worldwide. He is a fellow of the American Association for the Advancement of Science, the American Statistical Association, the Institute of Mathematical Statistics, the International Society for Bayesian Analysis, and the International Statistical Institute, and has received numerous awards and honors for his work. Prof. Dey is a dedicated mentor to students and colleagues. He has supervised over 45 Ph.D. students and has collaborated with practically every colleague in his department in a career spanning more than 40 years, helping tenure-track faculty and Ph.D. students achieve their professional goals. His broad range of interest and expertise, combined with his devotion to his peers has been instrumental to many in the statistical community. One of his many awards was the Marth Award for mentorship at UConn. Prof. Dey has held multiple leadership positions. He was for fourteen years as department head and for five years as the Associate Dean for Research in the College of Liberal Arts and Sciences at UConn. He has been a highly effective leader, while maintaining an extremely active academic career. Among his many accomplishments in his leadership roles, Prof. Dey oversaw an expansion of the statistics department; he started a Biostatistics program, a partnership with UConn Health; he developed collaborative research program with various other schools, colleges and Institutes (e.g., CHIP, IMS, Center for Environmental Science); and he initiated corporate partnership with Pfizer, CIGNA and Travelers. Prof. Dey has served as an associate editor for several statistical journals, including the Journal of the American Statistical Association (1997-1999), the Journal of Statistical Planning and Inference (2001-2003), and is currently the editor- in- chief of Sankhya, series A and series B, official journal of Indian Statistical Institute, since 2016 which is the second oldest journal in Statistics in the world. Prof. Dey has a clear long-term vision for the field of statistics and data science based on his many years of experience as a researcher, mentor, teacher, and interdisciplinary collaborator. He believes that statistics should be introduced from an early age in schools in order to develop statistical thinking and to learn how to apply them in real-life situations. His goal for the profession is to make it broadly understood, much beyond STEM programs. At the college level, data science education must include statistics, mathematics, and computational skills in order to train students who plan to pursue a professional career as data scientists in industry, government, and academia.

Website pessoal