Tutoriais

Similaridade de Imagens usando deep learning com Python

Jodavid de Araújo Ferreira

UFPE
Minicurrículo
Neste tutorial, será utilizado uma abordagem para fazer correspondência de imagens utilizando a similaridade do cosseno com o algoritmo Vision Transformer (ViT). O objetivo é demonstrar uma técnica de deep learning para realizar correspondência de imagens, que se refere ao processo de identificar e emparelhar partes semelhantes ou correspondentes em duas ou mais imagens. Esta tarefa pode ser considerada complexa devido a variações de iluminação, ângulo de captura e qualidade da imagem, especialmente em cenários do mundo real, como o reconhecimento de objetos, animais ou pessoas em diferentes imagens. Assim, este tutorial tem como objetivo abordar as etapas de pré-processamento de imagens, geração de embeddings usando Vision Transformers e cálculo de similaridade através da similaridade do cosseno com a linguagem de programação Python. Espera-se que, ao final, os participantes entendam como aplicar esses métodos tanto em contextos acadêmicos quanto práticos no Mercado de Trabalho.

Palavras-chave: Vision Transformers, similaridade de imagens, deep learning, embeddings, Python.

Obtendo dados do SIDRA/IBGE com R utilizando o pacote SIDRAR

Beatriz Milz

UFABC
Minicurrículo
Este tutorial apresenta uma abordagem prática para acessar dados do SIDRA/IBGE diretamente no R, utilizando o pacote SIDRAR para interagir com a base de dados oficial do IBGE. Focaremos na obtenção da série histórica de Produção Agrícola Municipal (PAM) relacionadas à agricultura como exemplo prático, demonstrando como essas informações podem ser utilizadas para análises que contribuem com os Objetivos de Desenvolvimento Sustentável (ODS). Além disso, utilizaremos pacotes do tidyverse para organizar e transformar os dados, facilitando a preparação para análises mais complexas. O objetivo é capacitar os participantes a extrair dados por meio da API do SIDRA e prepará-los de maneira eficiente e estruturada. 

Palavras-chave:  importação de dados, produção agrícola municipal, tidyverse, séries históricas.

Análise Estatística de Desigualdades no Acesso a Água Potável e Saneamento: Explorando os ODS 6 e 10 com Dados do Censo Brasileiro

Fernando Almeida Barbalho

Ministério da Fazenda
Minicurrículo
Com base nos dados do Censo 2022 divulgados pelo IBGE, é possível conduzir análises detalhadas considerando características dos domicílios, acesso a redes de água, presença de banheiros, tipos de esgotamento sanitário, bem como informações sobre cor e raça dos moradores e a localização regional das  residências, incluindo favelas. Esses dados permitem um panorama abrangente das desigualdades no acesso a recursos básicos em diferentes cidades brasileiras.  O tutorial proposto seguirá um fluxo estruturado, começando com a coleta automática de dados usando o pacote R {sidrar}, avançando para uma análise exploratória de dados para compreender padrões e tendências, e culminando em  análises avançadas, como a clusterização de cidades com base em critérios de acesso a água e saneamento. O objetivo é capacitar os participantes a realizar análises robustas e aprofundadas, que possam embasar políticas públicas e  intervenções direcionadas para melhorar o acesso equitativo a esses recursos essenciais. 

Palavras chaves: Linguagem de Programação R, ODS 6, ODS 10, SIDRA, Censo 2022.

Testes de hipóteses em Ensaios Clínicos

Elizabeth Gonzalez Patiño

Butantan
Minicurrículo

Marcos Alves de Lima

Butantan
Minicurrículo
Este tutorial possui a intenção de demonstrar o papel da Estatística nas atividades científicas pela busca de tratamentos mais eficazes e seguros para algumas doenças. No desenvolvimento clínico de novos produtos, tais como vacinas e medicamentos, o uso de métodos estatísticos específicos, surgem como ferramentas fundamentais para proporcionar e apoiar tomadas de decisões. Para que um novo medicamento ou vacina sejam aprovados para uso, é necessário comprovar que este novo produto traz benefícios, que seja seguro e no caso de comparações com outros produtos, que seja similar ou até mesmo superior. Desta forma, a comparação entre dois ou mais medicamentos ou vacinas podem possuir objetivos distintos, tais como: determinar se há evidência de diferença estatística na comparação dos tratamentos (um produto é superior a outro), demonstrar que há uma padronização e/ou uma consistência na fabricação de um medicamentos (equivalência) ou até mesmo mostrar que um novo produto não é inferior clinicamente em relação a outro tratamento (não-inferioridade).  Neste tutorial, iremos nos aprofundar nos conceitos e nas formulações de hipóteses para testes de superioridade, não-inferioridade e equivalência, explorando suas aplicações e limitações. Além disso, traremos exemplos práticos de estudos do Centro de Ensaios Clínicos e Farmacovigilância do Instituto Butantan que utilizaram tais técnicas estatísticas.  Ao final deste tutorial, espera-se que os participantes, compreendam os diferentes tipos de testes de hipóteses utilizados em ensaios clínicos para o desenvolvimento de vacinas e consigam avaliar criticamente os resultados de estudos clínicos já publicados.

Palavras chaves: Vacinas; ensaios clínicos; teste de hipótese; superioridade; não-inferioridade; equivalência.

Jodavid de Araújo Ferreira

UFPE

Atualmente é professor do Departamento de Estatística da Universidade Federal de Pernambuco (UFPE) e do Programa de Pós-Graduação em Estatística da UFPE (PPGEST). Realizou um Pós-Doutorado no Programa de Pós-Graduação em Modelos de Decisão e Saúde na UFPB (2021-2024). Possui doutorado em em Estatística pela UFPE (2021), mestrado em Estatística pela UFPE (2017) e graduação em Estatística pela UFPB (2015). É entusiasta de software livre e de código aberto (free and open-source software - FOSS) e procura estar sempre atualizado em avanços tecnológicos e temas relacionados à Inteligência Artificial, Deep Learning e Machine Learning. Desenvolve pesquisas em áreas da estatística como distribuições de Probabilidade, Probabilidade Fuzzy, Aprendizado Supervisionado (classificação), Aprendizado Não Supervisionado (segmentação, clusterização), testes de hipótese, inferência estatística, teoria da informação e IA Generativa aplicados a dados estruturados e não estruturados como processamento de imagens e áudio.

Currículo Lattes

Resumo completo


Neste tutorial, será utilizado uma abordagem para fazer correspondência de imagens utilizando a similaridade do cosseno com o algoritmo Vision Transformer (ViT) (Dosovitskiy, Alexey. “An image is worth 16×16 words: Transformers for image recognition at scale.” arXiv preprint arXiv:2010.11929, 2020). O objetivo é demonstrar uma técnica de deep learning para realizar correspondência de imagens, que se refere ao processo de identificar e emparelhar partes semelhantes ou correspondentes em duas ou mais imagens. Esta tarefa pode ser considerada complexa devido a variações de iluminação, ângulo de captura e qualidade da imagem, especialmente em cenários do mundo real, como o reconhecimento de objetos, animais ou pessoas em diferentes imagens.  A arquitetura ViT adapta o modelo Transformer – originalmente desenvolvido para tarefas de Processamento de Linguagem Natural (NLP) – para o processamento de dados de imagem utilizando embeddings, que são vetores que capturam a informação semântica, permitindo mapear dados semelhantes para pontos próximos em um espaço vetorial de alta dimensionalidade. Na correspondência de imagens, o desafio está em como representar as imagens de forma eficaz como embeddings, capturando as características relevantes. Ao aplicar técnicas de pré-processamento, como a remoção de fundo ajuda a isolar o objeto de interesse, o que auxilia em tais tarefas de reconhecimento de objetos, segmentação de imagens e correspondência.  A partir dos embeddings, a similaridade entre diferentes imagens é calculada utilizando a similaridade do cosseno. A imagem de interesse é comparada a uma base de dados de imagens, e os resultados são retornados com um score de similaridade. O score de similaridade do cosseno quantifica a semelhança entre duas imagens em termos de suas características extraídas. Essa métrica varia de -1 a 1, onde, quanto mais próximo de 1, mais alinhados estão os vetores que representam as imagens, indicando que elas compartilham características comuns. Um valor de 0 indica que os vetores de embeddings das imagens são ortogonais, o que significa que as imagens têm pouco em comum, e quanto mais próximo de -1, mais opostos são os vetores, significando que as imagens são diferentes.  Assim, este tutorial tem como objetivo abordar as etapas de pré-processamento de imagens, geração de embeddings usando Vision Transformers e cálculo de similaridade através da similaridade do cosseno com a linguagem de programação python. Espera-se que, ao final, os participantes entendam como aplicar esses métodos tanto em contextos acadêmicos quanto práticos no Mercado de Trabalho.

Palavras-chave: Vision Transformers, similaridade de imagens, deep learning, embeddings, Python.  

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 9 (“Indústria, inovação e infraestrutura”) e o ODS 15 (“Vida terrestre”).   A proposta de tutorial aborda o uso de tecnologias de deep learning para reconhecimento e similaridade de imagens, que é diretamente aplicável em setores de inovação tecnológica e infraestrutura, que são aplicações utilizadas pela ODS 9. Além disso, ao focar na identificação de animais e terrenos, por exemplo, o tutorial pode ser útil em projetos de conservação da vida terrestre (ODS 15), permitindo o desenvolvimento de soluções para monitoramento e proteção da biodiversidade.

Público-alvo


Este tutorial é voltado para estudantes de graduação, pós-graduação e pesquisadores na área da Estatística e afins.

Beatriz Milz

UFABC

Beatriz Milz é doutora em Ciência Ambiental e pesquisadora de pós-doutorado na Universidade Federal do ABC (UFABC), Brasil. Ela é co-organizadora da R-Ladies São Paulo e liderou a tradução voluntária pela comunidade da segunda edição do livro "R for Data Science" em Portuguese e também da tradução de bases de dados no pacote dados, disponível no CRAN. É editora de revisão por pares de software (software peer review editor) na rOpenSci.

Currículo Lattes

Resumo completo


Este tutorial apresenta uma abordagem prática para acessar dados do SIDRA/IBGE diretamente no R, utilizando o pacote SIDRAR para interagir com a base de dados oficial do IBGE. Focaremos na obtenção da série histórica de Produção Agrícola Municipal (PAM) relacionadas à agricultura como exemplo prático, demonstrando como essas informações podem ser utilizadas para análises que contribuem com os Objetivos de Desenvolvimento Sustentável (ODS). Além disso, utilizaremos pacotes do tidyverse para organizar e transformar os dados, facilitando a preparação para análises mais complexas. O objetivo é capacitar os participantes a extrair dados por meio da API do SIDRA e prepará-los de maneira eficiente e estruturada. 

Palavras-chave: importação de dados, produção agrícola municipal, tidyverse, séries históricas.

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 2 (“Fome zero e agricultura sustentável”).   A PAM fornece dados sobre produtividade agrícola municipal, que são fundamentais para monitorar e analisar o desempenho dos pequenos produtores de alimentos e a evolução de sua renda. Esses dados ajudam a identificar desigualdades e a promover políticas públicas voltadas ao aumento da produtividade e à inclusão de pequenos agricultores. A disponibilidade de dados detalhados por município permite ações localizadas e direcionadas, essenciais para garantir o acesso igualitário a recursos e oportunidades.

Público-alvo



Este tutorial é voltado para estudantes de graduação e pós-graduação. É desejável que os  participantes possuam experiência inicial com R, incluindo conhecimentos como: instalar e carregar pacotes; criar e manipular objetos; utilizar funções básicas, entre outros.

Fernando Almeida Barbalho

Ministério da Fazenda

Doutor em Administração pela Universidade de Brasília (2014). É auditor federal de finanças e controle da Secretaria do Tesouro Nacional (STN), atualmente em exercício na Diertoria de Assuntos Econômicos e Sociais da Vice-Presidência da República . A trajetória profissional e acadêmica mais recente está principalmente relacionada a dados abertos e desenvolvimento de produtos que resultem em maior transparência do Setor Público brasileiro. Nos finais de semana costuma utilizar o R para investigar perguntas de pesquisa que escapam ao mundo das finanças públicas.

Currículo Lattes

Resumo completo


Proponho um tutorial que explore a intersecção entre os Objetivos de Desenvolvimento Sustentável (ODS) 6 e 10, com foco na análise estatística de  dados sobre acesso a água potável e saneamento no Brasil, à luz das desigualdades regionais e raciais. O ODS 6 aborda o acesso universal e equitativo a água potável e segura, além do saneamento e higiene, com atenção especial às necessidades de mulheres, meninas e populações vulneráveis. Já o ODS 10  destaca a redução das desigualdades, um tema central quando se avalia a  situação brasileira, marcada por profundas disparidades.  Com base nos dados do Censo 2022 divulgados pelo IBGE, é possível conduzir análises detalhadas considerando características dos domicílios, acesso a redes de água, presença de banheiros, tipos de esgotamento sanitário, bem como informações sobre cor e raça dos moradores e a localização regional das  residências, incluindo favelas. Esses dados permitem um panorama abrangente das desigualdades no acesso a recursos básicos em diferentes cidades brasileiras.  O tutorial proposto seguirá um fluxo estruturado, começando com a coleta automática de dados usando o pacote R {sidrar}, avançando para uma análise exploratória de dados para compreender padrões e tendências, e culminando em  análises avançadas, como a clusterização de cidades com base em critérios de acesso a água e saneamento. O objetivo é capacitar os participantes a realizar análises robustas e aprofundadas, que possam embasar políticas públicas e  intervenções direcionadas para melhorar o acesso equitativo a esses recursos essenciais. 

Palavras chaves: Linguagem de Programação R, ODS 6, ODS 10, SIDRA, Censo 2022.

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 6 (“Água potável e saneamento”) e o ODS 10 (“Redução das desigualdades”).   O tutorial conecta os ODS 6 e 10 ao abordar o acesso a água potável e saneamento no Brasil sob a ótica das desigualdades regionais e raciais. Utilizando  dados do Censo 2022, propõe análises que evidenciam disparidades e exclusões,  alinhando-se aos objetivos da Agenda 2030. Assim, oferece ferramentas para embasar políticas públicas mais inclusivas e equitativas.

Público-alvo


Este tutorial é voltado para estudantes de graduação e pós-graduação.

Elizabeth Gonzalez Patiño

Butantan

Possui graduação em Tecnologia em Sistemas de Informação em Saúde - Universidad de Antioquia (2003), graduação em Estatística - Universidad Nacional de Colombia - Sede Medellín (2009), mestrado em Estatística pelo Instituto de Matemática e Estatística (2012) e doutorado em Estatística pela Universidade de São Paulo (2018). Atualmente é Coordenadora de Bioestatística na Fundação Butantan.

Currículo Lattes

Marcos Alves de Lima

Butantan

Mestre em Inovação em Saúde pela Faculdade de Ciências da Saúde de Barretos Dr. Paulo Prata (2021). Bacharel em Estatística pela Universidade Federal de Juiz de Fora (2015). Atualmente é Coordenador de Bioestatística na Fundação Butantan.

Currículo Lattes

Resumo completo


Este tutorial possui a intenção de demonstrar o papel da Estatística nas atividades científicas pela busca de tratamentos mais eficazes e seguros para algumas doenças. No desenvolvimento clínico de novos produtos, tais como vacinas e medicamentos, o uso de métodos estatísticos específicos, surgem como ferramentas fundamentais para proporcionar e apoiar tomadas de decisões. Para que um novo medicamento ou vacina sejam aprovados para uso, é necessário comprovar que este novo produto traz benefícios, que seja seguro e no caso de comparações com outros produtos, que seja similar ou até mesmo superior. Desta forma, a comparação entre dois ou mais medicamentos ou vacinas podem possuir objetivos distintos, tais como: determinar se há evidência de diferença estatística na comparação dos tratamentos (um produto é superior a outro), demonstrar que há uma padronização e/ou uma consistência na fabricação de um medicamentos (equivalência) ou até mesmo mostrar que um novo produto não é inferior clinicamente em relação a outro tratamento (não-inferioridade).  Neste tutorial, iremos nos aprofundar nos conceitos e nas formulações de hipóteses para testes de superioridade, não-inferioridade e equivalência, explorando suas aplicações e limitações. Além disso, traremos exemplos práticos de estudos do Centro de Ensaios Clínicos e Farmacovigilância do Instituto Butantan que utilizaram tais técnicas estatísticas.  Ao final deste tutorial, espera-se que os participantes, compreendam os diferentes tipos de testes de hipóteses utilizados em ensaios clínicos para o desenvolvimento de vacinas e consigam avaliar criticamente os resultados de estudos clínicos já publicados.

Palavras chaves: Vacinas; ensaios clínicos; teste de hipótese; superioridade; não-inferioridade; equivalência.

Com qual(is) ODS o minicurso proposto se relaciona?


O minicurso está relacionado com o ODS 3 (“Saúde e bem-estar”).   Este tutorial, se enquadra na ODS 3, visto que, o conhecimento sobre ensaios clínicos na produção de novos medicamentos pode promover a busca e o interesse pelo estudo e combate de doenças.

Público-alvo


Este tutorial é voltado para estudantes de graduação e pós-graduação.