Assinale a opção que apresenta o gráfico mais adequado para ...
Comentários
Veja os comentários dos nossos alunos
Grok:
A opção mais adequada para identificar a presença de valores atípicos (outliers) em uma variável numérica durante a Análise Exploratória de Dados é:
D. Boxplot.
Justificativa: O boxplot é uma ferramenta gráfica que exibe a distribuição de uma variável numérica por meio de cinco estatísticas principais: mínimo, primeiro quartil (Q1), mediana, terceiro quartil (Q3) e máximo. Valores atípicos são facilmente identificáveis no boxplot, pois aparecem como pontos que estão fora dos limites definidos pelos "bigodes" (geralmente calculados como Q1 - 1,5 × IQR e Q3 + 1,5 × IQR, onde IQR é a amplitude interquartil).
Análise das outras opções:
A. Gráfico de barras: É mais adequado para variáveis categóricas, não para identificar outliers em variáveis numéricas.
B. Gráfico de dispersão: Pode mostrar padrões entre duas variáveis, mas não é ideal para identificar outliers em uma única variável numérica.
C. Histograma: Mostra a distribuição de uma variável numérica, mas os outliers podem não ser tão evidentes quanto no boxplot.
E. Mapa de calor: É usado para visualizar relações entre variáveis (como correlações), não para detectar outliers.
Portanto, o boxplot é a melhor escolha para essa finalidade.
https://youtu.be/u-pFGLhZ0SI
Apareceu 'outliers' associamos a boxplot.
A) Gráfico de barras
(...)
Por que está errada? É usado para comparar categorias (ex: vendas por mês, arrecadação por cidade). Ele mostra o total ou a média de cada grupo, mas "esconde" os valores individuais, o que torna quase impossível identificar um valor isolado que fugiu da regra.
(...)
B) Gráfico de dispersão (Scatter Plot)
(...)
Por que está errada? É comum confundir porque ele mostra pontos individuais. Porém, o gráfico de dispersão serve para ver a relação entre duas variáveis (ex: quanto maior a renda, maior o consumo). Para identificar um outlier de forma estatística e rápida em uma única variável, ele não é o mais adequado.
(...)
C) Histograma
(...)
Por que está errada? Mostra a distribuição da frequência dos dados (o "formato" da montanha). Embora você possa ver uma barra pequena e isolada longe das outras, ele não tem um critério matemático visual tão claro para cravar o que é um outlier quanto o Boxplot.
(...)
D) Boxplot (Diagrama de Caixas) - CORRETA ✅
(...)
Por que é a certa? Ele é o "rei" dos outliers. O Boxplot calcula os quartis e desenha "hastes" (whiskers). Qualquer ponto que ficar fora dessas hastes é desenhado como um pontinho ou asterisco isolado, sendo automaticamente classificado como um valor atípico. É o gráfico mais rápido para essa finalidade.
(...)
E) Mapa de calor (Heatmap)
(...)
Por que está errada? Usa cores para mostrar a intensidade de valores em uma matriz ou mapa geográfico. É ótimo para ver onde há maior concentração de algo, mas péssimo para identificar um único valor numérico específico que está fora do padrão.
(...)
Fonte: Gemini
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo