Trilha Estatistica
Dispersão e Variabilidade·Licao 4/24
Modulo 2

Amplitude e quartis

Trilha Estatistica, dentro da Oficina de Dados.

Saber a média é útil, mas não conta a história toda. Dois conjuntos de dados podem ter a mesma média e serem completamente diferentes. A dispersão mede o quanto os dados se espalham ao redor do centro.

A medida mais simples de dispersão é a amplitude: a diferença entre o maior e o menor valor. Em Python, basta calcular max(dados) - min(dados). É rápida, mas tem uma limitação: ela só olha para os dois extremos e ignora como os dados se distribuem no meio.

Para ter uma visão mais completa, usamos quartis. Os quartis dividem os dados ordenados em quatro partes iguais. O primeiro quartil (Q1) é o valor abaixo do qual ficam 25% dos dados. O segundo quartil (Q2) é a mediana. O terceiro quartil (Q3) marca os 75%.

Na prática, a diferença entre Q3 e Q1 chama-se intervalo interquartil (IQR). Essa faixa representa os 50% centrais dos dados e é muito usada para identificar outliers.

Para calcular quartis manualmente, ordene a lista e encontre as posições correspondentes. Depois, você pode usar statistics.quantiles() para obter os mesmos resultados com menos código.

Exemplo:

notas = [45, 55, 60, 65, 70, 72, 78, 80, 85, 95]

# Amplitude
amplitude = max(notas) - min(notas)
print("Amplitude:", amplitude)

# Quartis manuais (lista já ordenada)
n = len(notas)
q1 = notas[n // 4]
q2 = notas[n // 2]
q3 = notas[3 * n // 4]
print("Q1:", q1, "Q2 (mediana):", q2, "Q3:", q3)
print("IQR:", q3 - q1)

import statistics
quartis = statistics.quantiles(notas)
print("Quartis com statistics:", quartis)

A amplitude mostra a faixa total (95 - 45 = 50) e os quartis mostram como os dados se distribuem internamente.

?

Desafio guiado

Calcule a amplitude e os quartis aproximados da lista de idades de clientes. Primeiro manualmente, depois com statistics.quantiles().

  1. Calcule `amplitude` usando max() e min().
  2. Ordene a lista e encontre Q1, Q2, Q3 pelas posições.
  3. Calcule o IQR (Q3 - Q1).
  4. Use statistics.quantiles() para comparar.

Saida esperada

Amplitude: 23 Q1: 28 Q2: 31 Q3: 36 IQR: 8 Quartis com statistics: [27.75, 30.0, 36.5]

Dica

amplitude = max(idades) - min(idades). Para os quartis, use os índices n//4, n//2 e 3*n//4 da lista ordenada.

Pratique no navegador

Carregando ambiente Python...

Resumo da lição

Amplitude mostra a faixa total e quartis revelam a distribuição interna. O IQR é mais robusto que a amplitude contra outliers.