Amplitude e quartis
Trilha Estatistica, dentro da Oficina de Dados.
Saber a média é útil, mas não conta a história toda. Dois conjuntos de dados podem ter a mesma média e serem completamente diferentes. A dispersão mede o quanto os dados se espalham ao redor do centro.
A medida mais simples de dispersão é a amplitude: a diferença entre o maior e o menor valor. Em Python, basta calcular max(dados) - min(dados). É rápida, mas tem uma limitação: ela só olha para os dois extremos e ignora como os dados se distribuem no meio.
Para ter uma visão mais completa, usamos quartis. Os quartis dividem os dados ordenados em quatro partes iguais. O primeiro quartil (Q1) é o valor abaixo do qual ficam 25% dos dados. O segundo quartil (Q2) é a mediana. O terceiro quartil (Q3) marca os 75%.
Na prática, a diferença entre Q3 e Q1 chama-se intervalo interquartil (IQR). Essa faixa representa os 50% centrais dos dados e é muito usada para identificar outliers.
Para calcular quartis manualmente, ordene a lista e encontre as posições correspondentes. Depois, você pode usar statistics.quantiles() para obter os mesmos resultados com menos código.
Exemplo:
notas = [45, 55, 60, 65, 70, 72, 78, 80, 85, 95]
# Amplitude
amplitude = max(notas) - min(notas)
print("Amplitude:", amplitude)
# Quartis manuais (lista já ordenada)
n = len(notas)
q1 = notas[n // 4]
q2 = notas[n // 2]
q3 = notas[3 * n // 4]
print("Q1:", q1, "Q2 (mediana):", q2, "Q3:", q3)
print("IQR:", q3 - q1)
import statistics
quartis = statistics.quantiles(notas)
print("Quartis com statistics:", quartis)A amplitude mostra a faixa total (95 - 45 = 50) e os quartis mostram como os dados se distribuem internamente.
Desafio guiado
Calcule a amplitude e os quartis aproximados da lista de idades de clientes. Primeiro manualmente, depois com statistics.quantiles().
- Calcule `amplitude` usando max() e min().
- Ordene a lista e encontre Q1, Q2, Q3 pelas posições.
- Calcule o IQR (Q3 - Q1).
- Use statistics.quantiles() para comparar.
Saida esperada
Amplitude: 23
Q1: 28 Q2: 31 Q3: 36
IQR: 8
Quartis com statistics: [27.75, 30.0, 36.5]Dica
amplitude = max(idades) - min(idades). Para os quartis, use os índices n//4, n//2 e 3*n//4 da lista ordenada.
Pratique no navegador
Resumo da lição
Amplitude mostra a faixa total e quartis revelam a distribuição interna. O IQR é mais robusto que a amplitude contra outliers.