Variância
Trilha Estatistica, dentro da Oficina de Dados.
A variância mede o quanto cada valor se afasta da média, em média. É a medida de dispersão mais usada em estatística e a base para muitos cálculos avançados.
O cálculo manual segue três passos: primeiro, subtraia a média de cada valor (isso dá os desvios). Depois, eleve cada desvio ao quadrado (para eliminar números negativos). Por fim, calcule a média desses quadrados. O resultado é a variância.
Elevar ao quadrado é uma escolha matemática importante. Se apenas somássemos os desvios sem elevar ao quadrado, os positivos cancelariam os negativos e a soma seria zero. O quadrado garante que todos os desvios contribuam positivamente.
Existe uma diferença entre variância populacional e amostral. Se seus dados representam toda a população, divida por N. Se são uma amostra, divida por N-1 (correção de Bessel). Por enquanto, vamos usar a variância populacional (statistics.pvariance()).
A variância tem uma unidade "ao quadrado" (ex.: se os dados são em reais, a variância é em reais²). Para voltar à unidade original, usamos o desvio padrão, que veremos na próxima lição.
Exemplo:
notas = [70, 80, 90, 60, 75]
# Passo 1: calcular a média
media = sum(notas) / len(notas)
# Passo 2: desvios ao quadrado
desvios_quad = [(x - media) ** 2 for x in notas]
# Passo 3: média dos desvios ao quadrado
variancia_manual = sum(desvios_quad) / len(desvios_quad)
print("Variância manual:", variancia_manual)
import statistics
print("Variância (statistics):", statistics.pvariance(notas))Calculamos a variância em três passos claros e confirmamos com statistics.pvariance(). A variância populacional divide por N.
Desafio guiado
Calcule a variância populacional dos tempos de entrega abaixo. Primeiro manualmente passo a passo, depois com statistics.pvariance().
- Calcule a `media` dos tempos.
- Crie uma lista `desvios_quad` com (x - media) ** 2 para cada x.
- Calcule `variancia_manual` como a média dos desvios ao quadrado.
- Compare com `statistics.pvariance()`.
Saida esperada
Média: 5.0
Variância manual: 2.4
Variância (statistics): 2.4Dica
media = sum(tempos_entrega) / len(tempos_entrega). Use list comprehension para os desvios ao quadrado.
Pratique no navegador
Resumo da lição
A variância quantifica a dispersão ao redor da média. Calcule manualmente para entender os três passos: desvio, quadrado, média.