Trilha Estatistica
Dispersão e Variabilidade·Licao 5/24
Modulo 2

Variância

Trilha Estatistica, dentro da Oficina de Dados.

A variância mede o quanto cada valor se afasta da média, em média. É a medida de dispersão mais usada em estatística e a base para muitos cálculos avançados.

O cálculo manual segue três passos: primeiro, subtraia a média de cada valor (isso dá os desvios). Depois, eleve cada desvio ao quadrado (para eliminar números negativos). Por fim, calcule a média desses quadrados. O resultado é a variância.

Elevar ao quadrado é uma escolha matemática importante. Se apenas somássemos os desvios sem elevar ao quadrado, os positivos cancelariam os negativos e a soma seria zero. O quadrado garante que todos os desvios contribuam positivamente.

Existe uma diferença entre variância populacional e amostral. Se seus dados representam toda a população, divida por N. Se são uma amostra, divida por N-1 (correção de Bessel). Por enquanto, vamos usar a variância populacional (statistics.pvariance()).

A variância tem uma unidade "ao quadrado" (ex.: se os dados são em reais, a variância é em reais²). Para voltar à unidade original, usamos o desvio padrão, que veremos na próxima lição.

Exemplo:

notas = [70, 80, 90, 60, 75]

# Passo 1: calcular a média
media = sum(notas) / len(notas)

# Passo 2: desvios ao quadrado
desvios_quad = [(x - media) ** 2 for x in notas]

# Passo 3: média dos desvios ao quadrado
variancia_manual = sum(desvios_quad) / len(desvios_quad)
print("Variância manual:", variancia_manual)

import statistics
print("Variância (statistics):", statistics.pvariance(notas))

Calculamos a variância em três passos claros e confirmamos com statistics.pvariance(). A variância populacional divide por N.

?

Desafio guiado

Calcule a variância populacional dos tempos de entrega abaixo. Primeiro manualmente passo a passo, depois com statistics.pvariance().

  1. Calcule a `media` dos tempos.
  2. Crie uma lista `desvios_quad` com (x - media) ** 2 para cada x.
  3. Calcule `variancia_manual` como a média dos desvios ao quadrado.
  4. Compare com `statistics.pvariance()`.

Saida esperada

Média: 5.0 Variância manual: 2.4 Variância (statistics): 2.4

Dica

media = sum(tempos_entrega) / len(tempos_entrega). Use list comprehension para os desvios ao quadrado.

Pratique no navegador

Carregando ambiente Python...

Resumo da lição

A variância quantifica a dispersão ao redor da média. Calcule manualmente para entender os três passos: desvio, quadrado, média.