Mediana
Trilha Estatistica, dentro da Oficina de Dados.
A mediana é o valor que fica exatamente no meio quando os dados estão ordenados. Metade dos valores fica abaixo dela e metade fica acima. Diferente da média, a mediana não é afetada por valores extremos (outliers).
Para calcular a mediana manualmente: ordene a lista, depois encontre o elemento central. Se a lista tiver um número ímpar de itens, a mediana é o valor do meio. Se tiver um número par, é a média dos dois valores centrais.
Um exemplo clássico: imagine os salários de uma empresa onde o CEO ganha R$ 100.000 e os demais funcionários ganham entre R$ 2.000 e R$ 5.000. A média salarial seria alta por causa do CEO, mas a mediana mostraria um valor muito mais próximo da realidade dos funcionários.
Em Python, a conta manual envolve sorted() e acesso por índice. Depois, o módulo statistics oferece statistics.median() para simplificar. O importante é saber quando usar mediana em vez de média.
Sempre que seus dados tiverem valores muito discrepantes (como renda, preços de imóveis ou tempo de resposta de servidores), a mediana é uma escolha mais confiável que a média.
Exemplo:
salarios = [2500, 3000, 2800, 3200, 100000]
# Na mão
ordenados = sorted(salarios)
n = len(ordenados)
if n % 2 == 1:
mediana_manual = ordenados[n // 2]
else:
mediana_manual = (ordenados[n // 2 - 1] + ordenados[n // 2]) / 2
print("Mediana manual:", mediana_manual)
print("Média (para comparar):", sum(salarios) / len(salarios))
# Com a biblioteca
import statistics
print("Mediana statistics:", statistics.median(salarios))A mediana dos salários (3000) conta uma história completamente diferente da média (22300). Com outliers, a mediana é mais representativa.
Desafio guiado
Calcule a mediana da lista de tempos de resposta abaixo. Primeiro manualmente (ordenando e encontrando o meio), depois com statistics.median(). A lista tem número par de elementos.
- Ordene a lista com `sorted()` e guarde em `ordenados`.
- Encontre os dois valores centrais e calcule a média deles para obter `mediana_manual`.
- Use `statistics.median()` para calcular `mediana_lib`.
- Imprima ambos os resultados.
Saida esperada
Mediana manual: 190.0
Mediana statistics: 190.0Dica
Para lista par, a mediana é a média dos dois valores do meio: (ordenados[n//2 - 1] + ordenados[n//2]) / 2.
Pratique no navegador
Resumo da lição
Use mediana quando seus dados tiverem valores extremos. Ela mostra o centro real da distribuição sem ser distorcida por outliers.