Trilha Estatistica
Correlação·Licao 10/24
Modulo 4

Duas variáveis andam juntas?

Trilha Estatistica, dentro da Oficina de Dados.

Até agora analisamos uma variável por vez. Mas no mundo real, queremos saber se duas coisas estão relacionadas: o gasto em marketing aumenta as vendas? A temperatura afeta o consumo de sorvete? Mais horas de estudo levam a notas melhores?

A correlação mede a força e a direção dessa relação. Correlação positiva significa que quando uma variável sobe, a outra tende a subir também. Correlação negativa significa que uma sobe enquanto a outra desce. Correlação zero indica que não há relação linear.

Para ter uma intuição visual, podemos montar um "scatter plot" em texto: para cada par de valores (x, y), imprimimos um ponto em uma grade. Mesmo sem gráficos sofisticados, isso já mostra se há um padrão.

Uma forma simples de começar é olhar os dados lado a lado. Se ordenarmos por uma variável, a outra acompanha? Se sim, há correlação. Se os valores da segunda variável parecem aleatórios quando a primeira cresce, provavelmente não há correlação forte.

Nesta lição, vamos explorar intuitivamente a relação entre duas variáveis antes de calcular um coeficiente numérico na próxima aula.

Exemplo:

# Temperatura (C) e vendas de sorvete
temperatura = [20, 22, 25, 28, 30, 32, 35]
vendas = [100, 120, 180, 220, 280, 310, 400]

# Visualização simples em texto
print("Temp | Vendas | Visual")
for t, v in zip(temperatura, vendas):
    barras = "#" * (v // 20)
    print(t, "  |", v, "  |", barras)

# Verificação intuitiva
print("\nQuando a temperatura sobe, as vendas também sobem?")
for i in range(1, len(temperatura)):
    t_subiu = temperatura[i] > temperatura[i-1]
    v_subiu = vendas[i] > vendas[i-1]
    print("Temp", temperatura[i-1], "->", temperatura[i],
          "| Vendas", vendas[i-1], "->", vendas[i],
          "| Mesma direção:", t_subiu == v_subiu)

Quando a temperatura sobe, as vendas de sorvete também sobem: ambas se movem na mesma direção. Isso é correlação positiva.

?

Desafio guiado

Analise a relação entre horas de estudo e notas. Calcule a direção dos movimentos para verificar se as variáveis andam juntas.

  1. Para cada par consecutivo, verifique se ambas as variáveis mudam na mesma direção.
  2. Conte quantos pares se movem na mesma direção (`mesma_direcao`).
  3. Calcule a porcentagem de concordância.
  4. Imprima a tabela e o resultado.

Saida esperada

Horas | Nota | Direção 3 | 55 | Sim 4 | 58 | Sim 5 | 70 | Sim 6 | 72 | Sim 7 | 85 | Sim 8 | 90 | Sim Concordância: 6 de 6 ( 100.0 %)

Dica

Compare horas[i] > horas[i-1] com notas[i] > notas[i-1]. Se ambos são True ou ambos False, eles concordam.

Pratique no navegador

Carregando ambiente Python...

Resumo da lição

Correlação mede se duas variáveis se movem juntas. Antes de calcular, observe visualmente se os movimentos concordam em direção.