Trilha Estatistica
Pensando com Números·Licao 3/24
Modulo 1

Moda

Trilha Estatistica, dentro da Oficina de Dados.

A moda é o valor que aparece com mais frequência em um conjunto de dados. Diferente da média e da mediana, a moda funciona tanto para números quanto para categorias (texto). Por isso, é muito usada em análises de produtos, pesquisas de opinião e segmentação de clientes.

Para encontrar a moda manualmente, você precisa contar quantas vezes cada valor aparece. Em Python, isso pode ser feito com um dicionário: as chaves são os valores e os valores do dicionário são as contagens. Depois, basta encontrar a chave com a maior contagem.

Um detalhe importante: um conjunto de dados pode ter mais de uma moda (bimodal, multimodal) ou nenhuma moda se todos os valores forem únicos. A função statistics.mode() retorna apenas um valor: se houver empate, ela retorna o primeiro encontrado (nas versões mais recentes do Python).

O módulo statistics também oferece statistics.multimode() para retornar todas as modas quando há empate. Mas entender o processo manual com dicionários é fundamental para desenvolver seu raciocínio analítico.

No dia a dia com dados, a moda responde perguntas como: "Qual produto mais vendido?", "Qual a faixa etária mais comum?", "Qual o meio de pagamento preferido?".

Exemplo:

categorias = ["eletronicos", "roupas", "eletronicos", "alimentos", "roupas", "eletronicos"]

# Na mão com dicionário
contagem = {}
for cat in categorias:
    contagem[cat] = contagem.get(cat, 0) + 1
moda_manual = max(contagem, key=contagem.get)
print("Moda manual:", moda_manual)
print("Contagens:", contagem)

# Com a biblioteca
import statistics
print("Moda statistics:", statistics.mode(categorias))

Contamos cada categoria com um dicionário e depois encontramos a chave com o maior valor. A biblioteca statistics faz isso em uma linha.

?

Desafio guiado

Encontre a moda (produto mais vendido) da lista abaixo. Primeiro conte as frequências manualmente usando um dicionário, depois use statistics.mode().

  1. Crie um dicionário `contagem` percorrendo a lista e contando cada produto.
  2. Use `max(contagem, key=contagem.get)` para encontrar `moda_manual`.
  3. Use `statistics.mode()` para calcular `moda_lib`.
  4. Imprima os resultados.

Saida esperada

Moda manual: camiseta Moda statistics: camiseta

Dica

Use contagem[produto] = contagem.get(produto, 0) + 1 dentro do for para contar cada produto.

Pratique no navegador

Carregando ambiente Python...

Resumo da lição

A moda identifica o valor mais frequente e funciona para números e categorias. Use dicionários para contar frequências antes de recorrer a bibliotecas.