Gráfico de Dispersão no Excel: Como Analisar Correlações entre Variáveis + Planilha Grátis
Olá, analistas de dados! Ananias Jr. por aqui, e hoje vamos falar de uma ferramenta estatística que me ajudou a tomar decisões baseadas em correlações reais: o Gráfico de Dispersão no Excel.
Se você precisa entender se duas variáveis estão relacionadas e como elas se influenciam, este artigo é para você.
Quando Descobri a Relação entre Tempo de Entrega e Satisfação do Cliente
Trabalhando no Centro de Distribuição de uma grande cervejaria, eu gerenciava indicadores de vendas e satisfação de clientes. Tínhamos um problema: a satisfação estava caindo, mas não sabíamos por quê.
Alguns diziam que era preço. Outros achavam que era qualidade do produto. Eu tinha uma hipótese diferente: tempo de entrega.
Peguei dados de 50 clientes dos últimos 3 meses: tempo médio de entrega (em horas) e nota de satisfação (de 0 a 10). Criei um Gráfico de Dispersão no Excel.
O resultado foi revelador. Havia uma correlação negativa forte (r = -0,82). Quanto maior o tempo de entrega, menor a satisfação. Clientes que recebiam em até 24 horas davam nota média 8,5. Clientes que recebiam em 48+ horas davam nota média 5,2.
Apresentei os dados para a diretoria. Investimos em otimização de rotas e contratamos mais motoristas. Em 3 meses, reduzimos o tempo médio de entrega de 36 para 22 horas. A satisfação subiu de 6,8 para 8,3.
O Gráfico de Dispersão transformou uma hipótese em evidência e uma evidência em ação.
O que é um Gráfico de Dispersão?
O Gráfico de Dispersão (também chamado de Scatter Plot) é um gráfico que mostra a relação entre duas variáveis numéricas. Cada ponto representa um par de valores (X, Y).
É uma das 7 Ferramentas da Qualidade e é fundamental para análise de correlação.
Os elementos principais são:
- Eixo X: Variável independente (causa)
- Eixo Y: Variável dependente (efeito)
- Pontos: Cada ponto representa uma observação
- Linha de Tendência: Mostra a direção da correlação
- R² (Coeficiente de Determinação): Mede a força da correlação (0 a 1)
Por que o Gráfico de Dispersão é Fundamental?
Em minha experiência com análise de operações, aprendi que intuição sem dados é perigosa. Você acha que duas coisas estão relacionadas, mas só o Gráfico de Dispersão prova.
O Gráfico de Dispersão resolve três problemas críticos:
1. Correlação vs Causalidade: Só porque duas coisas variam juntas não significa que uma causa a outra. O Gráfico de Dispersão mostra se há correlação. Cabe a você investigar se há causalidade.
2. Força da Relação: Não basta saber que há correlação. Você precisa saber se é forte ou fraca. Um R² de 0,9 significa que 90% da variação em Y é explicada por X. Um R² de 0,1 significa que há outros fatores mais importantes.
3. Outliers e Padrões: O Gráfico de Dispersão revela pontos fora do padrão (outliers) que merecem investigação. Às vezes um único outlier conta uma história importante.
Como Criar um Gráfico de Dispersão no Excel
Passo 1: Organize os Dados
Coloque a variável independente (X) na primeira coluna e a variável dependente (Y) na segunda. Cada linha é uma observação. Você precisa de pelo menos 10 a 15 pares de dados.
Passo 2: Selecione os Dados
Selecione as duas colunas (incluindo os cabeçalhos). Vá em Inserir > Gráficos > Dispersão. Escolha o modelo básico (pontos sem linhas).
Passo 3: Adicione Linha de Tendência
Clique com o botão direito em qualquer ponto do gráfico. Escolha “Adicionar Linha de Tendência”. Selecione “Linear”. Marque a opção “Exibir valor de R² no gráfico”.
Passo 4: Calcule a Correlação
Use a função =CORREL(intervalo_X, intervalo_Y) para calcular o coeficiente de correlação (r). Valores próximos de +1 indicam correlação positiva forte. Valores próximos de -1 indicam correlação negativa forte. Valores próximos de 0 indicam ausência de correlação.
Passo 5: Interprete o Resultado
Correlação positiva: quando X aumenta, Y também aumenta. Correlação negativa: quando X aumenta, Y diminui. Sem correlação: X e Y variam independentemente.
Baixe sua Planilha Grátis de Gráfico de Dispersão!
Com esta planilha você vai analisar correlações e tomar decisões baseadas em dados!
Perguntas Frequentes sobre Gráfico de Dispersão
1. Correlação significa que uma variável causa a outra?
Não! Correlação não é causalidade. Duas variáveis podem estar correlacionadas por coincidência ou porque ambas são causadas por uma terceira variável. Use o Gráfico de Dispersão para identificar correlações, mas investigue para confirmar causalidade.
2. Qual é um bom valor de R²?
Depende da área. Em ciências exatas, R² acima de 0,7 é considerado bom. Em ciências sociais e negócios, R² acima de 0,5 já é relevante. O importante é que quanto maior o R², mais forte a correlação.
3. O que fazer quando não há correlação?
Se o R² é baixo (abaixo de 0,3), significa que a variável X não explica bem a variável Y. Procure outras variáveis que possam ter mais influência. Às vezes a ausência de correlação é uma descoberta importante: você descobre que algo que achava importante não é.
Conclusão
O Gráfico de Dispersão me ensinou que dados bem visualizados revelam relações que números brutos escondem. Você para de adivinhar e começa a saber.
Lembre-se da minha história: aquele Gráfico de Dispersão provou que tempo de entrega estava matando a satisfação dos clientes. Agimos, melhoramos, e os resultados vieram.
Baixe a planilha grátis e comece a analisar correlações nos seus dados hoje mesmo!
Um forte abraço e boa análise!