Prévia do material em texto
Medidas de Dispersão Só média não basta! Depois que a tendência central é determinada, precisamos determinar o quanto nossos dados estão espalhados/dispersos; É preciso saber como a média vai estar variando ou se dispersando do conjunto de valores da população ou amostra Medidas de Dispersão Dispersão é sinônimo de variação ou variabilidade; Três medidas são usadas mais frequentemente para medir a dispersão: • Amplitude; • Variância; • Desvio padrão. Amplitude: É a diferença entre o maior e o menor valor observado; • A amplitude não mede bem a dispersão dos dados uma vez que, para calculá-la só são usados os valores extremos e não todos os dados. AT= VMÁX-VMÍN Variância: Mostra o quanto cada valor está distante em relação à média; • Desvios em relação à média; • Diferença entre cada dado e a média de conjunto • Como cada dado tem um desvio em relação à média, para verificar a dispersão de uma amostra é preciso saber todos os desvios. • Variância Populacional • Variância Amostral Existem duas maneiras de calcular a Variância: Primeira maneira: 1. Eleve cada valor ao quadrado e some; 2. Divida a soma por N (se for para população) ou N-1 (se for para amostras); 3. Calcule a média e eleve-a ao quadrado 4.Depois calcule a variância Quanto maior for a variância, mais distantes da média estarão os valores, e quanto menor for a variância, mais próximos os valores estarão da média Segunda maneira: O cálculo da variância populacional é obtido através da soma dos quadrados da diferença entre cada valor e a média aritmética, dividida pela quantidade de elementos observados. Ou seja, seguir a fórmula do tipo de variância escolhida. 1. Encontramos a média; 2. Calculamos cada desvio médio; 3. Elevamos os desvios ao quadrado e dividimos pelo N Desvio Padrão: Algumas vezes, a variância pode não ser suficiente para analisar a dispersão, pois valores muito distantes da média podem influenciá-la; • Nesses casos, se utiliza o desvio padrão, que é calculado simplesmente pela raiz quadrada da variância. xi=valor individual x=média dos valores n=número de valores Coeficiente de Variação • As medidas de dispersão medidas a partir do desvio padrão são denominadas dispersão absoluta; • O desvio padrão é utilizado para comparar dois conjuntos de dados que estejam na mesma unidade de medida; • Se os conjuntos de dados são medidos em grandezas diferentes, a comparação deve ser feita se utilizando coeficiente de variação, uma medida de dispersão relativa. • Como o coeficiente de variação analisa a dispersão em termos relativos, ele é dado em %; De uma forma geral, se o CV: • For menor ou igual a 15% → baixa dispersão: dados homogêneos • For entre 15 e 30% → média dispersão • For maior que 30%→ alta dispersão: dados heterogêneos CV=Coeficiente de variação CVP=Coeficient de variação de pearson σ= Desvio-padrão dos dados da série X=Média dos dados da série Exercitando - Coeficiente de Variação Em um grupo de moradores de determinada região foram analisadas a idade (em anos) e a altura (em metros) das pessoas. Deseja-se comparar a dispersão em termos relativos em torno da média dos dois conjuntos de dados, a fim de verificar qual deles é mais homogêneo. Na coleta dos dados verificou-se que: Idade das pessoas: X=41,6 e s = 0,82 Altura das pessoas: X=1,67 e s = 0,2 Exemplo Observe as notas de Jorge e Mateus, quem teve o desempenho mais regular? Jorge Mateus 9 9 7 9 5 9 3 2 2 2