Prévia do material em texto
Distribuições de Probabilidade: Esperança Matemática, Variância e Desvio-Padrão APRESENTAÇÃO A estatística é usualmente dividida entre descritiva e inferencial. A primeira é a parte que cuida da descrição dos dados, quer sejam eles amostrais ou populacionais, e a segunda tem por objetivo a generalização do que é estudado, ou seja, a partir de amostras, concluí-se para populações. A descrição dos dados pode ser realizada de diversas maneiras, entre elas com o cálculo das medidas de posição ou das medidas de dispersão. Quando essas medidas são calculadas para a população, chamam-se de parâmetros e quando calcula-separa as amostras, é chamada de estimador. A esperança matemática (estimativa) estuda como prever medidas populacionais desconhecidas, fundamentadas em resultados conhecidos na amostra. Já a variância e o desvio- padrão são exemplos de medidas de dispersão, utilizadas quando os dados possuem uma disparidade consideravelmente grande para uma simples análise por medidas de posição. Nesta Unidade de Aprendizagem, serao calculada e analisada a esperança matemática, algumas medidas de dispersão, como a amplitude, o desvio médio, a variância e o desvio-padrão, visualizando sua importância no estudo da estatística e na tomada de decisões. Bons estudos. Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Resolver cálculos de esperança matemática.• Definir medidas de dispersão.• Realizar cálculos de variância e desvio-padrão.• DESAFIO Através das medidas de posição e de dispersão pode-se obter dados importantes sobre um conjunto de dados quantitativos. As medidas de posição (média, mediana e moda) tem a tendência de serem encontradas em torno do centro do conjunto de dados. Já as medidas de variabilidade (amplitude, desvio médio, variância, desvio-padrão) ajudam a entender a distribuição dos dados, em torno da média. Ao lidar com um conjunto de dados quantitativos é importante saber calcular e interpretar cada uma dessas medidas para auxiliar na descrição dos dados. Acompanhe a seguinte situação: Para esses dois conjuntos de dados, calcule a amplitude, a média, a variância e o desvio-padrão e comente os resultados encontrados. INFOGRÁFICO Um conjunto de dados, quer sejam amostrais ou populacionais, pode ser descrito por meio de medidas estatísticas: parâmetros (população) ou estimadores (amostra). Para a análise de dados, é importante não apenas saber calculá-los, mas também interpretá-los corretamente. Veja nesse infográfico, como calcular e interpretar a esperança, média, variância e desvio padrão para um conjunto de dados. Maycon Carbone Caixa de texto Amplitude: Conjunto A: 7-2 = 5 Conjunto B: 72-2 = 70 Conclusão: O conjunto B é mais amplo que o conjunto A, mesmo tendo a mesma quantidade de elementos (5). Pode-se dizer que o conjunto B é mais disperso ou espalhado. Média: Conjunto A: (2 + 3 + 3 + 5 + 7)/5 (pois, são 5 elementos) = 20/5 = 4. Conjunto B: (2 + 3 + 3 + 45 + 72)/5 (também são 5 elementos) = 125/5 = 25. Conclusão: Em média 4 produtos por caixa foram embalados com defeito na data A, que não era véspera de feriado e em média 25 produtos por caixa foram embalados com defeito na data B, véspera de feriado. Variância e Desvio padrão: Utilize os quadros a seguir para auxiliar. Maycon Carbone Carimbo CONTEÚDO DO LIVRO Acompanhe um trecho do livro Estatística, que é a base teórica para esta Unidade de Aprendizagem. Boa leitura. ESTATÍSTICA Ana Laura Bertelli Grams Distribuições de probabilidade: esperança matemática, variância e desvio-padrão Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Resolver cálculos de esperança matemática. � Definir medidas de dispersão. � Realizar cálculos de variância e desvio-padrão. Introdução A análise estatística e a inferência sobre populações com base em amostras dependem de muitas medidas para que a tomada de decisões seja a melhor possível. Em estatística, dizemos que, quanto mais informações das características da variável em estudo tivermos, mais acertada será nossa decisão sobre ela. Neste capítulo, você descobrirá o que significa esperança matemática, variância e desvio-padrão. Esperança matemática A inferência estatística baseia-se no estudo de dados amostrais, e a busca da estimativa amostral (ou do valor esperado) ocorre para podermos estimar o verdadeiro parâmetro populacional para a tomada de decisão. A esperança matemática (estimativa) estuda como prever medidas populacionais desco- nhecidas, fundamentadas em resultados conhecidos na amostra. A rotina das pessoas é estabelecida pela inferência de fatos amostrais. Os exemplos citados por Milone (2006) revelam a naturalidade dessas apli- cações: em dias em que o céu está recheado de nuvens escuras, inferimos a possibilidade de chuvas; o fato de haver muita fumaça em uma edificação remete a uma eventualidade de um incêndio. Esses casos são eventos prováveis, mas nem sempre acontecem de fato. Na prática, há diversos fatos que buscam pela estimação e baseiam suas previsões, por exemplo, de vendas, de eleitores, de defeitos das peças em uma linha de produção, dos custos dos produtos, de dívidas, entre outros. Os dados descritivos amostrais são estimadores dos parâmetros populacionais. Por exemplo, a média amostral e a proporção amostral são consideradas esti- mativas pontuais, quando apresentadas a partir de um único número (ponto). Para estudos estatísticos, utilizamos com mais frequência a estimação por intervalo, que fornece um intervalo de valores possíveis, admitindo uma margem de confiança, considerando a estimativa pontual. Suponha que 500 pessoas são questionadas sobre seu consumo anual de carne vermelha, e a média amostral seja de 20 kg por pessoa, com desvio-padrão de 0,2 kg. � A média amostral de 20 kg é uma estimativa pontual para o consumo anual de carne vermelha por pessoa. � A média da população provavelmente está próxima de 20 kg, mas, possivelmente, não é exatamente igual a 20 kg. O intervalo de confiança estima o quanto a média amostral aproxima-se da média populacional. Se o intervalo de confiança fosse 20 ± 0,08, poderíamos calcular um nível de confiança que define a média populacional no intervalo ]19,92; 20,08[. Cálculo Seja p a probabilidade de um evento S ocorrer, a esperança matemática (E) é definida por: E = p ∙ S Distribuições de probabilidade: esperança matemática, variância e desvio-padrão2 Em um conjunto de dados de uma variável aleatória discreta x1, x2, ..., xn, em que a probabilidade de cada dado é p1, p2, ..., pn, respectivamente, define-se esperança matemática por: E(x) = p1 ∙ x1 + p2 ∙ x2 + ... pn ∙ xn Ou seja, E(x) = ∑ pi · xi n i = 1 Duas moedas são jogadas 14 vezes, e os resultados foram: � 5 jogadas sem nenhum resultado cara; � 6 jogadas, sendo apenas uma moeda cara; � 3 jogadas, sendo as duas moedas cara. Qual é o valor esperado de caras por lançamento? Temos que a probabilidade de nenhum resultado cara é: 5 14 , de apenas uma moeda ser cara: 6 14 ; e de as duas moedas serem cara: 3 14 . Assim, a esperança da variável cara ocorrer, por lançamento, é: 5 14 6 14 3 14 ∙ 0 + ∙ 1 + ∙ 2 = = 0,865 ∙ 0 + 6 ∙ 1 + 3 ∙ 2 14 Medidas de dispersão O estudo das medidas de posição é útil para fornecer boa parte das carac- terísticas de um conjunto de dados. Contudo, existem outros parâmetros que complementam a caracterização dos conjuntos, principalmente quando estes possuem uma disparidade consideravelmente grande para uma simples análise por medidas de posição. Chamamos esses parâmetros de medidas de dispersão, e eles indicam a variabilidade da variável em torno de uma medida de posição — comumente, a média aritmética. 3Distribuições de probabilidade: esperança matemática, variância e desvio-padrão Amplitude A amplitude é o mesmo que a variação entre dois elementos. Em um conjunto de dados, a amplitude totalé encontrada por meio do cálculo da diferença entre o limite superior e o limite inferior, conforme segue: Ar = xmáx – xmin onde xmáx representa o limite superior, e xmin, o limite inferior. A amplitude é considerada uma medida instável, pois é influenciada pelas extremidades dos conjuntos. As próximas medidas não possuem essa caracte- rística, já que consideram todos os valores sob análise, sendo, assim, medidas mais utilizadas e com índices de variabilidade estáveis. Desvio médio O desvio médio é uma medida de dispersão, pela qual temos a média dos des- vios em relação a uma medida de posição, podendo ser a média das diferenças absolutas entre cada elemento do conjunto e a média aritmética. A seguinte expressão representa o desvio médio da população: D– m = ∑|x – μ| N onde x representa cada elemento do conjunto de dados, μ, a média da população, e N, a quantidade de desvios. Contudo, os dados analisados, na maioria dos estudos estatísticos, referem-se a uma amostra. Assim, para o cálculo do desvio médio amostral, utiliza-se a seguinte expressão, a qual fornece uma estimativa sem tendenciosidade do desvio médio da população. d – m = ∑|x – x–| n – 1 onde x representa cada elemento do conjunto de dados, x–, a média da população, e n, a quantidade de elementos na amostra. Distribuições de probabilidade: esperança matemática, variância e desvio-padrão4 Perceba que o desvio médio é uma medida não negativa. Por isso, calcula-se o módulo (valor absoluto) de cada desvio, pois entre cada uma das diferenças (de cada um dos valores com relação à média) pode-se ter valores positivos ou negativos. Ao se aplicar o módulo, elimina-se esse sinal. Variância A variância da população baseia-se no desvio médio. Para seu cálculo, os desvios em torno da média do conjunto são elevados ao quadrado. Sendo assim: σ2 = ∑(xi – μ) 2 N Em que xi representa cada elemento, μ, a média da população, e N, a quan- tidade de observações. A mesma explicação dada no cálculo do desvio médio vale para a variância, de modo que a variância de uma amostral é dada por: s2 = ∑(xi – x –)2 n – 1 onde 𝜎² é o valor numérico da variância, xi, representa cada elemento, x –, a média aritmética amostral, e n, o tamanho da amostra. Uma interpretação razoável do valor numérico da variância é dada por Anderson et al. (2006), quando sugere que a variância seja considerada como uma medida útil ao comparar a variabilidade entre variáveis, de modo que, em uma comparação de variáveis, aquela que tem a maior variância exibe maior variabilidade. Desvio-padrão A medida de dispersão, chamada desvio-padrão, é definida como a raiz qua- drada positiva da variância, simplesmente denotada por σ = √σ2, desvio-padrão da população. 5Distribuições de probabilidade: esperança matemática, variância e desvio-padrão O interesse em calcular e considerar o desvio-padrão como uma medida útil na análise estatística é que a variância se restringe a uma análise das unidades elevadas ao quadrado — por exemplo, a variância de medidas de comprimento é dada em medidas de área, enquanto que o desvio-padrão é medido nas mesmas unidades que os dados originais. Sendo assim, é facilmente comparado a outras medidas de posição ou outros dados estatísticos. Há, ainda, uma descrição de dados muito utilizada e derivada do desvio-padrão: o coeficiente de variação. Este é utilizado quando queremos comprar dois ou mais grupos de dados quanto à sua variabilidade e temos médias aritméticas distintas. Quanto menor for o coeficiente de variação, mais homogêneos serão os dados. Para casos com coeficiente de variação muito elevado, a média nem sempre será a medida de posição mais apropriada para resumir a variável. O coeficiente de variação é calculado em situações em que é preciso indicar o “tamanho” de , em relação à média aritmética. Ele é expresso em porcentagem, a partir de σ x– ∙ 100 % . Cálculos de variância e desvio-padrão A aplicação das expressões matemáticas indicadas anteriormente será mostrada aqui, a partir de alguns exemplos de cálculos de cada medida de dispersão. A resistência é uma característica importante para analisar materiais pré-fabricados. Cada um dos 8 elementos de placas pré-fabricadas de concreto foi submetido a um teste de tensão, e a largura máxima (mm) das trincas resultantes foi registrada no seguinte quadro: 0,794 3,870 0,483 0,924 2,230 1,038 1,285 0,598 Distribuições de probabilidade: esperança matemática, variância e desvio-padrão6 Qual é o desvio-padrão da largura das trincas? Solução: Para a resolução, utilizaremos três etapas: o cálculo da média, o cálculo da variância e, por fim, o desvio-padrão. 1. Cálculo da média aritmética: x– = ∑x n x– = 0,794 + 3,870 + 0,483 + 0,924 + 2,230 + 1,038 + 1,285 + 0,598 8 x– = 1,4 mm 2. Cálculo da variância: A partir da média, calculamos os desvios de cada elemento. s2 = ∑(xi – x –)2 n – 1 σ2 = (0,794 – 1,4) 2 + (3,87 – 1,4)2 + (0,483 – 1,4)2 + (0,924 – 1,4)2 + (2,23 – 1,4)2 + (1,038 – 1,4)2 + (1,285 – 1,4)2 + (0,598 – 1,4)2 8 – 1 s2 = 9,012 7 = 1,287 mm2 3. Cálculo do desvio-padrão: Sendo a variância 1,287, temos que: s = √1,287 = 1,135 mm Qual é o desvio-padrão da vida útil (em horas) de um determinado tipo de lâmpada, considerando as 20 observações amostrais a seguir? xi fi 612 4 666 3 7Distribuições de probabilidade: esperança matemática, variância e desvio-padrão xi fi 744 6 883 5 964 2 Total 20 Solução: As mesmas etapas do exemplo anterior devem ser seguidas. Entretanto, agora temos uma distribuição de frequências. Para o cálculo da média, será necessário multiplicarmos cada variável (vida útil) pela sua respectiva frequência. 1. Cálculo da média aritmética: x– = ∑(xi · fi) ∑fi x– = (612 · 4) + (666 · 3) + (744 · 6) + (883 · 5) + (964 · 2) 4 + 3 + 6 + 5 + 2 x– = 15.253 20 = 762,65 h 2. Cálculo da variância: s2 = ∑(xi – x –)2 n – 1 σ2 = 4 · (612 – 762,65) 2 + 3 · (666 – 762,65)2 + 6 · (744 – 762,65)2 + 5 · (883 – 762,65)2 + 2 · (964 – 762,65)2 20 –1 s2 = 274.396,6 19 = 14.441,93 h2 3. Cálculo do desvio-padrão: s = √14441,93 = 120,17 h Distribuições de probabilidade: esperança matemática, variância e desvio-padrão8 Os dados a seguir representam o tempo (em segundos) para carga de um aplicativo, num sistema compartilhado. Classes de tempo Número de observações [6, 7[ 14 [7, 8[ 4 [8, 9[ 7 [9, 10[ 3 [10, 11[ 0 [11, 12[ 0 [12, 13[ 2 Total 30 Determine o desvio-padrão e o coeficiente de variação dessa amostra. Solução: Nesse caso, temos uma distribuição de frequência em intervalos de classe. Por isso, precisamos encontrar o ponto médio de cada intervalo para, então, calcular a média e prosseguir com os cálculos das medidas de dispersão. Classes de tempo xi (ponto médio da classe) Número de observações [6, 7[ 6,5 14 [7, 8[ 7,5 4 [8, 9[ 8,5 7 [9, 10[ 9,5 3 [10, 11[ 10,5 0 [11, 12[ 11,5 0 [12, 13[ 12,5 2 Total 30 9Distribuições de probabilidade: esperança matemática, variância e desvio-padrão ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Cengage Learning, 2008. MILONE, G. Estatística: geral e aplicada. São Paulo: Thomson Learning, 2006. Leitura recomendada MORETTIN, L. G. Estatística básica: probabilidade e inferência. São Paulo: Pearson Pren- tice Hall, 2010. 1. Cálculo da média aritmética: x– = (6,5 · 14) + (7,5 · 4) + (8,5 · 7) + (9,5 · 3) + (10,5 · 0) + (11,5 · 0) + (12,5 · 2) 14 + 4 + 7 + 3 + 0 + 0 + 2 x– = 234 30 = 7,8 s (Em distribuições de frequência como essas, os valores de x_i são expressos pelos respectivos pontos médios dos intervalos de classe). x– = (6,5 · 14) + (7,5 · 4) + (8,5 · 7) + (9,5 · 3) + (10,5 · 0) + (11,5 · 0) + (12,5 · 2) 14 + 4 + 7 + 3 + 0 + 0 + 2 x– = 234 30 = 7,8 s 2. Cálculo da variância: s2 = ∑(xi – x –)2 n – 1 s2 = 14 · (6,5 – 7,8) 2 + 4 · (7,5 – 7,8)2 + 7 · (8,5 – 7,8)2 + 3 · (9,5 – 7,8)2 + 2 · (12,5 – 7,8)2 30 –1 s2 = 80,3 29 = 2,769s 2 3. Cálculo do desvio-padrão: s = √2,769 = 1,664 s Distribuições de probabilidade: esperança matemática, variância e desvio-padrão10 Conteúdo: DICA DO PROFESSOR Uma forma de descrever dados estatísticos, sejam amostrais ou populacionais, é por meio das chamadas medidas estatísticas, que podem ser medidas de posição ou medidas de dispersão. As medidas de posição, estão relacionadas com o centro dos dados, já as de dispersão indicam a variabilidade da variável em torno de uma medida de posição — geralmente, a média aritmética. Nesta Dica do Professor, veja mais sobre algumas dessas medidas: esperança matemática, média, variância e desvio-padrão. Conteúdo interativo disponível na plataforma de ensino! EXERCÍCIOS 1) No estudo da probabilidade e estatística, a esperança matemática (estimativa) estuda como prever medidas populacionais desconhecidas, fundamentadas em resultados conhecidos na amostra. Neste contexto, considere que um vendedor tem 34% de probabilidade de receber R$ 2.000,00 de comissão e 66% de probabilidade de receber R$ 3.000,00, qual é o valor de sua esperança? A) R$ 2.660,00. B) 50%. C) 34%. D) R$ 2.000,00. E) R$ 3.000,00. Uma medida de dispersão conhecida na prática é a amplitude. Se uma lojista quer 2) Maycon Carbone Realce Maycon Carbone Carimbo oferecer aos seus clientes a maior amplitude de tamanhos de roupas, qual das opções abaixo os atenderá melhor? Os números representam os tamanhos das roupas em centímetros. A) 22, 24, 26, 28, 30, 32 e 36. B) 21, 24, 26, 28 e 36. C) 18, 24 e 40. D) 18, 20, 22, 24, 26, 28, 30, 32 e 36. E) 25 e 41. 3) O desvio-padrão é uma das medidas de dispersão mais utilizada na prática, pois comparar a variabilidade dos dados em relação à média. Considere que uma empresa precisa saber qual o desvio-padrão de uma amostra de seus produtos, cujas dimensões (em centímetros) são: 12, 14 e 20. Marque a opção que contém a resposta correta. A) 8. B) 15,33. C) 17,33. D) - 4,16. E) 4,16. Maycon Carbone Realce Maycon Carbone Carimbo Maycon Carbone Realce Maycon Carbone Carimbo 4) Uma empresa que embala sacas de arroz está com problemas na sua máquina ensacadora. O gerente de operações deseja verificar qual a variabilidade de peso de uma amostra de 5 sacas de arroz. Os dados são os seguintes: 22, 29, 20, 19, 24. Calcule o desvio padrão para esse gerente e assinale a alternativa correta. A) 22,80 B) 9,31 C) 3,96 D) 3,44 E) 4,29 5) Uma loja de departamentos resolveu realizar uma pesquisa para verificar os valores que seus funcionários gastaram com presentes no dia das mães e analisar a variabilidade desses valores. Os valores gastos por uma amostra composta por funcionários com o último presente do dia das mães foram: 150, 900, 90, 301, 99. Calcule o desvio padrão e assinale a alternativa correta: A) 308,0 B) 305,5 C) 341,6 D) 301,4 E) 312,1 Maycon Carbone Realce Maycon Carbone Carimbo Maycon Carbone Realce Maycon Carbone Carimbo NA PRÁTICA Ao analisar um conjunto de dados, é preciso ter em mente quais são as medidas estatísticas mais adequadas para descrevê-lo. Por exemplo, um problema para a média aritmética é quando existem pontos discrepantes dentro do conjunto de dados que podem distorcer o resultado desta medida de posição. Neste caso, será necesária outra medida para descrever melhor os dados e, em geral, utiliza-se as medidas de dispersão, que são um complemento para a análise dos dados, ou seja, quando dois conjuntos de dados têm a mesma média não necessariamente terão o mesmo comportamento na distribuição dos resultados. Na prática, veja exemplos de como se aplicam algumas dessas medidas como a esperança matemática, a variância e o desvio-padrão. SAIBA + Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor: Desvio-Padrão Esse artigo apresenta a definição de desvio-padrão e um exemplo de cálculo para dados populacionais. Também apresenta uma lista de exercícios propostos, com o gabarito comentado. Conteúdo interativo disponível na plataforma de ensino! Como Fazer Desvio Padrão no Excel Passo a Passo Esse vídeo detalha o cálculo do desvio-padrão populacional utilizando o Excel. Primeiramente ele define o desvio-padrão, para depois mostrar como utilizar as fórmulas média e devpad.p no Excel para calcular a média e o desvio-padrão populacional. Conteúdo interativo disponível na plataforma de ensino! Variância e Desvio-padrão Esse vídeo apresenta os conceitos de desvio, variância e desvio-padrão populacional, a partir e um exemplo prático com um conjunto de dados contendo 5 elementos. Os cálculos são realizados passo a passo e ao final é feita uma síntese. Conteúdo interativo disponível na plataforma de ensino!