Prévia do material em texto
1 DISCIPLINA: PROBABILIDADE E ESTATÍSTICA 2020/2 PROFª ROSEANI PARENTE 1. VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE Vimos anteriormente que uma tabela de frequências pode ser utilizada para apresentar os valores possíveis de uma dada variável associada as suas respectivas frequências. De forma análoga vamos, com a ajuda da Teoria das Probabilidades, formalizar o comportamento de variáveis na população associando a cada possível valor sua probabilidade de ocorrência. DEFINIÇÃO 1: Uma variável aleatória é uma função real (isto é, que assume valores em ) definida no espaço amostral de um experimento aleatório. Ou seja, uma variável aleatória é uma função que confere um número real a cada resultado no espaço amostral () de um experimento aleatório. Alguns exemplos de variáveis aleatórias: a) Número de coroas obtido no lançamento de duas moedas. b) Nº de itens defeituosos em uma amostra retirada aleatoriamente de um lote. c) Tempo que um operário gasta para executar determinada tarefa. d) Custo do sinistro de um carro; e) A temperatura mínima diária; f) A intensidade de uma corrente elétrica. Por questões de simplicidade, muitas vezes abreviaremos a expressão variável aleatória por v.a. A convenção usual para representar uma v.a. consiste em usar letras maiúsculas como X, Y , etc. Um valor específico, mas genérico, desta variável será representado pela letra minúscula correspondente: x; y; etc. 2. VARIÁVEIS ALEATÓRIAS DISCRETAS DEFINIÇÃO 2: Uma variável aleatória é discreta se sua imagem (conjunto de valores que ela pode assumir) é um conjunto enumerável de valores. Exemplo 1: Duas bolas são retiradas, sem reposição, de uma urna que contém quatro bolas vermelhas (V) e três pretas (P), sem reposição. Os resultados possíveis e os valores da variável aleatória X = número de bolas vermelhas são: Eventos X P e P 0 (V e P) ou (P e V) 1 V e V 2 DEFINIÇÃO 3: Seja X uma variável aleatória discreta. A função que atribui a cada valor assumido pela variável aleatória sua probabilidade de ocorrência é denominada de Função de Distribuição de Probabilidade (ou simplesmente Distribuição de Probabilidade) de X. A notação utilizada é: p(xi) = P(X = xi) para i = 1, 2, ..., n. A função de probabilidade deve satisfazer as seguintes condições: a) p(xi) 0; b) ∑ 𝑝(𝑥 ) = 1. Uma variável aleatória discreta assume cada um de seus valores com certa probabilidade. Tomando os dados do exemplo 1 temos: 2 Eventos X P(X = xi) P e P 0 3 7 × 2 6 = 1 7 = 0,14 (V e P) ou (P e V) 1 4 7 × 3 6 + 3 7 × 4 6 = 4 7 = 0,57 V e V 2 4 7 × 3 6 = 2 7 = 0,29 Total 1 Observe que, como os valores de X abrangem todos os casos possíveis, a soma das probabilidades é igual a 1. O conjunto de pares ordenados (x, P(x)) é chamado de função de probabilidade ou distribuição de probabilidade da variável aleatória discreta X. Exemplo 2: Lançam-se 3 moedas. Considere Y: o número de ocorrências da face cara. Determinar a distribuição de probabilidade de Y. Os valores que Y podem assumir são 0, 1, 2 e 3 e sua distribuição de probabilidades é: Y 0 1 2 3 Total P(Y=yi) 1/8 3/8 3/8 1/8 1 2.1 ESPERANÇA (MÉDIA) E VARIÂNCIA DE VARIÁVEIS ALEATÓRIAS DISCRETAS Além das funções de probabilidade existem quantidades que permitem caracterizar adicionalmente a distribuição de uma variável aleatória discreta. A média ou valor esperado de uma variável aleatória discreta X é uma medida de centralidade. Ela também é denominada de Esperança e por isso sua notação é E(X). DEFINIÇÃO 4: Seja X uma variável aleatória discreta que assume valores {x1, x2, x3, ..., xn} com probabilidades p(x1),p( x2), p(x3),..., p(xn) respectivamente, então sua média ou esperança é definida como: 𝝁 = 𝑬(𝑿) = ∑ 𝒙𝒊𝒑(𝒙𝒊) = ∑ 𝒙𝒊𝑷(𝑿 = 𝒙𝒊)𝒊𝒊 . Podemos ver, então, que a esperança de X é uma média dos seus valores ponderada pelas respectivas probabilidades. Tomando os dados do exemplo 2, pode-se perguntar qual o “número médio de ocorrências de face cara” no lançamento de 3 moedas. Aplicando a definição 4, teremos: 𝐸(𝑌) = 0 ⋅ + 1 ⋅ + 2 ⋅ + 3 ⋅ = 3/2 = 1,5 faces cara, em média, no lançamento de 3 moedas. PROPRIEDADES DA ESPERANÇA: Seja X uma variável aleatória discreta com função de probabilidade f(x) e a, b 0 são constantes reais quaisquer, temos as seguintes propriedades: a) E(a) = a; b) E(X + a) = E(X) + a = + a; c) E(bX) = b E(X) = b ; d) Xmin ≤ E(X) ≤ Xmáx, onde Xmin e Xmáx são os valores de mínimo e de máximo da variável X. O simples conhecimento da média de uma v.a. X, em geral, não é suficiente para termos uma ideia clara da distribuição de X. Para quantificar o grau de dispersão dos valores de X precisamos das medidas de dispersão. 3 A dispersão de uma variável aleatória X será, inicialmente, medida pela sua variância. DEFINIÇÃO 5: A variância de uma variável aleatória X é definida como: 𝝈𝟐 = 𝑽𝒂𝒓(𝑿) = 𝑬[𝑿 − 𝑬(𝑿)]𝟐. O termo X – E(X) é o desvio em torno da média. Sendo assim, a variância é a média dos desvios quadráticos em torno da média E(X). Desenvolvendo o quadrado e usando as propriedades do somatório e da esperança, podemos escrever a variância como: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] , onde 𝐸(𝑋 ) = ∑ 𝑥 𝑝(𝑥 ). Da definição de variância, resulta que sua unidade de medida é o quadrado da unidade de medida da variável em estudo, sendo assim, uma unidade sem significado físico. Para termos uma medida de dispersão na mesma unidade dos dados define-se o desvio-padrão como a raiz quadrada da variância. DEFINIÇÃO 6: O desvio padrão de uma variável aleatória X é definido como a raiz quadrada positiva de sua variância: 𝜎 = 𝐷𝑃(𝑋) = 𝑉𝑎𝑟(𝑋) Aplicando a definição aos dados do exemplo 2, teremos: E(Y2) = ∑ 𝑦 𝑝(𝑦 ) = 0 ⋅ + 1 ⋅ + 2 ⋅ + 3 ⋅ = 3 (faces cara)2. 𝑉𝑎𝑟(𝑌) = 𝐸(𝑌 ) − [𝐸(𝑌)] = 3 − (1,5) = 0,75 (faces cara)2. 𝐷𝑃(𝑌) = 0,75 = 0,87 faces cara. PROPRIEDADES DA VARIÂNCIA E DO DESVIO PADRÃO: Seja X uma variável aleatória discreta com função de probabilidade f(x) e a, b 0 são constantes reais quaisquer, temos as seguintes propriedades: a) Var(X) 0 e DP(X) 0; b) Var(a) = 0 e DP(a) = 0; c) Var (X + a) = VAR(X) e DP(X + a) = DP(X); d) Var (bX) = b2 Var(X) e DP(bX) = |b|DP(X). Exemplo 3: O tempo T, em minutos, necessário para um operário processar certa peça é uma v.a. com a seguinte distribuição de probabilidade: t 2 3 4 5 6 7 P(t) 0,1 0,1 0,3 0,2 0,2 0,1 a) Calcule o tempo médio de processamento. b) Calcule a variância e o desvio padrão. Solução: a) 𝜇 = 𝐸(𝑇) = 𝑡 𝑝(𝑡 ) = (2 × 0,1) + (3 × 0,1) + ⋯ + (7 × 0,1) 𝜇 = 𝐸(𝑇) = 4,6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 b) A variância: 𝜎 = 𝑉𝑎𝑟(𝑇) = 𝐸(𝑇 ) − [𝐸(𝑇)] Sabemos que 𝜇 = 𝐸(𝑇) = 4,6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠. 𝐸(𝑇 ) = 𝑡 𝑝(𝑡 ) = (2 × 0,1) + (3 × 0,1) + ⋯ + (7 × 0,1) 𝐸(𝑇 ) = 23,2 4 Determinando a variância: 𝜎 = 𝑉𝑎𝑟(𝑇) = 23,2 − 4,6 = 2,04 (𝑚𝑖𝑛𝑢𝑡𝑜𝑠) E o desvio padrão: 𝜎 = 𝐷𝑃(𝑇) = √2,04 = 1,4 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 O coeficiente de variação: 𝐶𝑉(𝑇) = , , × 100 = 30,4% Exemplo 4: Considere as variáveis aleatórias X e Y com suas correspondentes funções de probabilidade: Xi 1 2 3 4 5 6 7 P(Xi) 0,01 0,01 0,30 0,36 0,30 0,01 0,01 Yi 1 2 3 4 5 6 7 P(Yi) 0,47 0,02 0,01 0,00 0,01 0,02 0,47 Solução: Calculando as esperanças das duas, teremos: 𝐸(𝑋) = (1 ⋅ 0,01) + (2 ⋅ 0,01) + (3 ⋅ 0,30) + (4 ⋅ 0,36) + (5 ⋅ 0,01) + (6 ⋅ 0,01) + (7 ⋅ 0,01) = 4 𝐸(𝑌) = (1 ⋅ 0,47) + (2 ⋅ 0,02) + (3 ⋅ 0,01) + (4 ⋅ 0,00) + (5 ⋅ 0,01) + (6 ⋅ 0,02) + (7 ⋅ 0,47) = 4 Figura 1 – Distribuições de probabilidade de X e de Y. As médias são iguais, mas podemos verificar que X e Y têm distribuições bem diferentes. A variável X tem os valores centrais 3, 4 e 5 como mais prováveis, com probabilidades muito pequenas para os demaisvalores. Enquanto que a variável Y, tem os valores extremos 1 e 7 como os mais prováveis. Vejamos como essa diferença se expressa nos termos de suas variâncias. 0 0,1 0,2 0,3 0,4 0,5 1 2 3 4 5 6 7 P( Y) Y 5 𝑉𝑎𝑟(𝑋) = {(1 ⋅ 0,01) + (2 ⋅ 0,01) + (3 ⋅ 0,30) + (4 ⋅ 0,36) + (5 ⋅ 0,01) + (6 ⋅ 0,01) + (7 ⋅ 0,01)} − 4 = 0,86 𝑉𝑎𝑟(𝑌) = {(1 ⋅ 0,47) + (2 ⋅ 0,02) + (3 ⋅ 0,01) + (4 ⋅ 0,00) + (5 ⋅ 0,01) + (6 ⋅ 0,02) + (7 ⋅ 0,47)} − 4 = 8,64 Observe que Var(Y) é muito maior que Var(X) já que os valores de Y são bem mais dispersos em relação à média do que os valores de X. Também temos: D(X) = 0,93 e DP(Y) = 2,94. A variância é um conceito importante no Controle Estatístico da Qualidade, pois se define a qualidade de um produto como sendo inversamente proporcional à sua variabilidade. Define-se Melhoria da Qualidade como sendo a redução da variabilidade no processo produtivo. 3. ALGUNS MODELOS DE DISTRIBUIÇÕES DISCRETAS: BINOMIAL, HIPERGEOMÉTRICA E POISSON Apresentaremos a seguir alguns dos modelos probabilísticos discretos que costumam ser mais utilizados nas aplicações práticas da Estatística. 3.1 DISTRIBUIÇÃO BINOMIAL Num experimento aleatório é comum que estejamos interessados apenas na ocorrência de um resultado particular. Por exemplo: Na seleção de uma peça fabricada, queremos saber somente se ela satisfaz ou não às especificações; Numa transmissão digital, podemos estar interessados somente em saber se o bit transmitido tem erro ou não. Nesses dois casos, o experimento realizado admite somente dois resultados possíveis. Um experimento dessa natureza é chamado de Experimento ou Ensaio de Bernoulli cada um com dois resultados possíveis comumente chamados de sucesso ou fracasso (falha). DEFINIÇÃO 7: Seja X uma v.a. com distribuição de Bernoulli com probabilidade de sucesso p, em que X = 1 se o resultado é sucesso e X = 0 se o resultado é fracasso. Então a função de probabilidade de X fica definida por: 𝑃(𝑋 = 𝑥) = 𝑝 (1 − 𝑝)( ) em que x = 0, 1. Logo, a distribuição de probabilidade é dada por: x 0 1 P(X = x) 1 – p p As condições definidoras de uma função de distribuição de probabilidade são satisfeitas, uma vez que p > 0, (1 – p) > 0 e p + (1– p) = 1. O valor de p é o único valor que precisamos conhecer para determinar completamente a distribuição. Ele é, então, chamado parâmetro da distribuição de Bernoulli. DEFINIÇÃO 8: Um experimento aleatório, consistindo em n tentativas de Bernoulli tais que: a) As tentativas sejam independentes; b) Cada tentativa resulte em somente dois resultados possíveis, designados como sucesso e fracasso; c) A probabilidade de um sucesso em cada tentativa, denotado por p, permaneça constante em cada tentativa. A variável aleatória X definida como o número de tentativas que resultam em um sucesso, tem uma distribuição binomial com parâmetros p e k = 0, 1, 2, ...., n e sua função distribuição de probabilidade 6 é definida por: 𝑃(𝑋 = 𝑘) = 𝑛 𝑘 𝑝 (1 − 𝑝) , onde: 𝑛 𝑥 = ! !( )! : é igual ao número total de sequências diferentes de tentativas que contêm x sucessos e (n – x) fracassos; p = probabilidade de ocorrência do sucesso; (1 – p) = probabilidade de ocorrência do fracasso. Usamos a notação X b(n, p) para indicar que X segue o modelo Binomial com parâmetros n e p. Se X tem distribuição binomial de parâmetros n e p, então seu valor esperado e sua variância podem ser determinados por: a) Média ou Valor Esperado: 𝜇 = 𝐸(𝑋) = 𝑛 × 𝑝 (número esperado de sucessos que ocorrem em n tentativas). b) Variância: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝑛 × 𝑝 × (1 − 𝑝). A distribuição binomial é usada com frequência no controle de qualidade quando a amostragem é feita sobre uma população infinita ou muito grande. Nas aplicações de controle de qualidade, X em geral representa o número de defeituosos observados em uma amostra de n itens. Exemplo 4: Um produto eletrônico contém 40 circuitos integrados. A probabilidade de que qualquer circuito integrado seja defeituoso é de 0,01. Os circuitos integrados são independentes. O produto opera somente se não houver circuitos integrados defeituosos. Qual é a probabilidade de que o produto opere? Solução: Seja X = nº de circuitos integrados defeituosos e seja p = probabilidade de circuito defeituoso = 0,01. Logo 1 – p = 0,99. Para que o circuito opere X deve ser igual a zero. Logo, 𝑃(𝑋 = 0) = 40 0 0,01 (0,99) = 0,669. Exemplo 5: Bateladas, que consistem em 50 molas provenientes de um processo de produção, são verificadas com relação à conformidade aos requerimentos dos consumidores. O número médio de molas não conformes em uma batelada é igual a 5. Suponha que o número de molas não conformes em uma batelada, denotada como X, seja uma variável aleatória Binomial. a) Quais são os valores de n e p? b) Determine P(X ≤ 2)? Solução: X = nº de molas não conformes numa batelada. Como são 50 molas e a média é igual a 5 molas, sabendo que a média na Binomial é igual a 𝜇 = 𝐸(𝑋) = 𝑛𝑝 ∴ 5 = 50𝑝 ∴ 𝑝 = = 0,1. b) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 50 0 0, 1 (0,9) + 50 1 0, 1 (0,9) + 50 2 0, 1 (0,9) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 0,005 + 0,029 + 0,078 = 0,112 3.2 DISTRIBUIÇÃO HIPERGEOMÉTRICA A distribuição Hipergeométrica é adequada quando consideramos extrações casuais feitas sem reposição de uma população dividida segundo dois atributos. A figura 2 ilustra o experimento definidor da v.a. hipergeométrica: 7 Figura 2 – Experimento definidor da variável aleatória hipergeométrica Considere um conjunto de N elementos, r dos quais têm uma determinada característica (r ≤ N). Serão extraídos n elementos (n ≤ N) sem reposição. Considere ainda a v.a. X definida como o número de elementos com a referida característica que estarão entre os n retirados. Diz-se então que X tem distribuição hipergeométrica com parâmetros N, r e n. DEFINIÇÃO 9: Considere uma população com N elementos divididos em 2 classes, uma composta de r “sucessos” e a outra composta de N – r “fracassos”. Dessa população, vamos extrair, sem reposição, uma amostra aleatória de tamanho n. Seja X uma variável aleatória definida como o número de sucessos na amostra (saída do elemento com a característica). Então X é uma variável aleatória hipergeométrica com distribuição de probabilidade dada pela expressão: 𝑃(𝑋 = 𝑘) = , k = 0, 1, ..., n. Onde: 𝑁 𝑛 = número de amostras sem reposição; 𝑟 𝑘 = número de sucessos na amostra, e 𝑁 − 𝑟 𝑛 − 𝑘 = o número de fracassos na amostra. Essa é a distribuição Hipergeométrica com parâmetros N, r e n. Notação: X hiper (N, r, n). Se X tem distribuição Hipergeométrica, então seu valor esperado e sua variância podem ser determinados por: a) Média ou Valor Esperado: 𝜇 = 𝐸(𝑋) = 𝑛𝑝. b) Variância: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝑛𝑝(1 − 𝑝) ( ) ( ) , onde 𝑝 = . O termo é chamado fator de correção para populações finitas. Quando n é muito menor que N esse termo fica próximo de 1. Nesse caso a Hipergeométrica fica muito próxima da Binomial. Exemplo 6: Uma fábrica produz peças que são embaladas em caixas com 25 unidades. Para aceitar o lote enviado por essa fábrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco peças, sem reposição, dessa mesma caixa. Se constatar no máximo duas defeituosas, aceita o lote fornecida pela fábrica. Se a caixa sorteada tivesse 4 peças defeituosas, qual seria a probabilidade de rejeitar o lote? 8 Solução: A caixa pode ter peças boas ou defeituosas e vamos sortear algumas peças sem reposição. Considere X = número de peças defeituosas neste sorteio. O número total de peças N = 25, o número de defeituosas é r = 4 e o número de retiradas (amostra) é n = 5. Então, a probabilidade de rejeitar o lote será dada por: 𝑃(𝑋 > 2) = 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) = + = . +. = 0,016 Logo, para rejeitar o lote a probabilidade é de 0,016. Na prática, a menos que seja feita a inspeção em todos os itens, não saberemos quantas peças defeituosas existem em cada caixa. Entretanto, a probabilidade calculada poderia ser um indicativo se o critério do controle de qualidade está razoável ou não. Exemplo 7: Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a probabilidade de se escolher uma amostra com pelo menos uma lâmpada queimada? Solução: X = nº de lâmpadas queimadas N = 100; n = 15; r = 12 𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑃(𝑋 = 0) = 1 − = 1 − 0,125 = 0,875. Fazendo algumas comparações entre as distribuições Binomial e Hipergeométrica através do seguinte exemplo. Considere uma urna com r bolas verdes e (N – r) bolas brancas. Dessa urna extrai-se uma amostra de n bolas e estamos interessados na variável aleatória X = número de bolas verdes na amostra. Se as extrações são feitas com reposição, então X tem distribuição Binomial com parâmetros n e p. Se as extrações são feitas sem reposição, então X tem distribuição Hipergeométrica com parâmetros r, n e N. 3.3 DISTRIBUIÇÃO DE POISSON A distribuição de Poisson é adequada para descrever situações onde existe uma probabilidade de ocorrência em um campo ou intervalo contínuo, geralmente tempo ou área. Por exemplo, o nº de acidentes por mês, nº de defeitos por metro quadrado ou o nº de clientes atendidos por hora. Nota-se que a variável aleatória é discreta (número de ocorrência), no entanto a unidade de medida é contínua (tempo, área). Além disso, as falhas não são contáveis, pois não é possível contar o número de acidentes que não ocorreram nem tampouco o número de defeitos que não ocorreram. O número X de resultados que ocorrem durante um experimento de Poisson é chamado de variável aleatória de Poisson e sua distribuição de probabilidade é chamada de Distribuição de Poisson. Condições de aplicação: a) O número de ocorrências durante qualquer intervalo depende somente da extensão do intervalo; b) As ocorrências ocorrem independentemente, ou seja, um excesso ou falta de ocorrências em algum intervalo não exerce efeito sobre o número de ocorrências em outro intervalo; c) A possibilidade de duas ou mais ocorrências acontecerem em um pequeno intervalo é muito pequena quando comparada à de uma única ocorrência. A distribuição de Poisson fica completamente caracterizada por um único parâmetro (lambda) que representa a taxa média de ocorrências por unidade de medida. 9 DEFINIÇÃO 10: Dizemos que a variável aleatória X obedece a um modelo de Poisson com parâmetro ( >0) se sua função de probabilidade é definida por: 𝑃(𝑋 = 𝑘) = ! para K = 0,1,2,... Onde: e = base do logaritmo natural (e = 2,71828...). X = número de resultados que ocorrem em dada unidade de medida. (lê-se lambda): é um número médio de resultados que ocorrem num dado intervalo e é definido por:𝜆 = 𝑛 ⋅ 𝑝. Usamos a notação X Po() para indicar que X segue o modelo de Poisson. Se X tem distribuição de Poisson, então seu valor esperado e sua variância podem ser determinados por: E(X) = VAR (X) = 𝜆 = 𝑛 ⋅ 𝑝 . A aplicação típica da distribuição de Poisson no controle de qualidade é como um modelo para o número de defeitos (não conformidades) que ocorrem por unidade de produto (por m2, por volume ou por tempo). A distribuição de Poisson é uma forma limite da distribuição Binomial quando n e p 0. Exemplo 8: Em uma seção de uma rodovia, o número de buracos, que é bastante significante para requerer reparo, é suposto seguir uma distribuição de Poisson com uma média de dois buracos por milha. a) Qual a probabilidade de que não haja buracos que requeiram reparo em 5 milhas de rodovia? b) Qual é a probabilidade de que no mínimo um buraco requeira reparo em 0,5 milha de rodovia? Solução: X = nº de buracos/milha e = 2 buracos/por milha a) = 10 buracos/ 5 milhas 𝑃(𝑋 = 0) = ! = 0,000045 b) = 1 buraco/ 1/2 milhas 𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑃(𝑋 = 0) = 1 − 𝑒 1 𝑜! = 0,632 Exemplo 9: Supondo que as consultas num banco de dados ocorrem de forma independente e aleatória, com uma taxa média de três consultas por minuto, determinar a probabilidade de que: a) No próximo minuto ocorram pelo menos duas consultas. b) Nos próximos dois minutos ocorram mais de 2 consultas. Solução: a) = 3 consultas/por minuto 𝑃(𝑋 ≥ 2) = 1 − 𝑃(𝑋 < 2) = 1 − {𝑃(= 0) + 𝑃(𝑋 = 1)} = 1 − { 𝑒 3 0! + 𝑒 3 1! } = 1 − (0,05 + 0,149) = 0,801 b) = 6 consultas/por 2 minutos 𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − {𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)} = 1 − 𝑒 6 0! + 𝑒 6 1! + 𝑒 6 2! = 0,938 10 4. VARIÁVEIS ALEATÓRIAS CONTÍNUAS Ao contrário do que ocorre com as v.a. discretas, cujos valores podem ser obtidos por um processo de enumeração ou contagem, os valores de uma v.a. contínua são em geral oriundos de uma medição. DEFINIÇÃO 11: Uma variável aleatória X é dita contínua se ela assume todos os possíveis valores dentro de um intervalo (ou conjunto de intervalos) de números reais. Exemplo 10: Considere X a variável aleatória definida pelo tempo de espera, em horas, entre motoristas flagrados por um radar de velocidade. A variável aleatória aceita todos os valores x nos quais x 0. Na maioria dos problemas práticos, as variáveis aleatórias contínuas representam dados medidos, tais como todas as possíveis alturas, pesos, temperaturas, distâncias ou períodos de vida. Já as variáveis aleatórias discretas representam dados de contagem, tais como números de itens com defeitos em uma amostra com k itens ou o número de acidentes de trabalho por ano em uma unidade fabril. Os valores de uma variável aleatória contínua são definidos a partir do espaço amostral de um experimento aleatório. Sendo assim, é natural o interesse na probabilidade de obtenção de diferentes valores dessa variável. O comportamento probabilístico de uma variável aleatória contínua será descrito pela sua Função Densidade de Probabilidade. Apresentamos a definição da função densidade de probabilidade utilizando a noção de área. DEFINIÇÃO 12: Uma função f(x) é função densidade de probabilidade (f.d.p.) para a variável aleatória contínua X que satisfaz as seguintes condições: a) f(x) 0, para todo x ; b) A área total sob o gráfico de f(x) é igual a 1: ∫ 𝑓(𝑥)𝑑𝑥 = 1 ∞ ∞ ; c) Dada uma função f(x) satisfazendo as propriedades acima, então f(x) representa alguma variável aleatória contínua X, de modo que: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥. Figura 3 – Probabilidade como área. Uma primeira observação importante que resulta da interpretação geométrica de probabilidade como área sob a curva de densidade de probabilidade é a seguinte: se X é uma variável aleatória contínua, então a probabilidade do evento X = a é zero, ou seja, a probabilidade de X ser exatamente igual a um valor específico é nula. Isso pode ser visto na Figura 3, o evento {X = a} corresponde a um segmento de reta e tal segmento tem área nula. Como consequência, temos as seguintes igualdades: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 < 𝐵). 11 Exemplo 11: Suponha que o erro na medição da temperatura de reação (em °C), para um experimento controlado de laboratório, seja a variável aleatória contínua X, que tem a função definida por: f(x) = , −1 < 𝑥 < 2. 0, CC a) Verificar se f(x) é uma f.d.p; b) Determine P(0 < X ≤ 1). Solução: a) ∫ 𝑑𝑥 = 𝑥 | = + = 1 Logo, f(x) é uma f.d.p. b) 𝑃(0 < 𝑋 ≤ 1) = ∫ 𝑑𝑥 = 1 9. 4.1.1 ESPERANÇA, VARIÂNCIA E DESVIO PADRÃO DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS. DEFINIÇÃO 13: Seja X uma variável aleatória contínua com função densidade de probabilidade f(x). A esperança ou média(ou valor esperado) de X é definida como: 𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 ∞ ∞ . Exemplo 12: A demanda semanal por Pepsi, em milhares de litros, de uma rede de lojas de conveniência local é a variável aleatória contínua X, que tem como densidade de probabilidade a função: 𝑓(𝑋) = 2(𝑥 − 1), 1 < 𝑥 < 2, 0, CC . Determine a média da demanda. Solução: 𝑬(𝑿) = 𝟐 ∫ 𝒙(𝒙 − 𝟏)𝒅𝒙 𝟐 𝟏 = 𝟓 𝟑 = 𝟏, 𝟔𝟕. DEFINIÇÃO 14: Seja X uma variável aleatória contínua com função densidade de probabilidade f(x). A variância de X é definida como: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[𝑋 − 𝐸(𝑋)] = ∫ (𝑥 − 𝜇) 𝑓(𝑥)𝑑𝑥 ∞ ∞ . Usando as propriedades do cálculo integral e representando por μ a esperança de X (note que μ é uma constante, um número real), temos que: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[(𝑋 − 𝜇) ] = (𝑥 − 𝜇) 𝑝(𝑥) = (𝑥 − 2𝜇𝑥 + 𝜇 )𝑝(𝑥) = 𝑥 𝑝(𝑥) − 2𝜇 𝑥𝑝(𝑥) + 𝜇 𝑝(𝑥) 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[𝑋 ] − 2𝜇 + 𝜇 = 𝐸[𝑋 ] − 𝜇 Isto é, 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] , onde 𝐸(𝑋 ) = ∫ 𝑥 𝑓(𝑥)𝑑𝑥∞∞ . Para os dados do exemplo 12 vamos determinar a variância da demanda semanal de Pepsi calculando primeiro E(X2). Então: 𝐸(𝑋 ) = 2 ∫ 𝑥 (𝑥 − 1)𝑑𝑥 = . Assim, a variância é determinada por: 𝜎 = 𝑉𝑎𝑟(𝑋) = − = . A raiz quadrada positiva da variância é chamada de Desvio Padrão de X. As mesmas propriedades vistas para a esperança, variância e desvio padrão para variáveis aleatórias discretas continuam valendo no caso contínuo: 12 Exemplo 13: Seja 𝑓(𝑥) = 𝑘𝑥, 0 < 𝑥 ≤ 1 0, CC . Determinar: a) k a fim de que f(x) seja f.d.p.; b) 𝑃 0 ≤ 𝑥 ≤ ; c) E(X); d) Var(X). Solução: a) ∫ 𝑘𝑥𝑑𝑥 = 1 ∴ 𝑥 | = 1 ∴ 𝑘 = 2; b) 𝑃 0 ≤ 𝑥 ≤ = 𝑥 | = 1/4; c) 𝐸(𝑋) = ∫ 𝑥2𝑥𝑑𝑥 = 2 ∫ 𝑥 𝑑𝑥 = 𝑥 | = d) 𝑉𝑎𝑟(𝑋) = ∫ 𝑥 2𝑥𝑑𝑥 − = 𝑥 | − = − = 5. DISTRIBUIÇÕES CONTÍNUAS: UNIFORME, EXPONENCIAL E NORMAL 5.1 DISTRIBUIÇÃO UNIFORME CONTÍNUA Segundo Walpole et all (2009), a distribuição Uniforme Contínua é uma das mais simples distribuições contínuas de toda a estatística. Essa distribuição é caracterizada por uma função de densidade que é “plana” e, portanto, a probabilidade é uniforme em um intervalo fechado [a, b]. DEFINIÇÃO 15: A função de densidade da variável aleatória contínua uniforme X no intervalo [a, b] é definida por: 𝑓(𝑥) = 1 𝑏 − 𝑎 , 𝑎 ≤ 𝑥 ≤ 𝑏; 0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 Usamos a notação X U[a, b] para indicar que X segue o modelo Uniforme Contínuo no intervalo considerado. Enfatizamos que a função de densidade forma um retângulo de base b – a e altura constante de ab 1 . A distribuição Uniforme é frequentemente chamada de distribuição retangular. Figura 4 – A função f(x) Uniforme como uma função distribuição de probabilidade 13 Se X tem distribuição Uniforme Contínua, então seu valor esperado e sua variância podem ser determinados por: a) Esperança ou Média: Das propriedades da esperança e das características da densidade uniforme, sabemos que E(X) é o ponto médio do intervalo [a,b], ou seja, 𝐸(𝑋) = 𝑎 + 𝑏 − 𝑎 2 = 𝑎 + 𝑏 2 Usando a integral: 𝐸(𝑋) = 𝑥 1 𝑏 − 𝑎 𝑑𝑥 = 1 𝑏 − 𝑎 𝑥 2 = 𝑏 − 𝑎 2(𝑏 − 𝑎) = (𝑏 − 𝑎)(𝑎 + 𝑏) 2(𝑏 − 𝑎) = 𝑎 + 𝑏 2 b) Variância: Por definição, 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] . Vamos então calcular 𝐸(𝑋 ): 𝐸(𝑋 ) = 𝑥 1 𝑏 − 𝑎 𝑑𝑥 = 1 𝑏 − 𝑎 𝑥 3 = 𝑏 − 𝑎 3(𝑏 − 𝑎) = (𝑏 − 𝑎)(𝑏 + 𝑎𝑏 + 𝑎 ) 3(𝑏 − 𝑎) Logo, 𝑉𝑎𝑟(𝑋) = (𝑏 + 𝑎𝑏 + 𝑎 ) 3 − 𝑎 + 𝑏 2 = (𝑏 + 𝑎𝑏 + 𝑎 ) 3 − 𝑎 + 2𝑎𝑏 + 𝑏 4 𝑉𝑎𝑟(𝑋) = 4𝑏 + 4𝑎𝑏 + 4𝑎 − 3𝑎 − 6𝑎𝑏 − 3𝑏 12 = 𝑎 − 2𝑎𝑏 + 𝑏 12 = (𝑏 − 𝑎) 12 Exemplo 14: O rótulo de uma lata de refrigerante indica que o conteúdo é de 350 ml. Suponha que a linha de produção encha as latas de forma que o conteúdo seja uniformemente distribuído no intervalo [345;355]. a) Qual é a probabilidade de que uma lata tenha conteúdo superior a 353 ml? b) Qual é a probabilidade de que uma lata tenha conteúdo inferior a 346 ml? Solução: a) 𝑃(𝑋 > 353) = ∫ 𝑑𝑥 = 𝑥 | = = 0,2 b) 𝑃(𝑋 < 346) = ∫ 𝑑𝑥 = 𝑥 | = = 0,1 Exemplo 15: A espessura de chapas fabricadas numa indústria está uniformemente distribuída entre 0,84 cm e 1,04 cm. a) De um total de 200 chapas inspecionadas, quantas excedem 1,00 cm? b) Qual deve ser a espessura de modo que 40% das chapas não excedam essa espessura? Solução: a) 𝑃(𝑋 > 1) = ∫ , 𝑑𝑥 = , 𝑥 | , = , , = 0,2 , . De um total de 200 chapas, 40 excedem 1 cm. b) 𝑃(𝑋 < 𝑥) = ∫ , 𝑑𝑥 = 0,4 , ∴ , 𝑥 | , = 0,4 ∴ , , = 0,4 ∴ 𝑥 − 0,84 = 0,08 ∴ 𝑥 = 0,92𝑐𝑚 5.2 DISTRIBUIÇÃO EXPONENCIAL O modelo exponencial tem forte relação com modelo discreto de Poisson. Enquanto a distribuição de Poisson pode ser usada para modelar o número de ocorrências em um período contínuo (de tempo ou de comprimento), a distribuição exponencial pode modelar a variável aleatória contínua que representa o intervalo (de tempo ou de comprimento) entre as ocorrências. Exemplos: 14 a) Tempo (em minutos) até a próxima consulta a uma base de dados; b) Tempo (em segundos) entre pedidos a um servidor; c) Distância (em metros) entre defeitos de uma bobina de papel. Ou seja, na distribuição de Poisson temos a estimativa da quantidade de eventos num intervalo (distribuição de dados discreta). Exemplo: Um fio de cobre apresenta uma taxa de 2 falhas por metro. Qual a probabilidade de apresentar em um metro, 4 falhas? A distribuição Exponencial está ligada à de Poisson. Ela analisa inversamente o experimento, um intervalo ou espaço para ocorrência de um evento. No exemplo do fio, qual a probabilidade de ocorrer uma falha em 0,5 metros, se ele possui uma taxa de 2 falhas por metro? A condição de aplicação da distribuição Exponencial é que o número de ocorrências deve seguir uma distribuição de Poisson. No exemplo, a probabilidade relacionada ao comprimento do fio depende apenas da suposição das falhas no fio seguirem o processo de Poisson. DEFINIÇÃO 16: Uma variável aleatória X tem uma Distribuição Exponencial com parâmetro > 0, onde é definida como taxa média, denotada por X ~ exp () se sua função densidade de probabilidade de X é dada por: 𝑓(𝑥) = 𝜆𝑒 , se x ≥ 0 0 , se x < 0 A figura 5 representa a função densidade de probabilidade da distribuição exponencial para parâmetros de igual a 0,5, 1 e 2. Figura 5 – Distribuição exponencial para = 0,5, = 1 e = 2. Note que a distribuição exponencial é assimétrica positiva (à direita), observando uma maior frequência para valores menores de x e uma cauda mais longa à direita. A função de densidade assume valor quando x = 0, e tende a zero à medida que x ; quanto maior o valor de , mais rapidamente a função tende a zero. Para calcular probabilidades com a exponencial, teremos: 𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝜆𝑒 𝑑𝑥 = −𝑒 | = 𝑒 − 𝑒 . Note que a inclusão dos extremos a e b não altera o cálculo efetuado. A média ou esperança de uma v.a. exponencial com 𝑓(𝑥) = 𝜆𝑒 é definida por: 𝜇 = 𝐸(𝑋) = 𝑥𝑓(𝑥)𝑑𝑥 = 𝑥𝜆𝑒 𝑑𝑥 ∞∞ 15 Definindo: 𝑢 = 𝑥 ⇒ 𝑑𝑢 = 𝑑𝑥 𝑑𝑣 = 𝜆𝑒 𝑑𝑥 ⇒ 𝑣 = 𝜆 ∫ 𝑒 𝑑𝑥 ⇒ 𝑣 = −𝑒 O método de integração por partes nos dá que: −𝑥𝑒 |∞ = ∫ 𝑥𝜆𝑒 𝑑𝑥 + ∫ −𝑒 𝑑𝑥 ∞∞ (I) Lembrando que lim → 𝑥 𝑒 = 0, o lado esquerdo de (I) é igual a zero. Logo, 0 = 𝐸(𝑋) + 𝑒 |∞ ⇒ 0 = 𝐸(𝑋) + 0 − . Ou seja, 𝜇 = 𝐸(𝑋) = . A variância de uma v.a. exponencial é dada por: 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] onde: 𝐸(𝑋 ) = 𝑥 𝑓(𝑥)𝑑𝑥 = ∞ 𝑥 𝜆𝑒 𝑑𝑥 ∞ Seguindo raciocínio análogo ao empregado no cálculo da esperança, vamos definir: 𝑢 = 𝑥 ⇒ 𝑑𝑢 = 2𝑥𝑑𝑥; 𝑑𝑣 = 𝜆𝑒 𝑑𝑥 ⇒ 𝑣 = −𝑒 Logo, −𝑥 𝑒 |∞ = ∫ 𝑥 𝜆𝑒 𝑑𝑥 + ∫ −2𝑥𝑒 𝑑𝑥 ⇒ 0 = 𝐸(𝑋 ) − 2 ∫ 𝑥𝑒 𝑑𝑥 ⇒ 𝐸(𝑋 ) = ∞∞ E, portanto: 𝑉𝑎𝑟(𝑋) = − = . Portanto, a média e a variânciadesta distribuição são: 𝐸(𝑋) = 𝜇 = e 𝑉𝑎𝑟(𝑋) = 𝜎 = . A distribuição Exponencial é amplamente utilizada na área da engenharia de confiabilidade como modelo para o tempo até a falha de um componente ou sistema. Em tais aplicações o parâmetro é denominado taxa de falha do sistema e a média da distribuição 1 é chamada tempo médio de falha. Exemplo 16: Os tempos até a falha de um dispositivo eletrônico seguem o modelo exponencial com uma taxa de falha = 0,012 falhas/hora. Indique qual a probabilidade de um dispositivo escolhido ao acaso sobreviver: a) Mais de 100 horas; b) Mais de 50 horas; Solução: = 0,012 falha/hora a) 𝑃(𝑇 > 100) = 1 − 𝑃(𝑇 ≤ 100) = 1 − ∫ 0,012𝑒 , 𝑑𝑥 = 1 − {𝑒 ( , ⋅ ) − 𝑒 ( , ⋅ )} = 0,3012 b) 𝑃(𝑇 > 50) = 1 − 𝑃(𝑇 ≤ 50) = 1 − ∫ 0,012𝑒 , = 1 − {𝑒 ( , ⋅ ) − 𝑒 ( , ⋅ )} = 0,5488 Exemplo 17: Uma ferramenta produzida por uma indústria apresenta uma vida média de 80 horas. Considerando o comportamento segundo a distribuição exponencial, qual a probabilidade de essa ferramenta durar mais de 100 horas? Solução: 𝑬(𝑿) = 𝟏 𝝀 ∴ 𝟖𝟎 = 𝟏 𝝀 ∴ 𝝀 = 𝟏 𝟖𝟎 Então: 𝑃(𝑇 > 100) = 1 − 𝑃(𝑋 ≤ 100) = 1 − 1 80 𝑒 = 1 − {𝑒 ( ⋅ ) − 𝑒 ( ⋅ )} = 0,2865 16 5.3 DISTRIBUIÇÃO NORMAL DE PROBABILIDADE. A distribuição normal é a mais importante das distribuições contínuas, pois muitas variáveis aleatórias de ocorrência natural ou de processos práticos obedecem a esta distribuição. Em 1733 Abraham De Moivre desenvolveu a equação matemática da curva Normal que serviu de base para boa parte da teoria da estatística inferencial. Frequentemente, se refere à distribuição Normal como distribuição gaussiana em homenagem a Karl Friedrich Gauss (1777 – 1855), que também derivou sua equação a partir de um estudo dos erros em medições repetidas da mesma quantidade. DEFINIÇÃO 17: Uma variável aleatória contínua X tem Distribuição Normal de probabilidade se a sua função densidade de probabilidade é dada por: 𝑓(𝑥) = √ 𝑒 , para -∞ < x < +∞ onde: = constante 3,14159... e = a base do logaritmo natural 2,71828... = média aritmética da população = desvio padrão da população Se uma variável aleatória x tem distribuição normal com média 𝜇 e variância 𝜎 , diz-se que: X ~ N(𝜇, 2 ) A figura 6 a seguir mostra uma curva normal típica, com seus parâmetros descritos graficamente. Figura 6 – Distribuição Normal As principais características dessa função são: a) O ponto de máximo de f(x) é o ponto X = µ. b) Os pontos de inflexão da função são: X = µ + e X = µ - . c) A curva é simétrica em relação a µ. d) E(X) = µ e VAR(X) = 2. e) A área total abaixo da curva e acima do eixo horizontal é igual a 1. A curva normal tem forma de sino, ou seja, é unimodal, e o seu valor de máxima frequência (moda) coincide com o valor da média e da mediana. A média é o centro da curva e a distribuição de valores maiores que a média e a dos valores menores que a média é perfeitamente simétrica, ou seja, se passarmos uma linha exatamente pelo centro da curva teremos duas metades, sendo que cada uma delas é a imagem especular da outra. As extremidades da curva se estendem de forma indefinida ao longo de sua base (o eixo das abcissas) sem jamais tocá-la. Portanto, o campo de variação da distribuição normal se estende de menos infinito a mais infinito. A curva normal é uma distribuição que possibilita determinar probabilidades associadas a todos 17 os pontos da linha de base, ou seja, é uma distribuição de frequências, sendo a frequência total sob a curva igual a 100%. Assim sendo, a curva apresenta uma área central em torno da média, onde se localizam os pontos de maior frequência e também possui áreas menores, progressivamente mais próximas de ambas as extremidades, em que são encontrados valores muito baixos de x (à esquerda) ou escores muito altos (à direita), ambos presentes em baixas frequências. No cálculo de probabilidades para variáveis aleatórias contínuas, devemos resolver a integral da função densidade de probabilidade no intervalo de interesse, isto é: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 1 𝜎√2𝜋 𝑒 𝑑𝑥 Entretanto, como a função acima não possui antiderivada, a integral acima somente pode ser resolvida de modo aproximado e por métodos numéricos. Por essa razão as probabilidades para o modelo Normal são calculadas com o auxílio de tabelas. Para se evitar a multiplicação desnecessária de tabelas para cada par de valores da média e da variância, utiliza-se uma transformação que leva sempre ao cálculo de probabilidades com uma variável de parâmetros µ = 0 e = 1. 5.3.1 DISTRIBUIÇÃO NORMAL PADRÃO Todas as curvas normais representativas de distribuições de frequências podem ser transformadas em uma curva normal padrão, usando o desvio padrão ( ) como unidade de medida indicativa dos desvios dos valores da variável em estudo ( X ) em relação à média ( ). Se a variável X tem distribuição normal, pode-se definir a distribuição de uma nova variável, denominada Normal Padrão (z), definida por: 𝑍 = , onde: Z = nº de desvios padrões a contar da média; X = valor arbitrário da variável; µ = média da distribuição normal; = desvio padrão da distribuição normal. Figura 7 – Transformação de distribuição normal para normal padrão A Distribuição Normal Padrão é caracterizada pela média ( ) igual a zero e desvio padrão ( ) igual a 1: E(Z) = E = 1 E(X - µ) = 1 {E(X) - µ)} = 0 18 VAR(Z) = VAR = 2 1 VAR(X - µ) = 2 1 VAR(X) = 1 É importante lembrar que a área sob a curva pode ser entendida como uma medida de sua probabilidade e que a área sob a curva normal é igual a 1. Então, se forem tomados dois valores específicos, pode-se determinar a proporção de área sob a curva entre esses dois valores. Exemplo 18: Seja X uma v.a. que se comporta segundo uma distribuição Normal de probabilidade com média igual a 100 e desvio padrão igual a 5. Calcular as seguintes probabilidades: a) P (100 ≤ X ≤ 106) b) P (89 ≤ X ≤ 107) c) P (X ≥ 108) Solução: a) 𝑃(100 ≤ 𝑋 ≤ 106) = 𝑃 ≤ 𝑍 ≤ = 𝑃(0 ≤ 𝑍 ≤ 1,2) = 0,5 − 0,1151 = 0,3849 b) 𝑃(89 ≤ 𝑋 ≤ 107) = 𝑃 ≤ 𝑍 ≤ = 𝑃(−2,2 ≤ 𝑍 ≤ 1,4) = 0,4861 + 0,4192 = 0,9053 c) 𝑃(𝑋 ≥ 108) = 𝑃 𝑍 ≥ = 𝑃(𝑍 ≥ 1,6) = 0,0548 Exemplo 19: A profundidade de poços artesianos em um determinado local é uma variável aleatória com distribuição normal de probabilidade com média de 20 m e desvio padrão de 1,7m. Se X é a profundidade de determinado poço, determinar: a) P(X < 15). b) P(18 ≤ X ≤ 23) c) P(X > 25) Solução: a) 𝑃(𝑋 < 15) = 𝑃 𝑍 < , = 𝑃(𝑍 < −2,94) = 0,0016 b) 𝑃(18 ≤ 𝑋 ≤ 23) = 𝑃 , ≤ 𝑍 ≤ , = 𝑃(−1,18 ≤ 𝑍 ≤ 1,76) = 0,381 + 0,4608 = 0,8418 c) 𝑃(𝑋 > 25) = 𝑃 𝑍 > , = 𝑃(𝑍 > 2,94) = 0,0016. 5.4 A DISTRIBUIÇÃO NORMAL COMO LIMITE DE OUTRAS DISTRIBUIÇÕES Muitas distribuições de probabilidade aproximam-se da distribuição Normal. É o caso da Binomial quando n é grande e da Poisson quando é grande. a) Aproximação Normal à Binomial Nos experimentos binomiais, quando n é muito grande, o uso da função de probabilidade binomial é impraticável, pois os coeficientes binomiais tornam-se exageradamente grandes. Quando n (tamanho da amostra) é grande e p (probabilidade do sucesso) não é próximo de 0 ou de 1, a distribuição Normal pode ser usada para calcular, aproximadamente, as probabilidades de uma binomial. A figura 8 mostra os histogramas para a distribuição binomial variando-se o número de ensaios n e a probabilidade de sucesso (p). 19 Figura 8 – Distribuições binomiais para diferentes valores de n e p. Observando a figura 8, verificamos que quando p = 0,5, a medida que a amostra cresce de 10 para 50, mais a forma da distribuição binomial é parecida com a curvada distribuição normal. Uma regra prática, sugerida por vários autores, considera a aproximação razoável se as duas seguintes inequações estiverem satisfeitas: 𝑛𝑝 ≥ 5 e 𝑛(1 − 𝑝) ≥ 5. Os parâmetros média () e desvio padrão () da distribuição normal devem se identificar ao valor esperado e ao desvio padrão do modelo binomial, ou seja: 𝜇 = 𝑛𝑝 e 𝜎 = 𝑛𝑝(1 − 𝑝). Logo, a variável Normal padrão fica definida por: 𝑍 = ( ) . Exemplo 20: Historicamente, 10% dos pisos cerâmicos, que saem de uma linha de produção, têm algum defeito leve. Se a produção diária é de 1000 unidades, qual é a probabilidade de ocorrer mais de 120 itens defeituosos? Solução: Considere a variável Y = número de defeituosos na amostra com distribuição binomial com parâmetros n =1000 e 1,0p . Verificando as condições 𝑛𝑝 = 1000 ⋅ 0,1 = 100 e 𝑛(1 − 𝑝) = 1000 ⋅ 0,9 = 900 como as duas são maiores que 5, podemos usar a aproximação para a distribuição normal onde 𝜇 = 𝑛𝑝 = 1000 ⋅ 0,1 = 100 e 𝜎 = 𝑛𝑝(1 − 𝑝) = √1000 ⋅ 0,1 ⋅ 0,9 = 9,49. Usando a aproximação para distribuição normal, temos: 𝑃(> 120) = 𝑃 𝑍 > , = 𝑃(𝑍 > 2,11) = 0,0174. b) Aproximação Normal à Poisson Seja X uma v.a. com distribuição de Poisson com média 𝐸(𝑋) = 𝜆 e variância 𝑉𝑎𝑟(𝑋) = 𝜆, então: 𝑍 = √ é aproximadamente uma variável aleatória normal padrão. A aproximação é boa para > 5. A figura 9 mostra o comportamento da distribuição de Poisson para diferentes valores de : 20 Figura 9 – Aproximação da distribuição de Poisson pela distribuição Normal. BIBLIOGRAFIA DO TEXTO MAGALHÃES, M.N.; LIMA, A.C.P. Noções de probabilidade e estatística. Edusp, 2002. MORETTIN, L. G. Estatística Básica: Probabilidade e Inferência – volume único. Editora Pearson Makron Books, São Paulo, 2009. WALPOLE, R., MEYERS, R., MYERS, S., Ye, K.. Probabilidade e estatística para engenharia e ciências. São Paulo: Pearson Prentice Hall, 2009.