Probabilidade e Estatística Variáveis aleatórias

Probabilidade e Estatística

lais almeida

09/07/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
DISCIPLINA: PROBABILIDADE E ESTATÍSTICA 2020/2 
PROFª ROSEANI PARENTE 
 
1. VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE 
Vimos anteriormente que uma tabela de frequências pode ser utilizada para apresentar os 
valores possíveis de uma dada variável associada as suas respectivas frequências. De forma análoga 
vamos, com a ajuda da Teoria das Probabilidades, formalizar o comportamento de variáveis na população 
associando a cada possível valor sua probabilidade de ocorrência. 
 
DEFINIÇÃO 1: Uma variável aleatória é uma função real (isto é, que assume valores em  ) definida no 
espaço amostral  de um experimento aleatório. Ou seja, uma variável aleatória é uma função que 
confere um número real a cada resultado no espaço amostral () de um experimento aleatório. 
Alguns exemplos de variáveis aleatórias: 
a) Número de coroas obtido no lançamento de duas moedas. 
b) Nº de itens defeituosos em uma amostra retirada aleatoriamente de um lote. 
c) Tempo que um operário gasta para executar determinada tarefa. 
d) Custo do sinistro de um carro; 
e) A temperatura mínima diária; 
f) A intensidade de uma corrente elétrica. 
Por questões de simplicidade, muitas vezes abreviaremos a expressão variável aleatória por v.a. 
A convenção usual para representar uma v.a. consiste em usar letras maiúsculas como X, Y , etc. Um valor 
específico, mas genérico, desta variável será representado pela letra minúscula correspondente: x; y; etc. 
 
2. VARIÁVEIS ALEATÓRIAS DISCRETAS 
 
DEFINIÇÃO 2: Uma variável aleatória é discreta se sua imagem (conjunto de valores que ela pode assumir) 
é um conjunto enumerável de valores. 
 
Exemplo 1: Duas bolas são retiradas, sem reposição, de uma urna que contém quatro bolas vermelhas (V) 
e três pretas (P), sem reposição. Os resultados possíveis e os valores da variável aleatória X = número de 
bolas vermelhas são: 
Eventos X 
P e P 0 
(V e P) ou (P e V) 1 
V e V 2 
 
DEFINIÇÃO 3: Seja X uma variável aleatória discreta. A função que atribui a cada valor assumido pela 
variável aleatória sua probabilidade de ocorrência é denominada de Função de Distribuição de 
Probabilidade (ou simplesmente Distribuição de Probabilidade) de X. 
A notação utilizada é: p(xi) = P(X = xi) para i = 1, 2, ..., n. 
A função de probabilidade deve satisfazer as seguintes condições: 
a) p(xi)  0; 
b) ∑ 𝑝(𝑥 ) = 1. 
 
Uma variável aleatória discreta assume cada um de seus valores com certa probabilidade. 
Tomando os dados do exemplo 1 temos: 
 
 2 
 
Eventos X P(X = xi) 
P e P 0 
3
7
×
2
6
=
1
7
= 0,14 
(V e P) ou 
(P e V) 
1 
4
7
×
3
6
+
3
7
×
4
6
=
4
7
= 0,57 
V e V 2 
4
7
×
3
6
=
2
7
= 0,29 
Total 1 
 
Observe que, como os valores de X abrangem todos os casos possíveis, a soma das 
probabilidades é igual a 1. O conjunto de pares ordenados (x, P(x)) é chamado de função de probabilidade 
ou distribuição de probabilidade da variável aleatória discreta X. 
 
Exemplo 2: Lançam-se 3 moedas. Considere Y: o número de ocorrências da face cara. Determinar a 
distribuição de probabilidade de Y. 
Os valores que Y podem assumir são 0, 1, 2 e 3 e sua distribuição de probabilidades é: 
Y 0 1 2 3 Total 
 P(Y=yi) 1/8 3/8 3/8 1/8 1 
 
2.1 ESPERANÇA (MÉDIA) E VARIÂNCIA DE VARIÁVEIS ALEATÓRIAS DISCRETAS 
Além das funções de probabilidade existem quantidades que permitem caracterizar 
adicionalmente a distribuição de uma variável aleatória discreta. 
A média ou valor esperado de uma variável aleatória discreta X é uma medida de 
centralidade. Ela também é denominada de Esperança e por isso sua notação é E(X). 
 
DEFINIÇÃO 4: Seja X uma variável aleatória discreta que assume valores {x1, x2, x3, ..., xn} com 
probabilidades p(x1),p( x2), p(x3),..., p(xn) respectivamente, então sua média ou esperança é definida 
como: 
 𝝁 = 𝑬(𝑿) = ∑ 𝒙𝒊𝒑(𝒙𝒊) = ∑ 𝒙𝒊𝑷(𝑿 = 𝒙𝒊)𝒊𝒊 . 
 
 Podemos ver, então, que a esperança de X é uma média dos seus valores ponderada pelas 
respectivas probabilidades. 
Tomando os dados do exemplo 2, pode-se perguntar qual o “número médio de ocorrências 
de face cara” no lançamento de 3 moedas. Aplicando a definição 4, teremos: 
𝐸(𝑌) = 0 ⋅ + 1 ⋅ + 2 ⋅ + 3 ⋅ = 3/2 = 1,5 faces cara, em média, no 
lançamento de 3 moedas. 
 
PROPRIEDADES DA ESPERANÇA: Seja X uma variável aleatória discreta com função de probabilidade f(x) 
e a, b  0 são constantes reais quaisquer, temos as seguintes propriedades: 
a) E(a) = a; 
b) E(X + a) = E(X) + a =  + a; 
c) E(bX) = b E(X) = b ; 
d) Xmin ≤ E(X) ≤ Xmáx, onde Xmin e Xmáx são os valores de mínimo e de máximo da variável X. 
 
O simples conhecimento da média de uma v.a. X, em geral, não é suficiente para termos uma 
ideia clara da distribuição de X. Para quantificar o grau de dispersão dos valores de X precisamos das 
medidas de dispersão. 
 3 
A dispersão de uma variável aleatória X será, inicialmente, medida pela sua variância. 
 
DEFINIÇÃO 5: A variância de uma variável aleatória X é definida como: 𝝈𝟐 = 𝑽𝒂𝒓(𝑿) = 𝑬[𝑿 − 𝑬(𝑿)]𝟐. 
O termo X – E(X) é o desvio em torno da média. Sendo assim, a variância é a média dos desvios 
quadráticos em torno da média E(X). 
Desenvolvendo o quadrado e usando as propriedades do somatório e da esperança, podemos 
escrever a variância como: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] , onde 𝐸(𝑋 ) = ∑ 𝑥 𝑝(𝑥 ). 
Da definição de variância, resulta que sua unidade de medida é o quadrado da unidade de 
medida da variável em estudo, sendo assim, uma unidade sem significado físico. Para termos uma medida 
de dispersão na mesma unidade dos dados define-se o desvio-padrão como a raiz quadrada da variância. 
 
DEFINIÇÃO 6: O desvio padrão de uma variável aleatória X é definido como a raiz quadrada positiva de 
sua variância: 
𝜎 = 𝐷𝑃(𝑋) = 𝑉𝑎𝑟(𝑋) 
 
Aplicando a definição aos dados do exemplo 2, teremos: 
 
E(Y2) = ∑ 𝑦 𝑝(𝑦 ) = 0 ⋅ + 1 ⋅ + 2 ⋅ + 3 ⋅ = 3 (faces cara)2. 
 𝑉𝑎𝑟(𝑌) = 𝐸(𝑌 ) − [𝐸(𝑌)] = 3 − (1,5) = 0,75 (faces cara)2. 
 𝐷𝑃(𝑌) = 0,75 = 0,87 faces cara. 
 
PROPRIEDADES DA VARIÂNCIA E DO DESVIO PADRÃO: Seja X uma variável aleatória discreta com função 
de probabilidade f(x) e a, b  0 são constantes reais quaisquer, temos as seguintes propriedades: 
a) Var(X)  0 e DP(X)  0; 
b) Var(a) = 0 e DP(a) = 0; 
c) Var (X + a) = VAR(X) e DP(X + a) = DP(X); 
d) Var (bX) = b2 Var(X) e DP(bX) = |b|DP(X). 
 
Exemplo 3: O tempo T, em minutos, necessário para um operário processar certa peça é uma v.a. com a 
seguinte distribuição de probabilidade: 
t 2 3 4 5 6 7 
P(t) 0,1 0,1 0,3 0,2 0,2 0,1 
a) Calcule o tempo médio de processamento. 
b) Calcule a variância e o desvio padrão. 
Solução: 
a) 
𝜇 = 𝐸(𝑇) = 𝑡 𝑝(𝑡 ) = (2 × 0,1) + (3 × 0,1) + ⋯ + (7 × 0,1) 
𝜇 = 𝐸(𝑇) = 4,6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 
 
b) A variância: 𝜎 = 𝑉𝑎𝑟(𝑇) = 𝐸(𝑇 ) − [𝐸(𝑇)] 
Sabemos que 𝜇 = 𝐸(𝑇) = 4,6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠. 
𝐸(𝑇 ) = 𝑡 𝑝(𝑡 ) = (2 × 0,1) + (3 × 0,1) + ⋯ + (7 × 0,1) 
𝐸(𝑇 ) = 23,2 
 4 
Determinando a variância: 
 𝜎 = 𝑉𝑎𝑟(𝑇) = 23,2 − 4,6 = 2,04 (𝑚𝑖𝑛𝑢𝑡𝑜𝑠) 
E o desvio padrão: 𝜎 = 𝐷𝑃(𝑇) = √2,04 = 1,4 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 
O coeficiente de variação: 𝐶𝑉(𝑇) = ,
,
× 100 = 30,4% 
 
Exemplo 4: Considere as variáveis aleatórias X e Y com suas correspondentes funções de probabilidade: 
Xi 1 2 3 4 5 6 7 
P(Xi) 0,01 0,01 0,30 0,36 0,30 0,01 0,01 
 
Yi 1 2 3 4 5 6 7 
P(Yi) 0,47 0,02 0,01 0,00 0,01 0,02 0,47 
 
Solução: Calculando as esperanças das duas, teremos: 
𝐸(𝑋) = (1 ⋅ 0,01) + (2 ⋅ 0,01) + (3 ⋅ 0,30) + (4 ⋅ 0,36) + (5 ⋅ 0,01) + (6 ⋅ 0,01) + (7 ⋅ 0,01) = 4 
𝐸(𝑌) = (1 ⋅ 0,47) + (2 ⋅ 0,02) + (3 ⋅ 0,01) + (4 ⋅ 0,00) + (5 ⋅ 0,01) + (6 ⋅ 0,02) + (7 ⋅ 0,47) = 4 
 
 
Figura 1 – Distribuições de probabilidade de X e de Y. 
 
As médias são iguais, mas podemos verificar que X e Y têm distribuições bem diferentes. A 
variável X tem os valores centrais 3, 4 e 5 como mais prováveis, com probabilidades muito pequenas para 
os demaisvalores. Enquanto que a variável Y, tem os valores extremos 1 e 7 como os mais prováveis. 
 Vejamos como essa diferença se expressa nos termos de suas variâncias. 
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4 5 6 7
P(
Y)
Y
 5 
𝑉𝑎𝑟(𝑋) = {(1 ⋅ 0,01) + (2 ⋅ 0,01) + (3 ⋅ 0,30) + (4 ⋅ 0,36) + (5 ⋅ 0,01) + (6 ⋅ 0,01)
+ (7 ⋅ 0,01)} − 4 = 0,86 
𝑉𝑎𝑟(𝑌) = {(1 ⋅ 0,47) + (2 ⋅ 0,02) + (3 ⋅ 0,01) + (4 ⋅ 0,00) + (5 ⋅ 0,01) + (6 ⋅ 0,02)
+ (7 ⋅ 0,47)} − 4 = 8,64 
 
Observe que Var(Y) é muito maior que Var(X) já que os valores de Y são bem mais dispersos em relação à 
média do que os valores de X. 
 Também temos: D(X) = 0,93 e DP(Y) = 2,94. 
 A variância é um conceito importante no Controle Estatístico da Qualidade, pois se define a 
qualidade de um produto como sendo inversamente proporcional à sua variabilidade. Define-se Melhoria 
da Qualidade como sendo a redução da variabilidade no processo produtivo. 
 
3. ALGUNS MODELOS DE DISTRIBUIÇÕES DISCRETAS: BINOMIAL, HIPERGEOMÉTRICA E POISSON 
Apresentaremos a seguir alguns dos modelos probabilísticos discretos que costumam ser mais 
utilizados nas aplicações práticas da Estatística. 
 
3.1 DISTRIBUIÇÃO BINOMIAL 
Num experimento aleatório é comum que estejamos interessados apenas na ocorrência de um 
resultado particular. Por exemplo: 
 Na seleção de uma peça fabricada, queremos saber somente se ela satisfaz ou não às 
especificações; 
 Numa transmissão digital, podemos estar interessados somente em saber se o bit transmitido 
tem erro ou não. 
Nesses dois casos, o experimento realizado admite somente dois resultados possíveis. 
Um experimento dessa natureza é chamado de Experimento ou Ensaio de Bernoulli cada um com 
dois resultados possíveis comumente chamados de sucesso ou fracasso (falha). 
 
DEFINIÇÃO 7: Seja X uma v.a. com distribuição de Bernoulli com probabilidade de sucesso p, em que X = 
1 se o resultado é sucesso e X = 0 se o resultado é fracasso. Então a função de probabilidade de X fica 
definida por: 
𝑃(𝑋 = 𝑥) = 𝑝 (1 − 𝑝)( ) em que x = 0, 1. 
 
Logo, a distribuição de probabilidade é dada por: 
x 0 1 
P(X = x) 1 – p p 
 
As condições definidoras de uma função de distribuição de probabilidade são satisfeitas, uma 
vez que p > 0, (1 – p) > 0 e p + (1– p) = 1. 
O valor de p é o único valor que precisamos conhecer para determinar completamente a 
distribuição. Ele é, então, chamado parâmetro da distribuição de Bernoulli. 
 
DEFINIÇÃO 8: Um experimento aleatório, consistindo em n tentativas de Bernoulli tais que: 
a) As tentativas sejam independentes; 
b) Cada tentativa resulte em somente dois resultados possíveis, designados como sucesso e 
fracasso; 
c) A probabilidade de um sucesso em cada tentativa, denotado por p, permaneça constante em 
cada tentativa. 
A variável aleatória X definida como o número de tentativas que resultam em um sucesso, tem 
uma distribuição binomial com parâmetros p e k = 0, 1, 2, ...., n e sua função distribuição de probabilidade 
 6 
é definida por: 
 𝑃(𝑋 = 𝑘) =
𝑛
𝑘
𝑝 (1 − 𝑝) , 
onde: 
 
𝑛
𝑥
=
!
!( )!
: é igual ao número total de sequências diferentes de tentativas que contêm x sucessos e 
(n – x) fracassos; 
p = probabilidade de ocorrência do sucesso; 
(1 – p) = probabilidade de ocorrência do fracasso. 
Usamos a notação X  b(n, p) para indicar que X segue o modelo Binomial com parâmetros n e 
p. 
Se X tem distribuição binomial de parâmetros n e p, então seu valor esperado e sua variância 
podem ser determinados por: 
a) Média ou Valor Esperado: 𝜇 = 𝐸(𝑋) = 𝑛 × 𝑝 (número esperado de sucessos que 
ocorrem em n tentativas). 
b) Variância: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝑛 × 𝑝 × (1 − 𝑝). 
 
A distribuição binomial é usada com frequência no controle de qualidade quando a amostragem 
é feita sobre uma população infinita ou muito grande. Nas aplicações de controle de qualidade, X em geral 
representa o número de defeituosos observados em uma amostra de n itens. 
 
Exemplo 4: Um produto eletrônico contém 40 circuitos integrados. A probabilidade de que qualquer 
circuito integrado seja defeituoso é de 0,01. Os circuitos integrados são independentes. O produto opera 
somente se não houver circuitos integrados defeituosos. Qual é a probabilidade de que o produto opere? 
 
Solução: Seja X = nº de circuitos integrados defeituosos e seja p = probabilidade de circuito defeituoso = 
0,01. Logo 1 – p = 0,99. Para que o circuito opere X deve ser igual a zero. 
Logo, 𝑃(𝑋 = 0) = 40
0
0,01 (0,99) = 0,669. 
 
Exemplo 5: Bateladas, que consistem em 50 molas provenientes de um processo de produção, são 
verificadas com relação à conformidade aos requerimentos dos consumidores. O número médio de molas 
não conformes em uma batelada é igual a 5. Suponha que o número de molas não conformes em uma 
batelada, denotada como X, seja uma variável aleatória Binomial. 
a) Quais são os valores de n e p? 
b) Determine P(X ≤ 2)? 
 
Solução: X = nº de molas não conformes numa batelada. Como são 50 molas e a média é igual a 5 molas, 
sabendo que a média na Binomial é igual a 𝜇 = 𝐸(𝑋) = 𝑛𝑝 ∴ 5 = 50𝑝 ∴ 𝑝 = = 0,1. 
b) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 50
0
0, 1 (0,9) +
50
1
0, 1 (0,9) +
50
2
0, 1 (0,9) 
𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 0,005 + 0,029 + 0,078 = 0,112 
 
3.2 DISTRIBUIÇÃO HIPERGEOMÉTRICA 
 A distribuição Hipergeométrica é adequada quando consideramos extrações casuais feitas sem 
reposição de uma população dividida segundo dois atributos. A figura 2 ilustra o experimento definidor 
da v.a. hipergeométrica: 
 7 
 
 Figura 2 – Experimento definidor da variável aleatória hipergeométrica 
 
Considere um conjunto de N elementos, r dos quais têm uma determinada característica (r ≤ N). 
Serão extraídos n elementos (n ≤ N) sem reposição. Considere ainda a v.a. X definida como o número de 
elementos com a referida característica que estarão entre os n retirados. Diz-se então que X tem 
distribuição hipergeométrica com parâmetros N, r e n. 
DEFINIÇÃO 9: Considere uma população com N elementos divididos em 2 classes, uma composta de r 
“sucessos” e a outra composta de N – r “fracassos”. Dessa população, vamos extrair, sem reposição, uma 
amostra aleatória de tamanho n. Seja X uma variável aleatória definida como o número de sucessos na 
amostra (saída do elemento com a característica). Então X é uma variável aleatória hipergeométrica com 
distribuição de probabilidade dada pela expressão: 
𝑃(𝑋 = 𝑘) = , k = 0, 1, ..., n. 
Onde: 
𝑁
𝑛
= número de amostras sem reposição; 
𝑟
𝑘
= número de sucessos na amostra, e 
𝑁 − 𝑟
𝑛 − 𝑘
= o número de fracassos na amostra. 
Essa é a distribuição Hipergeométrica com parâmetros N, r e n. Notação: X  hiper (N, r, n). 
 
Se X tem distribuição Hipergeométrica, então seu valor esperado e sua variância podem ser 
determinados por: 
a) Média ou Valor Esperado: 𝜇 = 𝐸(𝑋) = 𝑛𝑝. 
b) Variância: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝑛𝑝(1 − 𝑝) ( )
( )
, onde 𝑝 = . 
O termo é chamado fator de correção para populações finitas. Quando n é muito menor 
que N esse termo fica próximo de 1. 
Nesse caso a Hipergeométrica fica muito próxima da Binomial. 
 
Exemplo 6: Uma fábrica produz peças que são embaladas em caixas com 25 unidades. Para aceitar o lote 
enviado por essa fábrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia 
uma caixa do lote e, em seguida, sorteia cinco peças, sem reposição, dessa mesma caixa. Se constatar no 
máximo duas defeituosas, aceita o lote fornecida pela fábrica. Se a caixa sorteada tivesse 4 peças 
defeituosas, qual seria a probabilidade de rejeitar o lote? 
 8 
Solução: A caixa pode ter peças boas ou defeituosas e vamos sortear algumas peças sem reposição. 
Considere X = número de peças defeituosas neste sorteio. O número total de peças N = 25, o número de 
defeituosas é r = 4 e o número de retiradas (amostra) é n = 5. 
Então, a probabilidade de rejeitar o lote será dada por: 
𝑃(𝑋 > 2) = 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) = + =
.
+.
= 0,016 
Logo, para rejeitar o lote a probabilidade é de 0,016. Na prática, a menos que seja feita a inspeção em 
todos os itens, não saberemos quantas peças defeituosas existem em cada caixa. Entretanto, a 
probabilidade calculada poderia ser um indicativo se o critério do controle de qualidade está razoável ou 
não. 
Exemplo 7: Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas 
para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a probabilidade de se 
escolher uma amostra com pelo menos uma lâmpada queimada? 
Solução: X = nº de lâmpadas queimadas N = 100; n = 15; r = 12 
𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑃(𝑋 = 0) = 1 − = 1 − 0,125 = 0,875. 
 Fazendo algumas comparações entre as distribuições Binomial e Hipergeométrica através do 
seguinte exemplo. Considere uma urna com r bolas verdes e (N – r) bolas brancas. Dessa urna extrai-se 
uma amostra de n bolas e estamos interessados na variável aleatória X = número de bolas verdes na 
amostra. 
 Se as extrações são feitas com reposição, então X tem distribuição Binomial com parâmetros n e 
p. Se as extrações são feitas sem reposição, então X tem distribuição Hipergeométrica com parâmetros r, 
n e N. 
3.3 DISTRIBUIÇÃO DE POISSON 
A distribuição de Poisson é adequada para descrever situações onde existe uma probabilidade 
de ocorrência em um campo ou intervalo contínuo, geralmente tempo ou área. 
Por exemplo, o nº de acidentes por mês, nº de defeitos por metro quadrado ou o nº de clientes 
atendidos por hora. 
Nota-se que a variável aleatória é discreta (número de ocorrência), no entanto a unidade de 
medida é contínua (tempo, área). Além disso, as falhas não são contáveis, pois não é possível contar o 
número de acidentes que não ocorreram nem tampouco o número de defeitos que não ocorreram. 
 O número X de resultados que ocorrem durante um experimento de Poisson é chamado de 
variável aleatória de Poisson e sua distribuição de probabilidade é chamada de Distribuição de Poisson. 
 Condições de aplicação: 
a) O número de ocorrências durante qualquer intervalo depende somente da extensão do 
intervalo; 
b) As ocorrências ocorrem independentemente, ou seja, um excesso ou falta de ocorrências em 
algum intervalo não exerce efeito sobre o número de ocorrências em outro intervalo; 
c) A possibilidade de duas ou mais ocorrências acontecerem em um pequeno intervalo é muito 
pequena quando comparada à de uma única ocorrência. 
A distribuição de Poisson fica completamente caracterizada por um único parâmetro  (lambda) 
que representa a taxa média de ocorrências por unidade de medida. 
 
 
 9 
DEFINIÇÃO 10: Dizemos que a variável aleatória X obedece a um modelo de Poisson com parâmetro  (
 >0) se sua função de probabilidade é definida por: 
𝑃(𝑋 = 𝑘) =
!
 para K = 0,1,2,... 
Onde: 
e = base do logaritmo natural (e = 2,71828...). 
X = número de resultados que ocorrem em dada unidade de medida. 
 (lê-se lambda): é um número médio de resultados que ocorrem num dado intervalo e é definido 
por:𝜆 = 𝑛 ⋅ 𝑝. 
Usamos a notação X Po() para indicar que X segue o modelo de Poisson. 
Se X tem distribuição de Poisson, então seu valor esperado e sua variância podem ser 
determinados por: 
E(X) = VAR (X) = 𝜆 = 𝑛 ⋅ 𝑝 . 
 
A aplicação típica da distribuição de Poisson no controle de qualidade é como um modelo para o 
número de defeitos (não conformidades) que ocorrem por unidade de produto (por m2, por volume ou 
por tempo). 
A distribuição de Poisson é uma forma limite da distribuição Binomial quando n   e p  0. 
 
Exemplo 8: Em uma seção de uma rodovia, o número de buracos, que é bastante significante para 
requerer reparo, é suposto seguir uma distribuição de Poisson com uma média de dois buracos por milha. 
a) Qual a probabilidade de que não haja buracos que requeiram reparo em 5 milhas de rodovia? 
b) Qual é a probabilidade de que no mínimo um buraco requeira reparo em 0,5 milha de rodovia? 
Solução: X = nº de buracos/milha e  = 2 buracos/por milha 
a)  = 10 buracos/ 5 milhas  𝑃(𝑋 = 0) =
!
= 0,000045 
b)  = 1 buraco/ 1/2 milhas 
𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑃(𝑋 = 0) = 1 −
𝑒 1
𝑜!
= 0,632 
Exemplo 9: Supondo que as consultas num banco de dados ocorrem de forma independente e aleatória, 
com uma taxa média de três consultas por minuto, determinar a probabilidade de que: 
a) No próximo minuto ocorram pelo menos duas consultas. 
b) Nos próximos dois minutos ocorram mais de 2 consultas. 
Solução: 
a)  = 3 consultas/por minuto 
𝑃(𝑋 ≥ 2) = 1 − 𝑃(𝑋 < 2) = 1 − {𝑃(= 0) + 𝑃(𝑋 = 1)} = 1 − {
𝑒 3
0!
+
𝑒 3
1!
}
= 1 − (0,05 + 0,149) = 0,801 
b)  = 6 consultas/por 2 minutos 
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − {𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)}
= 1 −
𝑒 6
0!
+
𝑒 6
1!
+
𝑒 6
2!
= 0,938 
 
 10 
4. VARIÁVEIS ALEATÓRIAS CONTÍNUAS 
Ao contrário do que ocorre com as v.a. discretas, cujos valores podem ser obtidos por um 
processo de enumeração ou contagem, os valores de uma v.a. contínua são em geral oriundos de uma 
medição. 
 
DEFINIÇÃO 11: Uma variável aleatória X é dita contínua se ela assume todos os possíveis valores dentro 
de um intervalo (ou conjunto de intervalos) de números reais. 
 
Exemplo 10: Considere X a variável aleatória definida pelo tempo de espera, em horas, entre motoristas 
flagrados por um radar de velocidade. A variável aleatória aceita todos os valores x nos quais x  0. 
 
Na maioria dos problemas práticos, as variáveis aleatórias contínuas representam dados 
medidos, tais como todas as possíveis alturas, pesos, temperaturas, distâncias ou períodos de vida. Já as 
variáveis aleatórias discretas representam dados de contagem, tais como números de itens com defeitos 
em uma amostra com k itens ou o número de acidentes de trabalho por ano em uma unidade fabril. 
Os valores de uma variável aleatória contínua são definidos a partir do espaço amostral de um 
experimento aleatório. Sendo assim, é natural o interesse na probabilidade de obtenção de diferentes 
valores dessa variável. 
O comportamento probabilístico de uma variável aleatória contínua será descrito pela sua 
Função Densidade de Probabilidade. Apresentamos a definição da função densidade de probabilidade 
utilizando a noção de área. 
 
DEFINIÇÃO 12: Uma função f(x) é função densidade de probabilidade (f.d.p.) para a variável aleatória 
contínua X que satisfaz as seguintes condições: 
a) f(x)  0, para todo x  ; 
b) A área total sob o gráfico de f(x) é igual a 1: ∫ 𝑓(𝑥)𝑑𝑥 = 1
∞
∞ ; 
c) Dada uma função f(x) satisfazendo as propriedades acima, então f(x) representa alguma 
variável aleatória contínua X, de modo que: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥. 
 
 Figura 3 – Probabilidade como área. 
 
Uma primeira observação importante que resulta da interpretação geométrica de probabilidade 
como área sob a curva de densidade de probabilidade é a seguinte: se X é uma variável aleatória contínua, 
então a probabilidade do evento X = a é zero, ou seja, a probabilidade de X ser exatamente igual a um 
valor específico é nula. Isso pode ser visto na Figura 3, o evento {X = a} corresponde a um segmento de 
reta e tal segmento tem área nula. Como consequência, temos as seguintes igualdades: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) =
𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 < 𝐵). 
 
 11 
Exemplo 11: Suponha que o erro na medição da temperatura de reação (em °C), para um experimento 
controlado de laboratório, seja a variável aleatória contínua X, que tem a função definida por: 
 
f(x) = , −1 < 𝑥 < 2.
0, CC
 
a) Verificar se f(x) é uma f.d.p; 
b) Determine P(0 < X ≤ 1). 
 
Solução: 
a) ∫ 𝑑𝑥 = 𝑥 | = + = 1 Logo, f(x) é uma f.d.p. 
 
b) 𝑃(0 < 𝑋 ≤ 1) = ∫ 𝑑𝑥 = 1 9. 
 
4.1.1 ESPERANÇA, VARIÂNCIA E DESVIO PADRÃO DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS. 
 
DEFINIÇÃO 13: Seja X uma variável aleatória contínua com função densidade de probabilidade f(x). A 
esperança ou média(ou valor esperado) de X é definida como: 𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥
∞
∞ . 
 
Exemplo 12: A demanda semanal por Pepsi, em milhares de litros, de uma rede de lojas de conveniência 
local é a variável aleatória contínua X, que tem como densidade de probabilidade a função: 
 
𝑓(𝑋) = 
2(𝑥 − 1), 1 < 𝑥 < 2,
0, CC
. 
 
Determine a média da demanda. 
Solução: 𝑬(𝑿) = 𝟐 ∫ 𝒙(𝒙 − 𝟏)𝒅𝒙
𝟐
𝟏
=
𝟓
𝟑
= 𝟏, 𝟔𝟕. 
 
DEFINIÇÃO 14: Seja X uma variável aleatória contínua com função densidade de probabilidade f(x). A 
variância de X é definida como: 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[𝑋 − 𝐸(𝑋)] = ∫ (𝑥 − 𝜇) 𝑓(𝑥)𝑑𝑥
∞
∞ . 
Usando as propriedades do cálculo integral e representando por μ a esperança de X (note que μ 
é uma constante, um número real), temos que: 
𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[(𝑋 − 𝜇) ] = (𝑥 − 𝜇) 𝑝(𝑥)
= (𝑥 − 2𝜇𝑥 + 𝜇 )𝑝(𝑥) = 𝑥 𝑝(𝑥) − 2𝜇 𝑥𝑝(𝑥) + 𝜇 𝑝(𝑥) 
 
𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[𝑋 ] − 2𝜇 + 𝜇 = 𝐸[𝑋 ] − 𝜇 
 
Isto é, 𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] , onde 𝐸(𝑋 ) = ∫ 𝑥 𝑓(𝑥)𝑑𝑥∞∞ . 
 
Para os dados do exemplo 12 vamos determinar a variância da demanda semanal de Pepsi 
calculando primeiro E(X2). Então: 𝐸(𝑋 ) = 2 ∫ 𝑥 (𝑥 − 1)𝑑𝑥 = . 
Assim, a variância é determinada por: 𝜎 = 𝑉𝑎𝑟(𝑋) = − = . 
A raiz quadrada positiva da variância é chamada de Desvio Padrão de X. 
As mesmas propriedades vistas para a esperança, variância e desvio padrão para variáveis 
aleatórias discretas continuam valendo no caso contínuo: 
 
 12 
Exemplo 13: Seja 𝑓(𝑥) = 
𝑘𝑥, 0 < 𝑥 ≤ 1
0, CC
. 
 Determinar: 
 
a) k a fim de que f(x) seja f.d.p.; 
b) 𝑃 0 ≤ 𝑥 ≤ ; 
c) E(X); 
d) Var(X). 
 
Solução: 
a) ∫ 𝑘𝑥𝑑𝑥 = 1 ∴ 𝑥 | = 1 ∴ 𝑘 = 2; 
b) 𝑃 0 ≤ 𝑥 ≤ = 𝑥 | = 1/4; 
c) 𝐸(𝑋) = ∫ 𝑥2𝑥𝑑𝑥 = 2 ∫ 𝑥 𝑑𝑥 = 𝑥 | = 
d) 𝑉𝑎𝑟(𝑋) = ∫ 𝑥 2𝑥𝑑𝑥 − = 𝑥 | − = − = 
 
 
5. DISTRIBUIÇÕES CONTÍNUAS: UNIFORME, EXPONENCIAL E NORMAL 
5.1 DISTRIBUIÇÃO UNIFORME CONTÍNUA 
Segundo Walpole et all (2009), a distribuição Uniforme Contínua é uma das mais simples 
distribuições contínuas de toda a estatística. Essa distribuição é caracterizada por uma função de 
densidade que é “plana” e, portanto, a probabilidade é uniforme em um intervalo fechado [a, b]. 
 
DEFINIÇÃO 15: A função de densidade da variável aleatória contínua uniforme X no intervalo [a, b] é 
definida por: 
𝑓(𝑥) = 
1
𝑏 − 𝑎
, 𝑎 ≤ 𝑥 ≤ 𝑏;
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
 
 
Usamos a notação X U[a, b] para indicar que X segue o modelo Uniforme Contínuo no intervalo 
considerado. 
Enfatizamos que a função de densidade forma um retângulo de base b – a e altura constante de 
ab 
1
. 
A distribuição Uniforme é frequentemente chamada de distribuição retangular. 
 
Figura 4 – A função f(x) Uniforme como uma função distribuição de probabilidade 
 13 
 
Se X tem distribuição Uniforme Contínua, então seu valor esperado e sua variância podem ser 
determinados por: 
a) Esperança ou Média: Das propriedades da esperança e das características da densidade 
uniforme, sabemos que E(X) é o ponto médio do intervalo [a,b], ou seja, 
 
𝐸(𝑋) = 𝑎 +
𝑏 − 𝑎
2
=
𝑎 + 𝑏
2
 
 Usando a integral: 
𝐸(𝑋) = 𝑥
1
𝑏 − 𝑎
𝑑𝑥 =
1
𝑏 − 𝑎
𝑥
2
=
𝑏 − 𝑎
2(𝑏 − 𝑎)
=
(𝑏 − 𝑎)(𝑎 + 𝑏)
2(𝑏 − 𝑎)
=
𝑎 + 𝑏
2
 
 
b) Variância: Por definição, 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] . Vamos então calcular 𝐸(𝑋 ): 
𝐸(𝑋 ) = 𝑥
1
𝑏 − 𝑎
𝑑𝑥 =
1
𝑏 − 𝑎
𝑥
3
=
𝑏 − 𝑎
3(𝑏 − 𝑎)
=
(𝑏 − 𝑎)(𝑏 + 𝑎𝑏 + 𝑎 )
3(𝑏 − 𝑎)
 
Logo, 
𝑉𝑎𝑟(𝑋) =
(𝑏 + 𝑎𝑏 + 𝑎 )
3
−
𝑎 + 𝑏
2
=
(𝑏 + 𝑎𝑏 + 𝑎 )
3
−
𝑎 + 2𝑎𝑏 + 𝑏
4
 
𝑉𝑎𝑟(𝑋) =
4𝑏 + 4𝑎𝑏 + 4𝑎 − 3𝑎 − 6𝑎𝑏 − 3𝑏
12
=
𝑎 − 2𝑎𝑏 + 𝑏
12
=
(𝑏 − 𝑎)
12
 
 
Exemplo 14: O rótulo de uma lata de refrigerante indica que o conteúdo é de 350 ml. Suponha que a linha 
de produção encha as latas de forma que o conteúdo seja uniformemente distribuído no intervalo 
[345;355]. 
a) Qual é a probabilidade de que uma lata tenha conteúdo superior a 353 ml? 
b) Qual é a probabilidade de que uma lata tenha conteúdo inferior a 346 ml? 
Solução: 
a) 𝑃(𝑋 > 353) = ∫ 𝑑𝑥 = 𝑥 | = = 0,2 
 
b) 𝑃(𝑋 < 346) = ∫ 𝑑𝑥 = 𝑥 | = = 0,1 
 
Exemplo 15: A espessura de chapas fabricadas numa indústria está uniformemente distribuída entre 0,84 
cm e 1,04 cm. 
a) De um total de 200 chapas inspecionadas, quantas excedem 1,00 cm? 
b) Qual deve ser a espessura de modo que 40% das chapas não excedam essa espessura? 
 
Solução: 
a) 𝑃(𝑋 > 1) = ∫
,
𝑑𝑥 =
,
𝑥 | , =
,
,
= 0,2
, . 
De um total de 200 chapas, 40 excedem 1 cm. 
 
b) 𝑃(𝑋 < 𝑥) = ∫
,
𝑑𝑥 = 0,4
,
∴
,
𝑥 | , = 0,4 ∴
,
,
= 0,4 ∴ 𝑥 − 0,84 = 0,08 ∴ 𝑥 =
0,92𝑐𝑚 
 
5.2 DISTRIBUIÇÃO EXPONENCIAL 
O modelo exponencial tem forte relação com modelo discreto de Poisson. Enquanto a 
distribuição de Poisson pode ser usada para modelar o número de ocorrências em um período contínuo 
(de tempo ou de comprimento), a distribuição exponencial pode modelar a variável aleatória contínua 
que representa o intervalo (de tempo ou de comprimento) entre as ocorrências. Exemplos: 
 14 
a) Tempo (em minutos) até a próxima consulta a uma base de dados; 
b) Tempo (em segundos) entre pedidos a um servidor; 
c) Distância (em metros) entre defeitos de uma bobina de papel. 
Ou seja, na distribuição de Poisson temos a estimativa da quantidade de eventos num intervalo 
(distribuição de dados discreta). Exemplo: Um fio de cobre apresenta uma taxa de 2 falhas por metro. 
Qual a probabilidade de apresentar em um metro, 4 falhas? 
A distribuição Exponencial está ligada à de Poisson. Ela analisa inversamente o experimento, um 
intervalo ou espaço para ocorrência de um evento. No exemplo do fio, qual a probabilidade de ocorrer 
uma falha em 0,5 metros, se ele possui uma taxa de 2 falhas por metro? 
A condição de aplicação da distribuição Exponencial é que o número de ocorrências deve seguir 
uma distribuição de Poisson. No exemplo, a probabilidade relacionada ao comprimento do fio depende 
apenas da suposição das falhas no fio seguirem o processo de Poisson. 
 
DEFINIÇÃO 16: Uma variável aleatória X tem uma Distribuição Exponencial com parâmetro  > 0, onde  
é definida como taxa média, denotada por X ~ exp () se sua função densidade de probabilidade de X é 
dada por: 
𝑓(𝑥) =
𝜆𝑒 , se x ≥ 0
 0 , se x < 0 
 
 
A figura 5 representa a função densidade de probabilidade da distribuição exponencial para 
parâmetros de  igual a 0,5, 1 e 2. 
 
Figura 5 – Distribuição exponencial para  = 0,5,  = 1 e  = 2. 
 
 Note que a distribuição exponencial é assimétrica positiva (à direita), observando uma maior 
frequência para valores menores de x e uma cauda mais longa à direita. 
 A função de densidade assume valor  quando x = 0, e tende a zero à medida que x  ; quanto 
maior o valor de , mais rapidamente a função tende a zero. 
 
 Para calcular probabilidades com a exponencial, teremos: 
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝜆𝑒 𝑑𝑥 = −𝑒 | = 𝑒 − 𝑒 . 
Note que a inclusão dos extremos a e b não altera o cálculo efetuado. 
 A média ou esperança de uma v.a. exponencial com 𝑓(𝑥) = 𝜆𝑒 é definida por: 
𝜇 = 𝐸(𝑋) = 𝑥𝑓(𝑥)𝑑𝑥 = 𝑥𝜆𝑒 𝑑𝑥
∞∞
 
 15 
Definindo: 𝑢 = 𝑥 ⇒ 𝑑𝑢 = 𝑑𝑥 
 𝑑𝑣 = 𝜆𝑒 𝑑𝑥 ⇒ 𝑣 = 𝜆 ∫ 𝑒 𝑑𝑥 ⇒ 𝑣 = −𝑒 
 
O método de integração por partes nos dá que: 
 
−𝑥𝑒 |∞ = ∫ 𝑥𝜆𝑒 𝑑𝑥 + ∫ −𝑒 𝑑𝑥
∞∞ (I) 
 
Lembrando que lim
→
𝑥 𝑒 = 0, o lado esquerdo de (I) é igual a zero. 
Logo, 
0 = 𝐸(𝑋) + 𝑒 |∞ ⇒ 0 = 𝐸(𝑋) + 0 − . 
Ou seja, 𝜇 = 𝐸(𝑋) = . 
 A variância de uma v.a. exponencial é dada por: 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)] onde: 
𝐸(𝑋 ) = 𝑥 𝑓(𝑥)𝑑𝑥 =
∞
𝑥 𝜆𝑒 𝑑𝑥
∞
 
Seguindo raciocínio análogo ao empregado no cálculo da esperança, vamos definir: 
𝑢 = 𝑥 ⇒ 𝑑𝑢 = 2𝑥𝑑𝑥; 
𝑑𝑣 = 𝜆𝑒 𝑑𝑥 ⇒ 𝑣 = −𝑒 
Logo, 
−𝑥 𝑒 |∞ = ∫ 𝑥 𝜆𝑒 𝑑𝑥 + ∫ −2𝑥𝑒 𝑑𝑥 ⇒ 0 = 𝐸(𝑋 ) − 2 ∫ 𝑥𝑒 𝑑𝑥 ⇒ 𝐸(𝑋 ) =
∞∞ 
E, portanto: 𝑉𝑎𝑟(𝑋) = − = . 
Portanto, a média e a variânciadesta distribuição são: 
𝐸(𝑋) = 𝜇 = e 𝑉𝑎𝑟(𝑋) = 𝜎 = . 
A distribuição Exponencial é amplamente utilizada na área da engenharia de confiabilidade como 
modelo para o tempo até a falha de um componente ou sistema. Em tais aplicações o parâmetro  é 
denominado taxa de falha do sistema e a média da distribuição 
1 é chamada tempo médio de falha. 
Exemplo 16: Os tempos até a falha de um dispositivo eletrônico seguem o modelo exponencial com uma 
taxa de falha  = 0,012 falhas/hora. Indique qual a probabilidade de um dispositivo escolhido ao acaso 
sobreviver: 
a) Mais de 100 horas; 
b) Mais de 50 horas; 
 
Solução:  = 0,012 falha/hora 
a) 𝑃(𝑇 > 100) = 1 − 𝑃(𝑇 ≤ 100) = 1 − ∫ 0,012𝑒 , 𝑑𝑥 = 1 − {𝑒 ( , ⋅ ) −
𝑒 ( , ⋅ )} = 0,3012 
b) 𝑃(𝑇 > 50) = 1 − 𝑃(𝑇 ≤ 50) = 1 − ∫ 0,012𝑒 , = 1 − {𝑒 ( , ⋅ ) − 𝑒 ( , ⋅ )} =
0,5488 
 
Exemplo 17: Uma ferramenta produzida por uma indústria apresenta uma vida média de 80 horas. 
Considerando o comportamento segundo a distribuição exponencial, qual a probabilidade de essa 
ferramenta durar mais de 100 horas? 
Solução: 𝑬(𝑿) = 𝟏
𝝀
∴ 𝟖𝟎 =
𝟏
𝝀
∴ 𝝀 =
𝟏
𝟖𝟎
 
Então: 
𝑃(𝑇 > 100) = 1 − 𝑃(𝑋 ≤ 100) = 1 −
1
80
𝑒 = 1 − {𝑒 ( ⋅ ) − 𝑒 ( ⋅ )} = 0,2865 
 16 
5.3 DISTRIBUIÇÃO NORMAL DE PROBABILIDADE. 
A distribuição normal é a mais importante das distribuições contínuas, pois muitas variáveis 
aleatórias de ocorrência natural ou de processos práticos obedecem a esta distribuição. 
Em 1733 Abraham De Moivre desenvolveu a equação matemática da curva Normal que serviu 
de base para boa parte da teoria da estatística inferencial. Frequentemente, se refere à distribuição 
Normal como distribuição gaussiana em homenagem a Karl Friedrich Gauss (1777 – 1855), que também 
derivou sua equação a partir de um estudo dos erros em medições repetidas da mesma quantidade. 
 
 
DEFINIÇÃO 17: Uma variável aleatória contínua X tem Distribuição Normal de probabilidade se a sua 
função densidade de probabilidade é dada por: 
𝑓(𝑥) =
√
𝑒 , para -∞ < x < +∞ 
 
onde:  = constante  3,14159... 
 e = a base do logaritmo natural  2,71828... 
  = média aritmética da população 
  = desvio padrão da população 
 
Se uma variável aleatória x tem distribuição normal com média 𝜇 e variância 𝜎 , diz-se que: 
X ~ N(𝜇, 2 ) 
A figura 6 a seguir mostra uma curva normal típica, com seus parâmetros descritos graficamente. 
 
 Figura 6 – Distribuição Normal 
 
 As principais características dessa função são: 
a) O ponto de máximo de f(x) é o ponto X = µ. 
b) Os pontos de inflexão da função são: X = µ +  e X = µ - . 
c) A curva é simétrica em relação a µ. 
d) E(X) = µ e VAR(X) = 2. 
e) A área total abaixo da curva e acima do eixo horizontal é igual a 1. 
 
A curva normal tem forma de sino, ou seja, é unimodal, e o seu valor de máxima frequência 
(moda) coincide com o valor da média e da mediana. 
A média é o centro da curva e a distribuição de valores maiores que a média e a dos valores 
menores que a média é perfeitamente simétrica, ou seja, se passarmos uma linha exatamente pelo centro 
da curva teremos duas metades, sendo que cada uma delas é a imagem especular da outra. 
As extremidades da curva se estendem de forma indefinida ao longo de sua base (o eixo das 
abcissas) sem jamais tocá-la. Portanto, o campo de variação da distribuição normal se estende de menos 
infinito a mais infinito. 
A curva normal é uma distribuição que possibilita determinar probabilidades associadas a todos 
 17 
os pontos da linha de base, ou seja, é uma distribuição de frequências, sendo a frequência total sob a 
curva igual a 100%. 
Assim sendo, a curva apresenta uma área central em torno da média, onde se localizam os pontos 
de maior frequência e também possui áreas menores, progressivamente mais próximas de ambas as 
extremidades, em que são encontrados valores muito baixos de x (à esquerda) ou escores muito altos (à 
direita), ambos presentes em baixas frequências. 
 No cálculo de probabilidades para variáveis aleatórias contínuas, devemos resolver a integral da 
função densidade de probabilidade no intervalo de interesse, isto é: 
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) =
1
𝜎√2𝜋
𝑒 𝑑𝑥 
 Entretanto, como a função acima não possui antiderivada, a integral acima somente pode ser 
resolvida de modo aproximado e por métodos numéricos. 
 Por essa razão as probabilidades para o modelo Normal são calculadas com o auxílio de tabelas. 
 Para se evitar a multiplicação desnecessária de tabelas para cada par de valores da média e da 
variância, utiliza-se uma transformação que leva sempre ao cálculo de probabilidades com uma variável 
de parâmetros µ = 0 e  = 1. 
 
5.3.1 DISTRIBUIÇÃO NORMAL PADRÃO 
 
Todas as curvas normais representativas de distribuições de frequências podem ser 
transformadas em uma curva normal padrão, usando o desvio padrão ( ) como unidade de medida 
indicativa dos desvios dos valores da variável em estudo ( X ) em relação à média (  ). 
 Se a variável X tem distribuição normal, pode-se definir a distribuição de uma nova variável, 
denominada Normal Padrão (z), definida por: 𝑍 = , onde: 
 Z = nº de desvios padrões a contar da média; 
 X = valor arbitrário da variável; 
 µ = média da distribuição normal; 
  = desvio padrão da distribuição normal. 
 
 
 Figura 7 – Transformação de distribuição normal para normal padrão 
 
A Distribuição Normal Padrão é caracterizada pela média (  ) igual a zero e desvio padrão ( ) 
igual a 1: 
E(Z) = E = 

1
E(X - µ) = 

1
{E(X) - µ)} = 0 
 18 
VAR(Z) = VAR = 
2
1

VAR(X - µ) = 
2
1

VAR(X) = 1 
É importante lembrar que a área sob a curva pode ser entendida como uma medida de sua 
probabilidade e que a área sob a curva normal é igual a 1. Então, se forem tomados dois valores 
específicos, pode-se determinar a proporção de área sob a curva entre esses dois valores. 
 
Exemplo 18: Seja X uma v.a. que se comporta segundo uma distribuição Normal de probabilidade com 
média igual a 100 e desvio padrão igual a 5. Calcular as seguintes probabilidades: 
a) P (100 ≤ X ≤ 106) 
b) P (89 ≤ X ≤ 107) 
c) P (X ≥ 108) 
Solução: 
a) 𝑃(100 ≤ 𝑋 ≤ 106) = 𝑃 ≤ 𝑍 ≤ = 𝑃(0 ≤ 𝑍 ≤ 1,2) = 0,5 − 0,1151 =
0,3849 
b) 𝑃(89 ≤ 𝑋 ≤ 107) = 𝑃 ≤ 𝑍 ≤ = 𝑃(−2,2 ≤ 𝑍 ≤ 1,4) = 0,4861 + 0,4192 =
0,9053 
c) 𝑃(𝑋 ≥ 108) = 𝑃 𝑍 ≥ = 𝑃(𝑍 ≥ 1,6) = 0,0548 
 
Exemplo 19: A profundidade de poços artesianos em um determinado local é uma variável aleatória com 
distribuição normal de probabilidade com média de 20 m e desvio padrão de 1,7m. Se X é a profundidade 
de determinado poço, determinar: 
a) P(X < 15). 
b) P(18 ≤ X ≤ 23) 
c) P(X > 25) 
 
Solução: 
a) 𝑃(𝑋 < 15) = 𝑃 𝑍 <
,
= 𝑃(𝑍 < −2,94) = 0,0016 
b) 𝑃(18 ≤ 𝑋 ≤ 23) = 𝑃
,
≤ 𝑍 ≤
,
= 𝑃(−1,18 ≤ 𝑍 ≤ 1,76) = 0,381 + 0,4608 =
0,8418 
c) 𝑃(𝑋 > 25) = 𝑃 𝑍 >
,
= 𝑃(𝑍 > 2,94) = 0,0016. 
 
5.4 A DISTRIBUIÇÃO NORMAL COMO LIMITE DE OUTRAS DISTRIBUIÇÕES 
Muitas distribuições de probabilidade aproximam-se da distribuição Normal. É o caso da Binomial 
quando n é grande e da Poisson quando  é grande. 
 
a) Aproximação Normal à Binomial 
Nos experimentos binomiais, quando n é muito grande, o uso da função de probabilidade 
binomial é impraticável, pois os coeficientes binomiais tornam-se exageradamente grandes. 
 Quando n (tamanho da amostra) é grande e p (probabilidade do sucesso) não é próximo de 
0 ou de 1, a distribuição Normal pode ser usada para calcular, aproximadamente, as probabilidades de 
uma binomial. 
 A figura 8 mostra os histogramas para a distribuição binomial variando-se o número de 
ensaios n e a probabilidade de sucesso (p). 
 19 
 
Figura 8 – Distribuições binomiais para diferentes valores de n e p. 
 
Observando a figura 8, verificamos que quando p = 0,5, a medida que a amostra cresce de 
10 para 50, mais a forma da distribuição binomial é parecida com a curvada distribuição normal. 
Uma regra prática, sugerida por vários autores, considera a aproximação razoável se as duas 
seguintes inequações estiverem satisfeitas: 𝑛𝑝 ≥ 5 e 𝑛(1 − 𝑝) ≥ 5. 
Os parâmetros média () e desvio padrão () da distribuição normal devem se identificar ao 
valor esperado e ao desvio padrão do modelo binomial, ou seja: 𝜇 = 𝑛𝑝 e 𝜎 = 𝑛𝑝(1 − 𝑝). 
Logo, a variável Normal padrão fica definida por: 𝑍 =
( )
. 
 
Exemplo 20: Historicamente, 10% dos pisos cerâmicos, que saem de uma linha de produção, têm algum 
defeito leve. Se a produção diária é de 1000 unidades, qual é a probabilidade de ocorrer mais de 120 itens 
defeituosos? 
 
Solução: Considere a variável Y = número de defeituosos na amostra com distribuição binomial com 
parâmetros n =1000 e 1,0p . Verificando as condições 𝑛𝑝 = 1000 ⋅ 0,1 = 100 e 𝑛(1 − 𝑝) = 1000 ⋅
0,9 = 900 como as duas são maiores que 5, podemos usar a aproximação para a distribuição normal onde 
𝜇 = 𝑛𝑝 = 1000 ⋅ 0,1 = 100 e 𝜎 = 𝑛𝑝(1 − 𝑝) = √1000 ⋅ 0,1 ⋅ 0,9 = 9,49. 
Usando a aproximação para distribuição normal, temos: 𝑃(> 120) = 𝑃 𝑍 >
,
= 𝑃(𝑍 > 2,11) =
0,0174. 
 
b) Aproximação Normal à Poisson 
Seja X uma v.a. com distribuição de Poisson com média 𝐸(𝑋) = 𝜆 e variância 𝑉𝑎𝑟(𝑋) = 𝜆, 
então: 𝑍 =
√
 é aproximadamente uma variável aleatória normal padrão. 
 A aproximação é boa para  > 5. 
 A figura 9 mostra o comportamento da distribuição de Poisson para diferentes valores de : 
 20 
 
Figura 9 – Aproximação da distribuição de Poisson pela distribuição Normal. 
 
 
 
 
 
 
 
 
BIBLIOGRAFIA DO TEXTO 
MAGALHÃES, M.N.; LIMA, A.C.P. Noções de probabilidade e estatística. Edusp, 2002. 
MORETTIN, L. G. Estatística Básica: Probabilidade e Inferência – volume único. Editora Pearson Makron 
Books, São Paulo, 2009. 
WALPOLE, R., MEYERS, R., MYERS, S., Ye, K.. Probabilidade e estatística para engenharia e ciências. São 
Paulo: Pearson Prentice Hall, 2009.