Buscar

APLICAÇÕES DA ESTATÍSTICA NA INDÚSTRIA DE TRANSFORMAÇÃO

Prévia do material em texto

TÓPICOS ESPECIAISTÓPICOS ESPECIAIS
INTEGRADORES EMINTEGRADORES EM
ESTATÍSTICAESTATÍSTICA
APLICAÇÕES DAAPLICAÇÕES DA
ESTATÍSTICA NA INDÚSTRIAESTATÍSTICA NA INDÚSTRIA
DE TRANSFORMAÇÃO —DE TRANSFORMAÇÃO —
DISTRIBUIÇÕES DEDISTRIBUIÇÕES DE
PROBABILIDADESPROBABILIDADES
Au to r ( a ) : M a . V i v i a n e d e J e s u s L e i t e
                            M a . A l e x a n d ra Wa l t r i c k R u s s i
Pa re c e r i s t a : A n d ré d a S i l va C o u ra
Tempo de leitura do conteúdo estimado em 1 hora e 5 minutos.
Introdução
Olá, estudante. Durante o trabalho com dados coletados, você vai perceber e entender
que algumas variáveis aleatórias têm um certo padrão no comportamento. Para
esses casos foram desenvolvidas funções, modelos matemáticos, ou distribuições
de probabilidades, além de fórmulas para medidas de interesse (média e variância).
Neste material, você será apresentado(a) aos conceitos de variáveis aleatórias
(discretas e contínuas), de distribuição de probabilidade, a alguns modelos de
distribuição, como as distribuições discretas, de Bernoulli e seu desdobramento: a
distribuição binomial e a distribuição de Poisson.  
Vamos lá, então? Bons estudos!
O objetivo da análise de conglomerados, também conhecida como análise de
agrupamentos ou de cluster, é particionar um conjunto de dados em grupos que são
internamente homogêneos e externamente distintos, ou seja, segmentar ou agrupar
Variáveis aleatórias
discretas e contínuas
em grupos menores (subgrupos). A classi�cação é realizada com base em uma
medida de similaridade ou dissimilaridade dentro e entre os grupos.
O exemplo mais utilizado, inclusive apresentado por Meyer (2010), é o de
lançamentos de moedas. Uma informação relevante é que para a delimitação das
probabilidades é preciso declarar a chance de ocorrência de cada lançamento ou
informar que se trata do lançamento de moeda honesta ou equilibrada, garantindo
que o leitor entenda que cada lançamento tem 50% de ocorrência. De acordo com o
exemplo de Meyer (2010), assumamos como S o espaço amostral do lançamento de
duas moedas: . A variável aleatória desse
experimento assumida como é o número de caras veri�cadas no lançamento
das moedas. Assume-se também que é uma ocorrência de coroa. H e T têm a
mesma chance de ocorrência, assumindo assim que se trata de moedas equilibradas.
Veri�cam-se então os possíveis eventos nesse experimento: ,
 e .
É importante destacar que as letras maiúsculas denotam as variáveis aleatórias, e as
minúsculas os valores especí�cos dessas variáveis aleatórias (números). Observe a
representação da função de variável aleatória, descrita anteriormente.
S  = {HH,  HT ,  TH,  TT}
X (H)
(T )
X (HH) = 2
X (HT ) = X (TH) = 1 X (TT ) = 0
Figura 2.1 - Representação de função da variável aleatória X no espaço amostral S e
com os possíveis valores de .
Fonte: Adaptada de Meyer (2010, p. 67).
#PraCegoVer: no topo central da �gura, lê-se: “S – espaço amostral de = valores
possíveis de X”. Logo abaixo, há dois espaços (circulares e irregulares) lado a lado; à
esquerda há um ponto com a identi�cação da letra s minúscula (valores do experimento),
interligado por uma linha, cuja informação atrelada a ela é X (variável aleatória), até o
círculo irregular disposto à direita, até um outro ponto, identi�cado como .
Conforme Hair et al. (2009), para realizar uma análise de cluster cuidadosa, são
necessários métodos com as seguintes características:
E: lançar duas moedas equiprováveis.
X: número de caras no lançamento das duas moedas.
X = 0, em que não há ocorrência de alguma cara, evento (TT) com probabilidade de 
ou 25% ou ainda 0,25.
X = 1, em que há ocorrência de apenas uma cara, evento (HT, TH) com probabilidade
de ou 50% ou 0,50.
X = 2, em que há ocorrência de duas caras, evento (HH) com probabilidade de ou
25% ou 0,25.
xs
εRx
X(s)
1
4
2
4
1
4
Ao tratar de variáveis aleatórias, é importante ter ciência e distinguir os dois tipos
importantes segundo sua natureza: discretas e contínuas.
Variável aleatória discreta
De forma geral, o Código de Nuremberg estabeleceu que nenhum ser humano
poderia ser submetido a projetos de pesquisa sem o seu devido consentimento,
sendo o primeiro documento a ter alcance internacional, por conta, principalmente, do
repúdio da comunidade internacional quanto aos crimes cometidos no período nazi-
fascista (PALÁCIOS; REGO; SCHRAMM, 2009).
A necessidade de regulamentação de pesquisas em seres humanos, para proteger
seus participantes, e o desejo do corpo médico ter sua própria regulamentação foram
motivações para a criação da Declaração de Helsinque, a qual foi aprovada pela
Associação Médica Mundial, e cuja primeira versão é de 1964 (PALÁCIOS; REGO;
SCHRAMM, 2009).
a. X: número de funcionários em certa empresa.
b. Y: resultado do lançamento de um dado honesto.
c. L: número de ligações recebidas em uma central de telemarketing ao longo de
um turno de trabalho.
d. P: número de peças produzidas ao longo de 30 dias por uma máquina.
e. R: número de reclamações recebidas em 30 dias pela ouvidoria de uma
indústria.
Estudante, perceba que todas as variáveis aleatórias discretas citadas estão
indicadas com letras maiúsculas e remetem a valores enumeráveis (�nitos e
contáveis).
É importante destacar que quando uma variável de interesse é
in�uenciada pela aleatoriedade trata-se de uma variável aleatória.
 
Em 1988, o Conselho Nacional de Saúde (CNS) do Brasil estabeleceu normas que
tratam da ética em pesquisa com seres humanos e, em 10 de outubro de 1996,
aprovou as diretrizes/normas que regulamentam pesquisas com seres humanos,
denominada Resolução 196/96 (PALÁCIOS; REGO; SCHRAMM, 2009).
A Resolução 196/96 estabeleceu princípios básicos para permitir apreciação da ética
em protocolos de pesquisa, criando os Comitês de Ética em Pesquisa (CEP) e a
Comissão Nacional de Ética em Pesquisa (Conep). O conteúdo da resolução
incorpora as experiências históricas da regulamentação sobre ética em pesquisa,
principalmente com base no Código de Nuremberg (1947), na Declaração dos
Direitos Humanos (1948), na Declaração de Helsinque (desde a primeira versão de
1964), nas Diretrizes Internacionais para a Revisão Ética de Estudos Epidemiológicos
e nas Diretrizes Éticas Internacionais para Pesquisas Biomédicas Envolvendo Seres
Humanos, assim como em conteúdos de leis promulgadas após a aprovação da
Constituição de 1988 (PALÁCIOS; REGO; SCHRAMM, 2009; NOVOA, 2014).
Variável aleatória contínua
Samohyl (2009) estabelece que o grá�co de soma acumulada (CUSUM) é um
aprimoramento do grá�co de controle X de Shewhart, este, de�nido como sendo a
forma de monitoramento da média de um processo especí�co cuja característica
de qualidade de interesse X é uma grandeza mensurável representada. Assim sendo,
o CUSUM é o mais apropriado para se reconhecer o histórico dos dados,
característica ausente em grá�cos mais simples, e também para identi�car pequenas
alterações nos processos muito antes dos alarmes dos grá�cos X, considerados
como LSC e LIC.
Vejamos alguns exemplos para deixar o entendimento mais claro.
a. X: tempo de processamento de uma máquina de empacotar.
b. Y: peso real de um pacote de 5 kg de arroz.
c. Z: quantidade de água, em litros, em um reservatório utilizado para resfriar a
turbina de uma usina.
d. P: custo de construção de uma nova área em determinada fábrica.
e. R: custo de lançamento de uma campanha publicitária.
f. K: altura de mulheres brasileiras na faixa etária de 20 a 40 anos.
g. T: tempo de vida de uma bateria de celular.
μμ
h. I: índice de in�ação em certo mês de um país.
Como já foi mencionado, variáveis aleatórias contínuas    podem assumir quaisquer
valores dentro de um intervalo de números reais, ou seja, pode assumir in�nitos
valores. Por essa razão, não é possível o cálculo de probabilidade para um valor
especí�co, como nas variáveis aleatórias discretas. Nas contínuas, a probabilidade de
um ponto especí�co no intervalo de dados é zero.
Assim como para distribuições de probabilidadesdiscretas tem-se o conceito de
função de probabilidade ( ), para as distribuições de probabilidades contínuas
tem-se a função densidade de probabilidade, representada por f( ).
Apesar de a eticidade e a cienti�cidade da pesquisa cientí�ca, em especial, daquela
realizada com seres humanos, serem aspectos que caminham juntos, não cabe aos
Comitês de Ética em Pesquisa (CEP) a emissão de pareceres sobre a metodologia
utilizada no desenvolvimento dos estudos (NOVOA, 2014).
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Leia o caso a seguir:  
Uma costureira precisava confeccionar 50 camisas. Para terminar uma camisa, ela
sabe que leva um total de 2 horas costurando. Antes de iniciar a demanda de
produção, a costureira veri�ca que o fusível da máquina havia queimado. Sabendo
que o tempo de vida útil de um fusível é de 1.000 horas, ela considerou pegar de
outra máquina um fusível que já tinha 150 horas de uso. Ela então calcula e
probabilidade de o fusível queimar antes de entregar a costura das 50 camisas. Para
calcular a probabilidade corretamente, o primeiro passo é identi�car o tipo de
variável que se tem interesse.
p ( )xi
x
Assinale a alternativa correta que aponta qual é o tipo de variável aleatória com o
qual a costureira está lidando.
a) Número discreto
b) Variável aleatória discreta.
c) Variável bimodal.
d) Variável aleatória contínua.
e) Número contínuo.
Prezado(a) estudante, a distribuição de probabilidade, no caso de variáveis aleatórias
discretas, é uma função que relaciona a probabilidade de um evento a uma variável
aleatória discreta.
A função de probabilidade discreta deve satisfazer, conforme Martins e Domingues
(2017), se a cada resultado de associa-se um número ,
denominado probabilidade de , tal que duas condições sejam satisfeitas:
 para todo e .
Não existem sistemas de medição que possam ser classi�cados como ideais. Dessa
forma, é atribuição direta dos engenheiros de�nir e implantar sistemas de medição
que apresentem propriedades estatísticas consideradas adequadas.
Distribuição de
probabilidade
xi P ( ) = P (X = )xi xi
xi
( ) ≥ 0p∞ xi xi p( ) = 1∑∞
i=1 x1
Exemplo
Seja X uma variável aleatória discreta com espaço .
Seja .
Note que é uma função de probabilidade, pois:
I. para todo , isto é, 
A pesquisa epidemiológica tem por base a coleta sistemática de dados sobre
eventos associados, principalmente, à saúde das pessoas pertencentes a populações
de interesse. O tratamento analítico dado aos fatores pesquisados tem base em três
procedimentos, a saber, a mensuração de variáveis aleatórias, a estimação de
parâmetros populacionais e o uso de testes estatísticos (BLOCH; COUTINHO, 2009).
 Exemplo
Uma fábrica de lâmpadas garante que a probabilidade de uma lâmpada produzida ser
defeituosa é de 10%. Testam- se as lâmpadas até que a primeira defeituosa seja
encontrada.
Sendo X o número de testes realizados até encontrar a primeira lâmpada com defeito,
encontre a função de probabilidade de X.
Solução
Considere P para lâmpada sem defeito, e D para lâmpada defeituosa.
O espaço amostral é constituído por sequências        como:
D, PD, PPD, PPPD, PPPP... D, uma vez que testam-se tantas lâmpadas quantas forem
necessárias até localizar a primeira defeituosa.
Logo os valores possíveis de X são: 1, 2, ..., (não há um valor máximo pré-de�nido).
Mas se, e somente se, as ( ) primeiras lâmpadas testadas estão boas e
a n-ésima tem defeito. Isto é, corresponde à sequência PPPPPPP...PD, que
tem lâmpadas boas e 1 com defeito.
Lembrando que, de acordo com os dados apresentados, e .
Se o estado de uma lâmpada não afeta a condição da próxima, podemos supor que:
ℵ   = {X : x = 0,  1,  2,… ,  n}
f(x) = P (X = x) = ( ) ⋅ (p ⋅ (1 − p → x =n
x )x )n−x 0, 1, 2, . . .n
f (x)
f (x) ≥ 0  x ∈ ℵ x = 0, 1, 2, . . . ,n
n
X = n n− 1
X = n
n− 1
p = 0, 1 (1 − p)     =    0, 9
 para  = 
Note que, de acordo com as regras para uma função de probabilidade, temos:
I. para todo 
II. = = =
=
 = 
Logo é uma função de probabilidade válida.
Nota
Nesse exemplo, empregamos a série geométrica para demonstrar que o somatório
das probabilidades para todos os valores de X é igual a 1.
A série geométrica é:
 desde que .
Alternativamente, começarmos a série em k=1.
Já a função de distribuição de probabilidade contínua é uma função que satisfaz as
seguintes condições:
I. , para todo 
II. 
III. para quaisquer a, b, com , teremos
Da de�nição de densidade, segue que para uma v.a. contínua a probabilidade de um
único ponto é zero, isto é, P(X = a) = 0 para qualquer número a.
Exemplo
Considere a seguinte função de densidade de probabilidade: para
. Veri�que se é uma função de densidade de probabilidade válida para o
intervalo considerado.
f(n) = Pr(X = n) = ×   (0, 1)(0, 9)n 1, 2, . . . . . ,n
f (n) > 0  n
f(n)∑∞
n=1 (0, 9 × (0, 1)∑∞
n=1 )n−1 0, 1 (0, 9∑∞
n=1 )n−1
0, 1{1 + 0, 9 + 0, +⋯}92
0, 1{1 + 0, 9 + 0, +⋯}92 0, 1{ } = 11
1−0,9
f (n) = P (X = n)
=∑∞
k=0 a
k 1 + a+ + +⋯=a2 a3 1
1−a |a| < 1
f(x) ≥ 0 x
f (x) dx = 1∫ +∞
−∞
−∞ < a < b < +∞
P (a ≤ X ≤ b) = f(x)dx∫ b
a
f(x) = (x+ 1)/8
2 ≤ x ≤ 4
Figura 2.2 - Grá�co da função f(x) = (x + 1)/8 para 2 ≤ x ≤ 4.
Fonte: Elaborada pela autora.
#PraCegoVer: a imagem apresenta um grá�co de duas dimensões (x e y), em que estão
plotados dois pontos, de coordenadas (2,3/8) e (4,5/8), ligados por uma reta bordô. No
eixo de x (abscissa) estão apresentadas as medidas 0, 2 e 4. No eixo de y (ordenadas)
estão apresentadas as medidas 0, 3/8 e 5/8. A reta que liga os pontos de coordenadas
indicadas tem sentido ascendente.
Para que f( ) seja uma função de densidade de probabilidade válida, devemos ter a
sua área = 1 no domínio da função. Nesse caso, devemos calcular a área sob a
função no intervalo de 2 a 4.
A área dessa região é dada por:
 
Logo f( ) é uma função de densidade de probabilidade, pois sua integral é 1 no seu
domínio de de�nição, e f( ) é sempre maior ou igual a zero.
Vejamos outro exemplo que fortalece essas ideias apresentadas.
Considere c uma constante e X uma variável aleatória contínua com espaço
. A função f( ) = existe para todo . Calcule o valor
de .
Solução
 = = = 1  
x
Área = (4 − 2) =f(4)+f(2)
2 2 = 1
+5
8
3
8
2
x
x
ℵ = {x : 0 < x < 1} x cx3 x ∈ ℵ
c
c  dx∫ 1
0 x3 cx4
4
∣
∣
∣
1
0
c
4 → c = 4
Assim é preciso que para que f( ) seja uma função densidade de no
intervalo (0,1).
Segundo Fonseca e Martins (2012), se X for uma variável aleatória, a sua função de
distribuição de probabilidade acumulada será a soma das probabilidades dos valores
de x.
Assim para todo , sendo F( ) limitado entre (0,1).
Observe que essa de�nição de função de distribuição é a mesma para variáveis
contínuas ou discretas.
Propriedades da função de distribuição
I)      , pois 
II)      é uma função não decrescente
III)     
IV)     
V)     Se X é uma variável aleatória contínua, sua função de distribuição é contínua
Exemplo
Seja X uma variável aleatória com função  de distribuição de�nida por:
O grá�co dessa função de distribuição é mostrado a seguir.
c = 4 x ℵ
F(x) = P (X ≤ x) x x
0  ≤  F (x)   ≤ 1 0  ≤  P (X  ≤  x)   ≤ 1
F (x)
F(x) = 1lim
x→−∞
F(x) = 0lim
x→−∞
F(x) = {    0,
1 − e−x
se x ≤ 0
se x > 0
Figura 2.3 - Grá�co da função .
Fonte: Elaborada pela autora.
#PraCegoVer: a imagem apresenta um grá�co de duas dimensões (x e y), em que está
plotada uma curva, em bordô, partindo das coordenadas (0,0) e assumindo um valor
contínuo, com o limite superior da função em 1. No eixo de x (abscissa) estão
apresentadas as medidas 0, 1, 2, 3, 4 e 5. No eixo de y (ordenadas) estão apresentadas as
medidas 0 e 1. A curva tem sentido ascendente, até atingir o limite da função.
Considere uma variável aleatória discreta com a seguinte função de probabilidade:
 , para 
A função de distribuição é , tal que:
 
F(x) = {    0,
1 − e−x
se x ≤ 0
se x > 0
f (x) = P (X = x) = n!
x!(n−x)!
(0, 5)x(0, 5)n−x x = 0,  1,  2,  3,  4
F (X ≤ x)
F (X ≤ 0) = P (X = 0) =⋅ =4!
0!(4−0)!
(0, 5)0 (0, 5)4−0
1 ⋅ 1 ⋅ = = 0, 06250, 54 1
16
F (X ≤ 1) =P (X = 0) + P (X = 1) =(0, 0625)+
( )4!
1!(4−1)!
(0, 5)1(0, 5)4−1 = 0, 0625 + (4 ⋅ 0, 5 ⋅ ) =0, 53
 0, 0625 + = 0, 0625 + 0, 25 =4
16 0, 3125
F (X ≤ 2) = P (X = 0)+P (X = 1) + P (X = 2) =0, 3125+
(  ⋅ )4!
2!(4−2)!
(0, 5)2 (0, 5)4−2 =  0, 3125 + (6 ) =0.520, 52 0, 3125 + ( ) =6
16
0, 3125 + 0, 375 = 0, 6875
F (X ≤ 3) =P (X = 0)+P (X = 1)+P (X = 2)+P (X = 3)
= 0, 6875 + (  ⋅ )4!
3!(4−3)!
(0, 5)3 (0, 5)4−3 = 0, 6875 + (4 ⋅ ) =0.53 0, 51
Também F(x) = 0 se x < 0 e F(x) = 1 se x > 4.
Considere uma v.a. contínua com densidade f ( ) e função de distribuição acumulada
F( ).
Então: 
Mas:   e    
Então: 
Pelo Teorema Fundamental do Cálculo:
Assim a derivada da função de distribuição é a densidade.
Média (valor esperado ou esperança)
A média é uma medida de tendência central. Na distribuição de probabilidade, é
conhecida por valor esperado ou esperança de uma variável aleatória de�nida,
conforme trazem Fonseca e Martins (2012).
Vejamos um exemplo de aplicação das funções apresentadas.
Seja X uma variável contínua, com densidade f( ) = para .
 0, 6875 + ( ) = 0, 6875 + 0, 25 = 0, 93754
16
F (X ≤ 4) =P (X = 0)+P (X = 1)+P (X = 2) + P (X = 3)+
P (X = 4)= 0, 9375 + (  ⋅ )4!
4!(4−4)!
(0, 5)4 (0, 5)4−4
= 0, 9375 + (1 ⋅ ⋅ 1) = 0, 9375 + ( )0, 54 1
16 = 0, 9375 + 0, 0625 = 1
x
x
Pr (a < x < b) = f (x) dx∫ b
a
F(a) = Pr (x ≤ a) = f (x) dx∫ a
−∞ F(b) = Pr (x ≤ b) =
f (x) dx∫ b
−∞
Pr (a ≤ x ≤ b) = f (x) dx =∫ b
a
F(b) − F(a)
f (x) =
dF (x)
dx
x cx3 0 < x < 1
1) Encontre o valor da constante , de forma que f( ) seja uma  densidade.
2) Encontre a média da variável aleatória, com a distribuição f(x) no intervalo de 0 a 1.
Solução
1) Para que f( ) seja uma densidade, é necessário que a integral da função, no
intervalo dos limites, resulte em uma probabilidade de 1. Para tal, temos a seguinte
função:   , em que =1. Integrando a função, temos:  
 = = 1   .
2) Utilizando a função de média, calcula-se:
 = 
Já a variância, uma medida de dispersão, na distribuição de probabilidade é de�nida
por:
Novamente f( ) representa a densidade de probabilidade (se X contínua) ou a função
de probabilidade (se X é discreta), e é a média da variável aleatória. Observe que a
variância, como para qualquer número real elevado ao quadrado, deve ser uma
quantidade sempre maior ou iguala zero.
c x
x
f (x) dx = 1∫ 1
0 c  dx∫ 1
0 x3
cx4
4
∣
∣
∣
1
0
c
4 → c = 4
xf (x) dx = x (4 )  dx =∫ 1
0 ∫ 1
0 x3 4  dx→ 4 ∗∫ 1
0 x4  x5
5
∣
∣
∣
1
0
= 0, 8   4  
5
x
μ
O desvio padrão, outra medida de dispersão,O desvio padrão, outra medida de dispersão,
tem como característica ser a raiz quadradatem como característica ser a raiz quadrada
da variância e é denotado por da variância e é denotado por , isto é:, isto é:
 
σσ
σσ == ==σσ22−−−−√√ varvar   ((xx))
−− −−−−−−−−−−√√
Observe com atenção as propriedades empregadas no estudo da esperança e da
variância de variáveis aleatórias.
Sejam e constantes, e X uma variável aleatória qualquer. Então:
1)
A esperança de uma variável aleatória multiplicada por uma constante é igual ao
produto da constante pela esperança da variável aleatória.
2) 
A esperança de uma constante é igual a constante.
3) 
A esperança da soma é a soma das esperanças, assim como a esperança das
diferenças é a diferença das esperanças.
4) 
A esperança da multiplicação de duas variáveis aleatórias é a multiplicação das
esperanças.
5) 
A variância de uma constante é igual a zero.
6) 
A variância de uma variável aleatória multiplicada por uma constante é igual ao
produto da constante (ao quadrado) pela variância da variável aleatória.
 
Caso o desvio padrão seja pequeno, signi�caCaso o desvio padrão seja pequeno, signi�ca
que a dispersão existente em torno da médiaque a dispersão existente em torno da média
é pequena também. Quando apresenta umé pequena também. Quando apresenta um
valor grande, signi�ca que as observaçõesvalor grande, signi�ca que as observações
(valores) da variável  aleatória estão muito(valores) da variável  aleatória estão muito
dispersas em torno da média.dispersas em torno da média.
a b
E (a ⋅ X ) =  a ⋅E (X)
E (a)   =  a
E (X ± Y )   =  E (X) ±E (Y )
E (X ⋅ Y )   =  E (X) ⋅E (Y )
VAR (a)   =  0
VAR (a ⋅ X )   =   ⋅ VAR (X)a2
7) 
A variância de soma (ou da diferença) de duas variáveis aleatórias é igual à soma das
variâncias das variáveis aleatórias.
Vejamos um exemplo em que podemos aplicar algumas dessas propriedades.
Considere que o retorno mensal de certo investimento de risco pode ser modelado
pela variável aleatória R, com função de probabilidade dada a seguir.
Para atender à demanda de sua che�a, calcule o retorno esperado (em %) do
investimento e as medidas de desvio padrão e variância.
Resolução
A partir da identi�cação do tipo da variável R, classi�cada como discreta, o retorno
esperado (média) é, por de�nição:
 
A partir do cálculo de µ, veri�ca-se que o retorno esperado seja de 1,5%.
Continuando o atendimento da demanda, a variância de R é:
O desvio padrão de R é .
Assim �nalizamos a demanda identi�cando as três medidas solicitadas: retorno
esperado, variância e desvio padrão.
V (X ± Y ) =  V (X) + V (Y )
µ = (−5) (0 ⋅ 40) + (0) ⋅ (0 ⋅ 15)+ (5) ⋅ (0 ⋅ 25)+     (10) ⋅ (0 ⋅ 15)
+    (15) ⋅ (0 ⋅ 05) = 1, 5
(−5 − 1, 5 ⋅ (0, 40)+σ2 )2 (0 − 1, 5 ⋅ (0, 15)+)2 (5 − 1, 5 ⋅ (0, 25)+)2
(10 − 1, 5 ⋅ (0, 15)+)2 (15 − 1, 5 (0, 05) =)2 40, 25%
σ = = = 6, 344 σ2
−−√ 40, 25− −−−−√
Estude com atenção e domine as propriedades relevantes ao cálculo de esperança,
variância e desvio padrão de variáveis aleatórias. Com elas, pode-se resolver de
forma mais e�ciente e correta medidas de interesse geradas a partir de variáveis
aleatórias.
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Numa indústria de laticínios, o leite produzido é acondicionado em embalagens
conhecidas como Tetra Pak. O processo de envase é executado por máquinas
S A I B A M A I S
Segundo Zerbinatti, Rocha e Abras (2021), na incerteza não se tem o conhecimento sobre a
distribuição de probabilidade dos possíveis eventos futuros. O que a difere de risco, uma
vez que no risco a distribuição de probabilidade envolvida é conhecida. Assim, no artigo
“Incerteza e atividade industrial brasileira: uma abordagem setorial”, os autores trazem um
estudo que analisa os efeitos da incerteza sobre a produção industrial brasileira. O estudo
foi desenvolvido pela estimativa de painéis de efeitos �xos para 17 subsetores da indústria
de transformação.
Acesse em: https://bit.ly/3jL0Jbm.
https://bit.ly/3jL0Jbm
automáticas. Para um teste de nova linha de leite, com peso diferenciado dos
tradicionais, essas máquinas são reguladas para que as embalagens pesem, após o
envaze do produto, em média 400 g. Contudo, pelo grau de precisão da máquina, o
peso real obtido se distribui em torno dessa média com desvio padrão de 3 g.
Supondo que a embalagem tem um peso constante de 20 g, assinale a alternativa
que expresse o valor da média e do desvio padrão do peso bruto da caixa de leite.
a) E(Z) = 400 g. e V(Z) = 1,5 g.
b) E(Z) = 420 g e V(Z) = 9 g.
c) E(Z) = 420 g e V(Z) = 3 g.
d) E(Z) = 400 g e V(Z) = 9 g.
e) E(Z) = 400 g e V(Z) = 3 g.
Em diversas situações práticas, a variável de interesse em um estudo assume dois
valores; por exemplo, a peça é classi�cada como boa ou defeituosa; o entrevistado
concorda ou não com a a�rmação, o produto é ou não e�ciente na opinião dos
clientes.
Vejamos alguns modelos de distribuição que auxiliam em situações de dicotomia,
como os modelos de Bernoulli e binomial. Acompanhe!
i i i ã i
Distribuição de
Bernoulli e binomial
Distribuição de Bernoulli
Considere um experimento em que existem apenas dois resultados possíveis:
sucesso, atribuído pelo valor 1,  e apresenta o caso de acontecer o evento desejado, e
fracasso atribuído pelo valor 0, e apresenta o caso de o evento esperado não se
realizar. Esse tipo de experimento é chamadode ensaio de Bernoulli (ou distribuição
de Bernoulli). Considerando p igual à probabilidade de sucesso, tem-se que a notação
para essa variável aleatória discreta é dada por: X ~ Bernoulli(p).
A distribuição de Bernoulli serve como ponto de partida  para o desenvolvimento de
modelos mais elaborados, como a distribuição binomial.
Seja X uma variável aleatória com apenas dois resultados: sucesso (1) e fracasso (0).
Assim:
, com 
Assim pode-se reescrever a função de probabilidade como:
 em que 
Conheça quais são seus parâmetros característicos.
Média
Assim a esperança de uma variável aleatória discreta sob a distribuição de Bernoulli é
a proporção de sucessos.
f  (1) =  P ( X =  1) =  p 0 < p < 1
f  (0)   = P ( X =  0) =  1  −  p  =  q
f(x) = P (X = x) = (1 − ppx )1−x x = 0, 1
E(X) = = P (xi) =μ(x) ∑
0
1
xi 0.(1 − p) + 1.p→ 0.q+ 1.p = p
Variância
 e , calculada anteriormente, é p.
Temos: 
Vejamos, a seguir, um modelo de distribuição que compreende um pouco mais de
complexidade em situações de dicotomia de eventos possíveis.
Distribuição binomial
Assim como a distribuição de Bernoulli, a distribuição binomial tem apenas dois
resultados possíveis e mutuamente exclusivos, como sucesso e fracasso. Contudo,
estudante, não se está interessado em apenas uma ocorrência, mas, sim, em
múltiplas, em que o experimento é repetido determinada quantidade ( ) de vezes,
sob as mesmas condições, de modo que as probabilidades de sucesso (p) e falha (q
=1-p) se mantêm inalteradas a cada repetição.
Assim os ensaios são independentes, ou seja, o resultado de um ensaio não afeta o
resultado dos demais ensaios considerados no experimento em estudo. Os
parâmetros envolvidos são: p, que denota a probabilidade de ocorrência do evento de
interesse no ensaio, e n, que denota o número de ensaios de interesse no
experimento em estudo. Com isso, uma variável aleatória que segue uma distribuição
binomial é representada da seguinte forma: .
Essa variável aleatória X, que considera o número  de sucessos em n repetições de
uma dada experiência, é uma variável aleatória discreta, com valores possíveis
.
Observe a função de probabilidade:
, onde
Vejamos os parâmetros característicos do modelo de distribuição binomial e suas
respectivas funções.
= E [ ]   =σ2x ( − μ)xi
2  E ( )−x2i μ2x
E ( ) =   P ( ) =x2i ∑1
0 x2i xi q+ p = p;02 12 μx
= p− = p (1 − p) = = pqσ2x p2 σ2x
V (X)   =  pq
n
X Bin(n, p)
0, 1, 2, . . . ,n
f(x) = P (X = x) =( ) (1 − p =n
x px )n−x (1 − pn!
x!(n−x)!
px )n−x
x  = 0, 1, 2, . . . ,n
Média (esperança da variável aleatória)
 
Variância
, em que . Caso seja de interesse a veri�cação do
desvio padrão da variável aleatória, basta retirar a raiz quadrada da variância
calculada.
Observação: a distribuição de Bernoulli é apenas um caso particular da binomial, em
que n = 1. Logo segue que a média e a variância de uma variável Bernoulli(p) são,
respectivamente, p e p.q.
Vejamos um exemplo em que a variável aleatória de interesse segue uma distribuição
binomial e a forma de resolução da função.
Considerando um grupo de clientes VIP com cadastro em uma empresa, a
probabilidade de um dos membros realizar uma compra de produtos em uma ação
promocional de marketing é de 15%.
Qual é a probabilidade de que, entre 5 clientes interessados na ação, exatamente 3
realizem uma compra?
Dados do problema
Número de ensaios: 
Número de eventos de interesse: 
Parâmetro que caracteriza a proporção de interesse (sucesso): 
Utilizando as medidas informadas, segue-se para a resolução:
Conclusão: a probabilidade de que, entre 5 clientes interessados na ação, exatamente
3 realizem uma compra é de, aproximadamente, 2,44.
E (X) = n ⋅ p
VAR (X) = n ⋅ p ⋅ q q = (1 − p)
n = 5
x = 3
p = 0, 15
P (X = 3) = = 0, 024
5!
3! 2!
(0, 15)3(0, 85)2
Agora que abordamos os conceitos necessários ao estudo de uma variável aleatória
que siga uma distribuição binomial, vamos colocá-los em prática?
praticar
Vamos Praticar
Uma grande companhia está passando por di�culdades �nanceiras. Entre as
diversas propostas para a resolução do problema está mudar as principais fábricas
para países subdesenvolvidos, onde a mão de obra é mais barata e não há
preocupação com o descarte de resíduos. Diante disso, supõe-se que 30% dos
acionistas são  favoráveis a essa proposta. Toma-se uma amostra de 20 acionistas
para o estudo do caso.
Calcule as probabilidades de 4, 5, 6 ou 7 dos acionistas amostrados serem
favoráveis à proposta.
Sigamos nos modelos probabilísticos das variáveis aleatórias discretas que
consideram o período de ocorrência como parte das informações relevantes.
A distribuição de probabilidade de Poisson está relacionada a experiências que
modelam o número de ocorrências de um evento dentro de determinado intervalo de
tempo (ou espaço) quando esses eventos ocorrem com uma taxa média conhecida.
Vejamos alguns  exemplos.
Número de carros que passam por uma estrada no  intervalo de uma hora.
Número de buracos por km de uma rodovia.
Distribuição de
Poisson
Número de assassinatos num �nal de semana.
Número de defeitos por metro de tecido produzido.
Número de erros de digitação numa página de texto.
Número de mutações num trecho de DNA após a   exposição a certa
quantidade de radiação.
As ocorrências são independentes e independem do tempo em que o último evento
aconteceu. Além disso, as ocorrências em subintervalos mutuamente exclusivos
também são independentes.
Segundo Fonseca e Martins (2012), o modelo de Poisson tem as seguintes hipóteses.
H1: a probabilidade de uma ocorrência em um intervalo (ou , ou...) é constante e
proporcional ao tamanho do intervalo, isto é, .
H2: a probabilidade de mais de uma ocorrência em um intervalo (ou , ou...) é
igual a zero, isto é, .
H3: o número de ocorrências constitui variáveis aleatórias independentes.
Assim a função de probabilidade de Poisson apresenta o seguinte modelo
matemático:
Em que:
 = coe�ciente de proporcionalidade, ou taxa de frequência por unidade de tempo,
área
= tempo, área
 = base do logaritmo natural (2,71828)
= número de ocorrências (sucessos)
A distribuição foi descoberta por Siméon Denis Poisson (1781-1840) e publicada em
1838 no trabalho “Recherches sur la probabilité des jugements en matières criminelles
et matière civile”.
δt δS
P (X = 1, δt) = γδt
δt  δS
P (X > 1, δt) = 0
P (X = x, t) =
×(γt)x e−γt
x!
γ
t
e
x
Uma distribuição de Poisson modela bem eventos raros. Fenômenos raros são
aqueles que não acontecem com grande frequência para qualquer intervalo de tempo
de observação (COSTA, 2012).
A distribuição de probabilidade de Poisson tem µ como seu parâmetro e é
representada da seguinte forma: X ~ Poisson(µ).
E apresenta os seguintes parâmetros característicos.
Média
Variância
Exemplo
O número médio de funcionários que são contratados por uma fábrica, num período
de 15 meses, é 10.
Qual é a probabilidade dessa fábrica contratar exatamente 5 funcionários em 15
meses?
Resolução
Vejamos a seguir, no infográ�co, um resumo das distribuições de probabilidades para
variáveis discretas que estudamos até agora. Vamos lá?
E(X) = µ = γt
VAR(X) = µ = γt
μ = 10
x = 5
f (5) = P (X = 5) =   = 0, 0378105e−10
5!
#PraCegoVer: o infográ�co apresenta três banners retangulares horizontais, um
sobreposto a outro. O primeiro, de cima para baixo, descreve “Distribuição Bernoulli
(X~Bernoulli (p), tal que X = 0,1): o experimento ocorre um certo número de vezes.
Utilizado quando estamos interessados na ocorrência de sucesso ou de fracasso. A v.a.
assume apenas dois valores: 1, se ocorrer sucesso (p); e 0, se ocorrer fracasso (1-p)”. O
segundo descreve “Distribuição Binomial (X~B(n,p), tal que X = 0,1,2,...,n): ocorre quando
repetimos um ensaio de Bernoulli n vezes, sempre nas mesmas condições. Lembrando
que o interesse permanece em uma variável aleatória com eventos dicotômicos e
mutuamente exclusivos: sucesso x fracasso em tantos ensaios, acerta x, erra em tantas
tentativas”. O terceiro descreve “Distribuição de Poisson(X~Poisson (µ),m, tal que X =
0,1,2,...): o número de ocorrência de eventos dentro de determinado intervalo de tempo,
espaço quando esses eventos ocorrem com uma taxa média conhecida. Características: a
probabilidade de uma ocorrência é a mesma para intervalos iguais. As ocorrências são
independentes e independem do tempo do último evento”.
Agora que �nalizamos nosso material de estudos, vamos a uma questão prática para
treinar nossas habilidades. Vamos lá?
praticar
Vamos Praticar
Uma empresa disponibilizou um número de telefone para atendimento ao cliente.
No entanto sabe-se que a quantidade de ligações por minuto é uma variável
aleatória de Poisson com média de 3 chamadas por minuto.
Qual é a probabilidade de o número de chamadas num minuto ser maior que 4?
Material
Complementar
F I L M E
O homem que mudou o jogo
Ano: 2011
Comentário: o �lme é baseado na história real de Billy Beane,
retratada por Michael Lewis no livro “Moneyball: the art of
winning an unfair game”. O grande desa�o de Billy foi construir
um time de beisebol competitivo para a temporada de 2002. Um
treinador visionário que fundamentou suas escolhas em
estatísticas e análises de dados para melhorar a performance do
seu time. Ele contratou um cientista que estudou a proporção de
acerto dos jogadores, substituindo assim o sexto sentido
ancorado em expectativas dos olheiros.
Disponível em:
TRA I LER
L I V R O
Controle estatístico de qualidade
Autor: Jay L. Devore
Editora: Cengage Learning
Capítulo: 2
Ano: 2018
ISBN: 9788522128044
Comentário: o uso de modelos probabilísticos e métodos
estatísticos para a análise de dados tem se tornado uma prática
comum em praticamente todas as disciplinas cientí�cas. Este
livro, em especial o Capítulo 2, oferece uma introdução
abrangente àqueles modelos e métodos com maior
probabilidade de serem encontrados e usados por estudantes de
engenharia e ciências naturais. Embora os exemplos e exercícios
tenham sido desenvolvidos para cientistas e engenheiros, a
maior parte dos métodos abordados é básica para análises
estatísticas e para muitas outras disciplinas, de modo que
estudantes de administração e ciências sociais também se
bene�ciarão com a leitura do livro. Disponível na Biblioteca
Virtual.
Conclusão
Caro(a) estudante, neste material, foi possível conhecer algumas das distribuições de
probabilidades de variáveis aleatórias discretas, como a distribuição de probabilidade de
Bernoulli, a distribuição de probabilidade binomial e a distribuição de probabilidade de
Poisson. Entre elas, existem outras distribuições de probabilidade, como hipergeométrica,
exponencial, binomial negativa etc.
Caro(a) estudante, a con�abilidade e a aceitação dos resultados obtidos pelos processos
de medição são muito relevantes no âmbito das questões metrológicas. Basicamente,
nenhum tipo de medição que possa ser realizada representa o verdadeiro valor mensurado.
Essa variação normalmente é explicada pelas limitações inerentes ao processo
dimensional, as quais limitam as quantidades de medições que podem ser realizadas,
assim como está associada aos efeitos das demais variações que possam estar
presentes.
Dessa forma, o estudo proposto aqui não de�ne e tampouco limita as áreas de
conhecimentos a serem pesquisadas. Sempre temos que procurar estudar e aprender mais
e mais! Nos vemos, até breve!
Referênci
as
COSTA, G. G. de O. Curso de
estatística inferencial e
probabilidades: teoria e prática. São
Paulo: Grupo GEN, 2012. (Disponível
na Minha Biblioteca).
DEVORE, J. L. Probabilidade e
estatística para engenharia e
ciências. São Paulo: Cengage
Learning, 2018. (Disponível na
Biblioteca Virtual).
FONSECA, J. S. da.; MARTINS, G. de A. Curso de estatística. 6. ed. São Paulo: Grupo GEN,
2012. (Disponível na Minha Biblioteca).
MARTINS, G. de A.; DOMINGUES, O. Estatística geral e aplicada. 6. ed. São Paulo: Grupo
GEN, 2017. (Disponível na Minha Biblioteca).
MEYER, P. L. Probabilidade: aplicações à estatística. São Paulo: Grupo GEN, 2010.
(Disponível na Minha Biblioteca).  
MORETTIN, P. A.; BUSSAB, W. de O. Estatística básica. São Paulo: Editora Saraiva, 2017.
(Disponível na Minha Biblioteca).  
O HOMEM que mudou o jogo | Trailer legendado | Em exibição nos cinemas. [S. l.: s. n.],
2012. 1 vídeo (2 min.). Publicado pelo canal Sony Pictures Brasil. Disponível em:
https://www.youtube.com/watch?v=BumI-Yh0P1M. Acesso em: 10 fev. 2023.
O QUE é distribuição binominal e como calcular? Con�ra exemplos! Labone, [2023].
Disponível em: https://www.laboneconsultoria.com.br/distribuicao-binomial/. Acesso em: 2
fev. 2023.
O PRAZER da estatística. Direção de Dan Hillman. Reino Unido: BBC, 2010. (59 min).
ZERBINATTI, A. S.; ROCHA, B. de P.; ABRAS, A. L. G. Incerteza e atividade industrial
brasileira: uma abordagem setorial. Nova Economia, Belo Horizonte, v. 31, n. 2, p. 455-485,
2021. Disponível em: https://www.scielo.br/j/neco/a/m48Mx6bj6yPGZGBJn5rHBww/?
format=pdf&lang=pt. Acesso em: 2 fev. 2023.
https://www.youtube.com/watch?v=BumI-Yh0P1M
https://www.laboneconsultoria.com.br/distribuicao-binomial/
https://www.scielo.br/j/neco/a/m48Mx6bj6yPGZGBJn5rHBww/?format=pdf&lang=pt
https://www.scielo.br/j/neco/a/m48Mx6bj6yPGZGBJn5rHBww/?format=pdf&lang=pt

Mais conteúdos dessa disciplina