Prévia do material em texto
TÓPICOS ESPECIAISTÓPICOS ESPECIAIS INTEGRADORES EMINTEGRADORES EM ESTATÍSTICAESTATÍSTICA APLICAÇÕES DAAPLICAÇÕES DA ESTATÍSTICA NA INDÚSTRIAESTATÍSTICA NA INDÚSTRIA DE TRANSFORMAÇÃO —DE TRANSFORMAÇÃO — DISTRIBUIÇÕES DEDISTRIBUIÇÕES DE PROBABILIDADESPROBABILIDADES Au to r ( a ) : M a . V i v i a n e d e J e s u s L e i t e M a . A l e x a n d ra Wa l t r i c k R u s s i Pa re c e r i s t a : A n d ré d a S i l va C o u ra Tempo de leitura do conteúdo estimado em 1 hora e 5 minutos. Introdução Olá, estudante. Durante o trabalho com dados coletados, você vai perceber e entender que algumas variáveis aleatórias têm um certo padrão no comportamento. Para esses casos foram desenvolvidas funções, modelos matemáticos, ou distribuições de probabilidades, além de fórmulas para medidas de interesse (média e variância). Neste material, você será apresentado(a) aos conceitos de variáveis aleatórias (discretas e contínuas), de distribuição de probabilidade, a alguns modelos de distribuição, como as distribuições discretas, de Bernoulli e seu desdobramento: a distribuição binomial e a distribuição de Poisson. Vamos lá, então? Bons estudos! O objetivo da análise de conglomerados, também conhecida como análise de agrupamentos ou de cluster, é particionar um conjunto de dados em grupos que são internamente homogêneos e externamente distintos, ou seja, segmentar ou agrupar Variáveis aleatórias discretas e contínuas em grupos menores (subgrupos). A classi�cação é realizada com base em uma medida de similaridade ou dissimilaridade dentro e entre os grupos. O exemplo mais utilizado, inclusive apresentado por Meyer (2010), é o de lançamentos de moedas. Uma informação relevante é que para a delimitação das probabilidades é preciso declarar a chance de ocorrência de cada lançamento ou informar que se trata do lançamento de moeda honesta ou equilibrada, garantindo que o leitor entenda que cada lançamento tem 50% de ocorrência. De acordo com o exemplo de Meyer (2010), assumamos como S o espaço amostral do lançamento de duas moedas: . A variável aleatória desse experimento assumida como é o número de caras veri�cadas no lançamento das moedas. Assume-se também que é uma ocorrência de coroa. H e T têm a mesma chance de ocorrência, assumindo assim que se trata de moedas equilibradas. Veri�cam-se então os possíveis eventos nesse experimento: , e . É importante destacar que as letras maiúsculas denotam as variáveis aleatórias, e as minúsculas os valores especí�cos dessas variáveis aleatórias (números). Observe a representação da função de variável aleatória, descrita anteriormente. S = {HH, HT , TH, TT} X (H) (T ) X (HH) = 2 X (HT ) = X (TH) = 1 X (TT ) = 0 Figura 2.1 - Representação de função da variável aleatória X no espaço amostral S e com os possíveis valores de . Fonte: Adaptada de Meyer (2010, p. 67). #PraCegoVer: no topo central da �gura, lê-se: “S – espaço amostral de = valores possíveis de X”. Logo abaixo, há dois espaços (circulares e irregulares) lado a lado; à esquerda há um ponto com a identi�cação da letra s minúscula (valores do experimento), interligado por uma linha, cuja informação atrelada a ela é X (variável aleatória), até o círculo irregular disposto à direita, até um outro ponto, identi�cado como . Conforme Hair et al. (2009), para realizar uma análise de cluster cuidadosa, são necessários métodos com as seguintes características: E: lançar duas moedas equiprováveis. X: número de caras no lançamento das duas moedas. X = 0, em que não há ocorrência de alguma cara, evento (TT) com probabilidade de ou 25% ou ainda 0,25. X = 1, em que há ocorrência de apenas uma cara, evento (HT, TH) com probabilidade de ou 50% ou 0,50. X = 2, em que há ocorrência de duas caras, evento (HH) com probabilidade de ou 25% ou 0,25. xs εRx X(s) 1 4 2 4 1 4 Ao tratar de variáveis aleatórias, é importante ter ciência e distinguir os dois tipos importantes segundo sua natureza: discretas e contínuas. Variável aleatória discreta De forma geral, o Código de Nuremberg estabeleceu que nenhum ser humano poderia ser submetido a projetos de pesquisa sem o seu devido consentimento, sendo o primeiro documento a ter alcance internacional, por conta, principalmente, do repúdio da comunidade internacional quanto aos crimes cometidos no período nazi- fascista (PALÁCIOS; REGO; SCHRAMM, 2009). A necessidade de regulamentação de pesquisas em seres humanos, para proteger seus participantes, e o desejo do corpo médico ter sua própria regulamentação foram motivações para a criação da Declaração de Helsinque, a qual foi aprovada pela Associação Médica Mundial, e cuja primeira versão é de 1964 (PALÁCIOS; REGO; SCHRAMM, 2009). a. X: número de funcionários em certa empresa. b. Y: resultado do lançamento de um dado honesto. c. L: número de ligações recebidas em uma central de telemarketing ao longo de um turno de trabalho. d. P: número de peças produzidas ao longo de 30 dias por uma máquina. e. R: número de reclamações recebidas em 30 dias pela ouvidoria de uma indústria. Estudante, perceba que todas as variáveis aleatórias discretas citadas estão indicadas com letras maiúsculas e remetem a valores enumeráveis (�nitos e contáveis). É importante destacar que quando uma variável de interesse é in�uenciada pela aleatoriedade trata-se de uma variável aleatória. Em 1988, o Conselho Nacional de Saúde (CNS) do Brasil estabeleceu normas que tratam da ética em pesquisa com seres humanos e, em 10 de outubro de 1996, aprovou as diretrizes/normas que regulamentam pesquisas com seres humanos, denominada Resolução 196/96 (PALÁCIOS; REGO; SCHRAMM, 2009). A Resolução 196/96 estabeleceu princípios básicos para permitir apreciação da ética em protocolos de pesquisa, criando os Comitês de Ética em Pesquisa (CEP) e a Comissão Nacional de Ética em Pesquisa (Conep). O conteúdo da resolução incorpora as experiências históricas da regulamentação sobre ética em pesquisa, principalmente com base no Código de Nuremberg (1947), na Declaração dos Direitos Humanos (1948), na Declaração de Helsinque (desde a primeira versão de 1964), nas Diretrizes Internacionais para a Revisão Ética de Estudos Epidemiológicos e nas Diretrizes Éticas Internacionais para Pesquisas Biomédicas Envolvendo Seres Humanos, assim como em conteúdos de leis promulgadas após a aprovação da Constituição de 1988 (PALÁCIOS; REGO; SCHRAMM, 2009; NOVOA, 2014). Variável aleatória contínua Samohyl (2009) estabelece que o grá�co de soma acumulada (CUSUM) é um aprimoramento do grá�co de controle X de Shewhart, este, de�nido como sendo a forma de monitoramento da média de um processo especí�co cuja característica de qualidade de interesse X é uma grandeza mensurável representada. Assim sendo, o CUSUM é o mais apropriado para se reconhecer o histórico dos dados, característica ausente em grá�cos mais simples, e também para identi�car pequenas alterações nos processos muito antes dos alarmes dos grá�cos X, considerados como LSC e LIC. Vejamos alguns exemplos para deixar o entendimento mais claro. a. X: tempo de processamento de uma máquina de empacotar. b. Y: peso real de um pacote de 5 kg de arroz. c. Z: quantidade de água, em litros, em um reservatório utilizado para resfriar a turbina de uma usina. d. P: custo de construção de uma nova área em determinada fábrica. e. R: custo de lançamento de uma campanha publicitária. f. K: altura de mulheres brasileiras na faixa etária de 20 a 40 anos. g. T: tempo de vida de uma bateria de celular. μμ h. I: índice de in�ação em certo mês de um país. Como já foi mencionado, variáveis aleatórias contínuas podem assumir quaisquer valores dentro de um intervalo de números reais, ou seja, pode assumir in�nitos valores. Por essa razão, não é possível o cálculo de probabilidade para um valor especí�co, como nas variáveis aleatórias discretas. Nas contínuas, a probabilidade de um ponto especí�co no intervalo de dados é zero. Assim como para distribuições de probabilidadesdiscretas tem-se o conceito de função de probabilidade ( ), para as distribuições de probabilidades contínuas tem-se a função densidade de probabilidade, representada por f( ). Apesar de a eticidade e a cienti�cidade da pesquisa cientí�ca, em especial, daquela realizada com seres humanos, serem aspectos que caminham juntos, não cabe aos Comitês de Ética em Pesquisa (CEP) a emissão de pareceres sobre a metodologia utilizada no desenvolvimento dos estudos (NOVOA, 2014). Conhecimento Teste seus Conhecimentos (Atividade não pontuada) Leia o caso a seguir: Uma costureira precisava confeccionar 50 camisas. Para terminar uma camisa, ela sabe que leva um total de 2 horas costurando. Antes de iniciar a demanda de produção, a costureira veri�ca que o fusível da máquina havia queimado. Sabendo que o tempo de vida útil de um fusível é de 1.000 horas, ela considerou pegar de outra máquina um fusível que já tinha 150 horas de uso. Ela então calcula e probabilidade de o fusível queimar antes de entregar a costura das 50 camisas. Para calcular a probabilidade corretamente, o primeiro passo é identi�car o tipo de variável que se tem interesse. p ( )xi x Assinale a alternativa correta que aponta qual é o tipo de variável aleatória com o qual a costureira está lidando. a) Número discreto b) Variável aleatória discreta. c) Variável bimodal. d) Variável aleatória contínua. e) Número contínuo. Prezado(a) estudante, a distribuição de probabilidade, no caso de variáveis aleatórias discretas, é uma função que relaciona a probabilidade de um evento a uma variável aleatória discreta. A função de probabilidade discreta deve satisfazer, conforme Martins e Domingues (2017), se a cada resultado de associa-se um número , denominado probabilidade de , tal que duas condições sejam satisfeitas: para todo e . Não existem sistemas de medição que possam ser classi�cados como ideais. Dessa forma, é atribuição direta dos engenheiros de�nir e implantar sistemas de medição que apresentem propriedades estatísticas consideradas adequadas. Distribuição de probabilidade xi P ( ) = P (X = )xi xi xi ( ) ≥ 0p∞ xi xi p( ) = 1∑∞ i=1 x1 Exemplo Seja X uma variável aleatória discreta com espaço . Seja . Note que é uma função de probabilidade, pois: I. para todo , isto é, A pesquisa epidemiológica tem por base a coleta sistemática de dados sobre eventos associados, principalmente, à saúde das pessoas pertencentes a populações de interesse. O tratamento analítico dado aos fatores pesquisados tem base em três procedimentos, a saber, a mensuração de variáveis aleatórias, a estimação de parâmetros populacionais e o uso de testes estatísticos (BLOCH; COUTINHO, 2009). Exemplo Uma fábrica de lâmpadas garante que a probabilidade de uma lâmpada produzida ser defeituosa é de 10%. Testam- se as lâmpadas até que a primeira defeituosa seja encontrada. Sendo X o número de testes realizados até encontrar a primeira lâmpada com defeito, encontre a função de probabilidade de X. Solução Considere P para lâmpada sem defeito, e D para lâmpada defeituosa. O espaço amostral é constituído por sequências como: D, PD, PPD, PPPD, PPPP... D, uma vez que testam-se tantas lâmpadas quantas forem necessárias até localizar a primeira defeituosa. Logo os valores possíveis de X são: 1, 2, ..., (não há um valor máximo pré-de�nido). Mas se, e somente se, as ( ) primeiras lâmpadas testadas estão boas e a n-ésima tem defeito. Isto é, corresponde à sequência PPPPPPP...PD, que tem lâmpadas boas e 1 com defeito. Lembrando que, de acordo com os dados apresentados, e . Se o estado de uma lâmpada não afeta a condição da próxima, podemos supor que: ℵ = {X : x = 0, 1, 2,… , n} f(x) = P (X = x) = ( ) ⋅ (p ⋅ (1 − p → x =n x )x )n−x 0, 1, 2, . . .n f (x) f (x) ≥ 0 x ∈ ℵ x = 0, 1, 2, . . . ,n n X = n n− 1 X = n n− 1 p = 0, 1 (1 − p) = 0, 9 para = Note que, de acordo com as regras para uma função de probabilidade, temos: I. para todo II. = = = = = Logo é uma função de probabilidade válida. Nota Nesse exemplo, empregamos a série geométrica para demonstrar que o somatório das probabilidades para todos os valores de X é igual a 1. A série geométrica é: desde que . Alternativamente, começarmos a série em k=1. Já a função de distribuição de probabilidade contínua é uma função que satisfaz as seguintes condições: I. , para todo II. III. para quaisquer a, b, com , teremos Da de�nição de densidade, segue que para uma v.a. contínua a probabilidade de um único ponto é zero, isto é, P(X = a) = 0 para qualquer número a. Exemplo Considere a seguinte função de densidade de probabilidade: para . Veri�que se é uma função de densidade de probabilidade válida para o intervalo considerado. f(n) = Pr(X = n) = × (0, 1)(0, 9)n 1, 2, . . . . . ,n f (n) > 0 n f(n)∑∞ n=1 (0, 9 × (0, 1)∑∞ n=1 )n−1 0, 1 (0, 9∑∞ n=1 )n−1 0, 1{1 + 0, 9 + 0, +⋯}92 0, 1{1 + 0, 9 + 0, +⋯}92 0, 1{ } = 11 1−0,9 f (n) = P (X = n) =∑∞ k=0 a k 1 + a+ + +⋯=a2 a3 1 1−a |a| < 1 f(x) ≥ 0 x f (x) dx = 1∫ +∞ −∞ −∞ < a < b < +∞ P (a ≤ X ≤ b) = f(x)dx∫ b a f(x) = (x+ 1)/8 2 ≤ x ≤ 4 Figura 2.2 - Grá�co da função f(x) = (x + 1)/8 para 2 ≤ x ≤ 4. Fonte: Elaborada pela autora. #PraCegoVer: a imagem apresenta um grá�co de duas dimensões (x e y), em que estão plotados dois pontos, de coordenadas (2,3/8) e (4,5/8), ligados por uma reta bordô. No eixo de x (abscissa) estão apresentadas as medidas 0, 2 e 4. No eixo de y (ordenadas) estão apresentadas as medidas 0, 3/8 e 5/8. A reta que liga os pontos de coordenadas indicadas tem sentido ascendente. Para que f( ) seja uma função de densidade de probabilidade válida, devemos ter a sua área = 1 no domínio da função. Nesse caso, devemos calcular a área sob a função no intervalo de 2 a 4. A área dessa região é dada por: Logo f( ) é uma função de densidade de probabilidade, pois sua integral é 1 no seu domínio de de�nição, e f( ) é sempre maior ou igual a zero. Vejamos outro exemplo que fortalece essas ideias apresentadas. Considere c uma constante e X uma variável aleatória contínua com espaço . A função f( ) = existe para todo . Calcule o valor de . Solução = = = 1 x Área = (4 − 2) =f(4)+f(2) 2 2 = 1 +5 8 3 8 2 x x ℵ = {x : 0 < x < 1} x cx3 x ∈ ℵ c c dx∫ 1 0 x3 cx4 4 ∣ ∣ ∣ 1 0 c 4 → c = 4 Assim é preciso que para que f( ) seja uma função densidade de no intervalo (0,1). Segundo Fonseca e Martins (2012), se X for uma variável aleatória, a sua função de distribuição de probabilidade acumulada será a soma das probabilidades dos valores de x. Assim para todo , sendo F( ) limitado entre (0,1). Observe que essa de�nição de função de distribuição é a mesma para variáveis contínuas ou discretas. Propriedades da função de distribuição I) , pois II) é uma função não decrescente III) IV) V) Se X é uma variável aleatória contínua, sua função de distribuição é contínua Exemplo Seja X uma variável aleatória com função de distribuição de�nida por: O grá�co dessa função de distribuição é mostrado a seguir. c = 4 x ℵ F(x) = P (X ≤ x) x x 0 ≤ F (x) ≤ 1 0 ≤ P (X ≤ x) ≤ 1 F (x) F(x) = 1lim x→−∞ F(x) = 0lim x→−∞ F(x) = { 0, 1 − e−x se x ≤ 0 se x > 0 Figura 2.3 - Grá�co da função . Fonte: Elaborada pela autora. #PraCegoVer: a imagem apresenta um grá�co de duas dimensões (x e y), em que está plotada uma curva, em bordô, partindo das coordenadas (0,0) e assumindo um valor contínuo, com o limite superior da função em 1. No eixo de x (abscissa) estão apresentadas as medidas 0, 1, 2, 3, 4 e 5. No eixo de y (ordenadas) estão apresentadas as medidas 0 e 1. A curva tem sentido ascendente, até atingir o limite da função. Considere uma variável aleatória discreta com a seguinte função de probabilidade: , para A função de distribuição é , tal que: F(x) = { 0, 1 − e−x se x ≤ 0 se x > 0 f (x) = P (X = x) = n! x!(n−x)! (0, 5)x(0, 5)n−x x = 0, 1, 2, 3, 4 F (X ≤ x) F (X ≤ 0) = P (X = 0) =⋅ =4! 0!(4−0)! (0, 5)0 (0, 5)4−0 1 ⋅ 1 ⋅ = = 0, 06250, 54 1 16 F (X ≤ 1) =P (X = 0) + P (X = 1) =(0, 0625)+ ( )4! 1!(4−1)! (0, 5)1(0, 5)4−1 = 0, 0625 + (4 ⋅ 0, 5 ⋅ ) =0, 53 0, 0625 + = 0, 0625 + 0, 25 =4 16 0, 3125 F (X ≤ 2) = P (X = 0)+P (X = 1) + P (X = 2) =0, 3125+ ( ⋅ )4! 2!(4−2)! (0, 5)2 (0, 5)4−2 = 0, 3125 + (6 ) =0.520, 52 0, 3125 + ( ) =6 16 0, 3125 + 0, 375 = 0, 6875 F (X ≤ 3) =P (X = 0)+P (X = 1)+P (X = 2)+P (X = 3) = 0, 6875 + ( ⋅ )4! 3!(4−3)! (0, 5)3 (0, 5)4−3 = 0, 6875 + (4 ⋅ ) =0.53 0, 51 Também F(x) = 0 se x < 0 e F(x) = 1 se x > 4. Considere uma v.a. contínua com densidade f ( ) e função de distribuição acumulada F( ). Então: Mas: e Então: Pelo Teorema Fundamental do Cálculo: Assim a derivada da função de distribuição é a densidade. Média (valor esperado ou esperança) A média é uma medida de tendência central. Na distribuição de probabilidade, é conhecida por valor esperado ou esperança de uma variável aleatória de�nida, conforme trazem Fonseca e Martins (2012). Vejamos um exemplo de aplicação das funções apresentadas. Seja X uma variável contínua, com densidade f( ) = para . 0, 6875 + ( ) = 0, 6875 + 0, 25 = 0, 93754 16 F (X ≤ 4) =P (X = 0)+P (X = 1)+P (X = 2) + P (X = 3)+ P (X = 4)= 0, 9375 + ( ⋅ )4! 4!(4−4)! (0, 5)4 (0, 5)4−4 = 0, 9375 + (1 ⋅ ⋅ 1) = 0, 9375 + ( )0, 54 1 16 = 0, 9375 + 0, 0625 = 1 x x Pr (a < x < b) = f (x) dx∫ b a F(a) = Pr (x ≤ a) = f (x) dx∫ a −∞ F(b) = Pr (x ≤ b) = f (x) dx∫ b −∞ Pr (a ≤ x ≤ b) = f (x) dx =∫ b a F(b) − F(a) f (x) = dF (x) dx x cx3 0 < x < 1 1) Encontre o valor da constante , de forma que f( ) seja uma densidade. 2) Encontre a média da variável aleatória, com a distribuição f(x) no intervalo de 0 a 1. Solução 1) Para que f( ) seja uma densidade, é necessário que a integral da função, no intervalo dos limites, resulte em uma probabilidade de 1. Para tal, temos a seguinte função: , em que =1. Integrando a função, temos: = = 1 . 2) Utilizando a função de média, calcula-se: = Já a variância, uma medida de dispersão, na distribuição de probabilidade é de�nida por: Novamente f( ) representa a densidade de probabilidade (se X contínua) ou a função de probabilidade (se X é discreta), e é a média da variável aleatória. Observe que a variância, como para qualquer número real elevado ao quadrado, deve ser uma quantidade sempre maior ou iguala zero. c x x f (x) dx = 1∫ 1 0 c dx∫ 1 0 x3 cx4 4 ∣ ∣ ∣ 1 0 c 4 → c = 4 xf (x) dx = x (4 ) dx =∫ 1 0 ∫ 1 0 x3 4 dx→ 4 ∗∫ 1 0 x4 x5 5 ∣ ∣ ∣ 1 0 = 0, 8 4 5 x μ O desvio padrão, outra medida de dispersão,O desvio padrão, outra medida de dispersão, tem como característica ser a raiz quadradatem como característica ser a raiz quadrada da variância e é denotado por da variância e é denotado por , isto é:, isto é: σσ σσ == ==σσ22−−−−√√ varvar ((xx)) −− −−−−−−−−−−√√ Observe com atenção as propriedades empregadas no estudo da esperança e da variância de variáveis aleatórias. Sejam e constantes, e X uma variável aleatória qualquer. Então: 1) A esperança de uma variável aleatória multiplicada por uma constante é igual ao produto da constante pela esperança da variável aleatória. 2) A esperança de uma constante é igual a constante. 3) A esperança da soma é a soma das esperanças, assim como a esperança das diferenças é a diferença das esperanças. 4) A esperança da multiplicação de duas variáveis aleatórias é a multiplicação das esperanças. 5) A variância de uma constante é igual a zero. 6) A variância de uma variável aleatória multiplicada por uma constante é igual ao produto da constante (ao quadrado) pela variância da variável aleatória. Caso o desvio padrão seja pequeno, signi�caCaso o desvio padrão seja pequeno, signi�ca que a dispersão existente em torno da médiaque a dispersão existente em torno da média é pequena também. Quando apresenta umé pequena também. Quando apresenta um valor grande, signi�ca que as observaçõesvalor grande, signi�ca que as observações (valores) da variável aleatória estão muito(valores) da variável aleatória estão muito dispersas em torno da média.dispersas em torno da média. a b E (a ⋅ X ) = a ⋅E (X) E (a) = a E (X ± Y ) = E (X) ±E (Y ) E (X ⋅ Y ) = E (X) ⋅E (Y ) VAR (a) = 0 VAR (a ⋅ X ) = ⋅ VAR (X)a2 7) A variância de soma (ou da diferença) de duas variáveis aleatórias é igual à soma das variâncias das variáveis aleatórias. Vejamos um exemplo em que podemos aplicar algumas dessas propriedades. Considere que o retorno mensal de certo investimento de risco pode ser modelado pela variável aleatória R, com função de probabilidade dada a seguir. Para atender à demanda de sua che�a, calcule o retorno esperado (em %) do investimento e as medidas de desvio padrão e variância. Resolução A partir da identi�cação do tipo da variável R, classi�cada como discreta, o retorno esperado (média) é, por de�nição: A partir do cálculo de µ, veri�ca-se que o retorno esperado seja de 1,5%. Continuando o atendimento da demanda, a variância de R é: O desvio padrão de R é . Assim �nalizamos a demanda identi�cando as três medidas solicitadas: retorno esperado, variância e desvio padrão. V (X ± Y ) = V (X) + V (Y ) µ = (−5) (0 ⋅ 40) + (0) ⋅ (0 ⋅ 15)+ (5) ⋅ (0 ⋅ 25)+ (10) ⋅ (0 ⋅ 15) + (15) ⋅ (0 ⋅ 05) = 1, 5 (−5 − 1, 5 ⋅ (0, 40)+σ2 )2 (0 − 1, 5 ⋅ (0, 15)+)2 (5 − 1, 5 ⋅ (0, 25)+)2 (10 − 1, 5 ⋅ (0, 15)+)2 (15 − 1, 5 (0, 05) =)2 40, 25% σ = = = 6, 344 σ2 −−√ 40, 25− −−−−√ Estude com atenção e domine as propriedades relevantes ao cálculo de esperança, variância e desvio padrão de variáveis aleatórias. Com elas, pode-se resolver de forma mais e�ciente e correta medidas de interesse geradas a partir de variáveis aleatórias. Conhecimento Teste seus Conhecimentos (Atividade não pontuada) Numa indústria de laticínios, o leite produzido é acondicionado em embalagens conhecidas como Tetra Pak. O processo de envase é executado por máquinas S A I B A M A I S Segundo Zerbinatti, Rocha e Abras (2021), na incerteza não se tem o conhecimento sobre a distribuição de probabilidade dos possíveis eventos futuros. O que a difere de risco, uma vez que no risco a distribuição de probabilidade envolvida é conhecida. Assim, no artigo “Incerteza e atividade industrial brasileira: uma abordagem setorial”, os autores trazem um estudo que analisa os efeitos da incerteza sobre a produção industrial brasileira. O estudo foi desenvolvido pela estimativa de painéis de efeitos �xos para 17 subsetores da indústria de transformação. Acesse em: https://bit.ly/3jL0Jbm. https://bit.ly/3jL0Jbm automáticas. Para um teste de nova linha de leite, com peso diferenciado dos tradicionais, essas máquinas são reguladas para que as embalagens pesem, após o envaze do produto, em média 400 g. Contudo, pelo grau de precisão da máquina, o peso real obtido se distribui em torno dessa média com desvio padrão de 3 g. Supondo que a embalagem tem um peso constante de 20 g, assinale a alternativa que expresse o valor da média e do desvio padrão do peso bruto da caixa de leite. a) E(Z) = 400 g. e V(Z) = 1,5 g. b) E(Z) = 420 g e V(Z) = 9 g. c) E(Z) = 420 g e V(Z) = 3 g. d) E(Z) = 400 g e V(Z) = 9 g. e) E(Z) = 400 g e V(Z) = 3 g. Em diversas situações práticas, a variável de interesse em um estudo assume dois valores; por exemplo, a peça é classi�cada como boa ou defeituosa; o entrevistado concorda ou não com a a�rmação, o produto é ou não e�ciente na opinião dos clientes. Vejamos alguns modelos de distribuição que auxiliam em situações de dicotomia, como os modelos de Bernoulli e binomial. Acompanhe! i i i ã i Distribuição de Bernoulli e binomial Distribuição de Bernoulli Considere um experimento em que existem apenas dois resultados possíveis: sucesso, atribuído pelo valor 1, e apresenta o caso de acontecer o evento desejado, e fracasso atribuído pelo valor 0, e apresenta o caso de o evento esperado não se realizar. Esse tipo de experimento é chamadode ensaio de Bernoulli (ou distribuição de Bernoulli). Considerando p igual à probabilidade de sucesso, tem-se que a notação para essa variável aleatória discreta é dada por: X ~ Bernoulli(p). A distribuição de Bernoulli serve como ponto de partida para o desenvolvimento de modelos mais elaborados, como a distribuição binomial. Seja X uma variável aleatória com apenas dois resultados: sucesso (1) e fracasso (0). Assim: , com Assim pode-se reescrever a função de probabilidade como: em que Conheça quais são seus parâmetros característicos. Média Assim a esperança de uma variável aleatória discreta sob a distribuição de Bernoulli é a proporção de sucessos. f (1) = P ( X = 1) = p 0 < p < 1 f (0) = P ( X = 0) = 1 − p = q f(x) = P (X = x) = (1 − ppx )1−x x = 0, 1 E(X) = = P (xi) =μ(x) ∑ 0 1 xi 0.(1 − p) + 1.p→ 0.q+ 1.p = p Variância e , calculada anteriormente, é p. Temos: Vejamos, a seguir, um modelo de distribuição que compreende um pouco mais de complexidade em situações de dicotomia de eventos possíveis. Distribuição binomial Assim como a distribuição de Bernoulli, a distribuição binomial tem apenas dois resultados possíveis e mutuamente exclusivos, como sucesso e fracasso. Contudo, estudante, não se está interessado em apenas uma ocorrência, mas, sim, em múltiplas, em que o experimento é repetido determinada quantidade ( ) de vezes, sob as mesmas condições, de modo que as probabilidades de sucesso (p) e falha (q =1-p) se mantêm inalteradas a cada repetição. Assim os ensaios são independentes, ou seja, o resultado de um ensaio não afeta o resultado dos demais ensaios considerados no experimento em estudo. Os parâmetros envolvidos são: p, que denota a probabilidade de ocorrência do evento de interesse no ensaio, e n, que denota o número de ensaios de interesse no experimento em estudo. Com isso, uma variável aleatória que segue uma distribuição binomial é representada da seguinte forma: . Essa variável aleatória X, que considera o número de sucessos em n repetições de uma dada experiência, é uma variável aleatória discreta, com valores possíveis . Observe a função de probabilidade: , onde Vejamos os parâmetros característicos do modelo de distribuição binomial e suas respectivas funções. = E [ ] =σ2x ( − μ)xi 2 E ( )−x2i μ2x E ( ) = P ( ) =x2i ∑1 0 x2i xi q+ p = p;02 12 μx = p− = p (1 − p) = = pqσ2x p2 σ2x V (X) = pq n X Bin(n, p) 0, 1, 2, . . . ,n f(x) = P (X = x) =( ) (1 − p =n x px )n−x (1 − pn! x!(n−x)! px )n−x x = 0, 1, 2, . . . ,n Média (esperança da variável aleatória) Variância , em que . Caso seja de interesse a veri�cação do desvio padrão da variável aleatória, basta retirar a raiz quadrada da variância calculada. Observação: a distribuição de Bernoulli é apenas um caso particular da binomial, em que n = 1. Logo segue que a média e a variância de uma variável Bernoulli(p) são, respectivamente, p e p.q. Vejamos um exemplo em que a variável aleatória de interesse segue uma distribuição binomial e a forma de resolução da função. Considerando um grupo de clientes VIP com cadastro em uma empresa, a probabilidade de um dos membros realizar uma compra de produtos em uma ação promocional de marketing é de 15%. Qual é a probabilidade de que, entre 5 clientes interessados na ação, exatamente 3 realizem uma compra? Dados do problema Número de ensaios: Número de eventos de interesse: Parâmetro que caracteriza a proporção de interesse (sucesso): Utilizando as medidas informadas, segue-se para a resolução: Conclusão: a probabilidade de que, entre 5 clientes interessados na ação, exatamente 3 realizem uma compra é de, aproximadamente, 2,44. E (X) = n ⋅ p VAR (X) = n ⋅ p ⋅ q q = (1 − p) n = 5 x = 3 p = 0, 15 P (X = 3) = = 0, 024 5! 3! 2! (0, 15)3(0, 85)2 Agora que abordamos os conceitos necessários ao estudo de uma variável aleatória que siga uma distribuição binomial, vamos colocá-los em prática? praticar Vamos Praticar Uma grande companhia está passando por di�culdades �nanceiras. Entre as diversas propostas para a resolução do problema está mudar as principais fábricas para países subdesenvolvidos, onde a mão de obra é mais barata e não há preocupação com o descarte de resíduos. Diante disso, supõe-se que 30% dos acionistas são favoráveis a essa proposta. Toma-se uma amostra de 20 acionistas para o estudo do caso. Calcule as probabilidades de 4, 5, 6 ou 7 dos acionistas amostrados serem favoráveis à proposta. Sigamos nos modelos probabilísticos das variáveis aleatórias discretas que consideram o período de ocorrência como parte das informações relevantes. A distribuição de probabilidade de Poisson está relacionada a experiências que modelam o número de ocorrências de um evento dentro de determinado intervalo de tempo (ou espaço) quando esses eventos ocorrem com uma taxa média conhecida. Vejamos alguns exemplos. Número de carros que passam por uma estrada no intervalo de uma hora. Número de buracos por km de uma rodovia. Distribuição de Poisson Número de assassinatos num �nal de semana. Número de defeitos por metro de tecido produzido. Número de erros de digitação numa página de texto. Número de mutações num trecho de DNA após a exposição a certa quantidade de radiação. As ocorrências são independentes e independem do tempo em que o último evento aconteceu. Além disso, as ocorrências em subintervalos mutuamente exclusivos também são independentes. Segundo Fonseca e Martins (2012), o modelo de Poisson tem as seguintes hipóteses. H1: a probabilidade de uma ocorrência em um intervalo (ou , ou...) é constante e proporcional ao tamanho do intervalo, isto é, . H2: a probabilidade de mais de uma ocorrência em um intervalo (ou , ou...) é igual a zero, isto é, . H3: o número de ocorrências constitui variáveis aleatórias independentes. Assim a função de probabilidade de Poisson apresenta o seguinte modelo matemático: Em que: = coe�ciente de proporcionalidade, ou taxa de frequência por unidade de tempo, área = tempo, área = base do logaritmo natural (2,71828) = número de ocorrências (sucessos) A distribuição foi descoberta por Siméon Denis Poisson (1781-1840) e publicada em 1838 no trabalho “Recherches sur la probabilité des jugements en matières criminelles et matière civile”. δt δS P (X = 1, δt) = γδt δt δS P (X > 1, δt) = 0 P (X = x, t) = ×(γt)x e−γt x! γ t e x Uma distribuição de Poisson modela bem eventos raros. Fenômenos raros são aqueles que não acontecem com grande frequência para qualquer intervalo de tempo de observação (COSTA, 2012). A distribuição de probabilidade de Poisson tem µ como seu parâmetro e é representada da seguinte forma: X ~ Poisson(µ). E apresenta os seguintes parâmetros característicos. Média Variância Exemplo O número médio de funcionários que são contratados por uma fábrica, num período de 15 meses, é 10. Qual é a probabilidade dessa fábrica contratar exatamente 5 funcionários em 15 meses? Resolução Vejamos a seguir, no infográ�co, um resumo das distribuições de probabilidades para variáveis discretas que estudamos até agora. Vamos lá? E(X) = µ = γt VAR(X) = µ = γt μ = 10 x = 5 f (5) = P (X = 5) = = 0, 0378105e−10 5! #PraCegoVer: o infográ�co apresenta três banners retangulares horizontais, um sobreposto a outro. O primeiro, de cima para baixo, descreve “Distribuição Bernoulli (X~Bernoulli (p), tal que X = 0,1): o experimento ocorre um certo número de vezes. Utilizado quando estamos interessados na ocorrência de sucesso ou de fracasso. A v.a. assume apenas dois valores: 1, se ocorrer sucesso (p); e 0, se ocorrer fracasso (1-p)”. O segundo descreve “Distribuição Binomial (X~B(n,p), tal que X = 0,1,2,...,n): ocorre quando repetimos um ensaio de Bernoulli n vezes, sempre nas mesmas condições. Lembrando que o interesse permanece em uma variável aleatória com eventos dicotômicos e mutuamente exclusivos: sucesso x fracasso em tantos ensaios, acerta x, erra em tantas tentativas”. O terceiro descreve “Distribuição de Poisson(X~Poisson (µ),m, tal que X = 0,1,2,...): o número de ocorrência de eventos dentro de determinado intervalo de tempo, espaço quando esses eventos ocorrem com uma taxa média conhecida. Características: a probabilidade de uma ocorrência é a mesma para intervalos iguais. As ocorrências são independentes e independem do tempo do último evento”. Agora que �nalizamos nosso material de estudos, vamos a uma questão prática para treinar nossas habilidades. Vamos lá? praticar Vamos Praticar Uma empresa disponibilizou um número de telefone para atendimento ao cliente. No entanto sabe-se que a quantidade de ligações por minuto é uma variável aleatória de Poisson com média de 3 chamadas por minuto. Qual é a probabilidade de o número de chamadas num minuto ser maior que 4? Material Complementar F I L M E O homem que mudou o jogo Ano: 2011 Comentário: o �lme é baseado na história real de Billy Beane, retratada por Michael Lewis no livro “Moneyball: the art of winning an unfair game”. O grande desa�o de Billy foi construir um time de beisebol competitivo para a temporada de 2002. Um treinador visionário que fundamentou suas escolhas em estatísticas e análises de dados para melhorar a performance do seu time. Ele contratou um cientista que estudou a proporção de acerto dos jogadores, substituindo assim o sexto sentido ancorado em expectativas dos olheiros. Disponível em: TRA I LER L I V R O Controle estatístico de qualidade Autor: Jay L. Devore Editora: Cengage Learning Capítulo: 2 Ano: 2018 ISBN: 9788522128044 Comentário: o uso de modelos probabilísticos e métodos estatísticos para a análise de dados tem se tornado uma prática comum em praticamente todas as disciplinas cientí�cas. Este livro, em especial o Capítulo 2, oferece uma introdução abrangente àqueles modelos e métodos com maior probabilidade de serem encontrados e usados por estudantes de engenharia e ciências naturais. Embora os exemplos e exercícios tenham sido desenvolvidos para cientistas e engenheiros, a maior parte dos métodos abordados é básica para análises estatísticas e para muitas outras disciplinas, de modo que estudantes de administração e ciências sociais também se bene�ciarão com a leitura do livro. Disponível na Biblioteca Virtual. Conclusão Caro(a) estudante, neste material, foi possível conhecer algumas das distribuições de probabilidades de variáveis aleatórias discretas, como a distribuição de probabilidade de Bernoulli, a distribuição de probabilidade binomial e a distribuição de probabilidade de Poisson. Entre elas, existem outras distribuições de probabilidade, como hipergeométrica, exponencial, binomial negativa etc. Caro(a) estudante, a con�abilidade e a aceitação dos resultados obtidos pelos processos de medição são muito relevantes no âmbito das questões metrológicas. Basicamente, nenhum tipo de medição que possa ser realizada representa o verdadeiro valor mensurado. Essa variação normalmente é explicada pelas limitações inerentes ao processo dimensional, as quais limitam as quantidades de medições que podem ser realizadas, assim como está associada aos efeitos das demais variações que possam estar presentes. Dessa forma, o estudo proposto aqui não de�ne e tampouco limita as áreas de conhecimentos a serem pesquisadas. Sempre temos que procurar estudar e aprender mais e mais! Nos vemos, até breve! Referênci as COSTA, G. G. de O. Curso de estatística inferencial e probabilidades: teoria e prática. São Paulo: Grupo GEN, 2012. (Disponível na Minha Biblioteca). DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. São Paulo: Cengage Learning, 2018. (Disponível na Biblioteca Virtual). FONSECA, J. S. da.; MARTINS, G. de A. Curso de estatística. 6. ed. São Paulo: Grupo GEN, 2012. (Disponível na Minha Biblioteca). MARTINS, G. de A.; DOMINGUES, O. Estatística geral e aplicada. 6. ed. São Paulo: Grupo GEN, 2017. (Disponível na Minha Biblioteca). MEYER, P. L. Probabilidade: aplicações à estatística. São Paulo: Grupo GEN, 2010. (Disponível na Minha Biblioteca). MORETTIN, P. A.; BUSSAB, W. de O. Estatística básica. São Paulo: Editora Saraiva, 2017. (Disponível na Minha Biblioteca). O HOMEM que mudou o jogo | Trailer legendado | Em exibição nos cinemas. [S. l.: s. n.], 2012. 1 vídeo (2 min.). Publicado pelo canal Sony Pictures Brasil. Disponível em: https://www.youtube.com/watch?v=BumI-Yh0P1M. Acesso em: 10 fev. 2023. O QUE é distribuição binominal e como calcular? Con�ra exemplos! Labone, [2023]. Disponível em: https://www.laboneconsultoria.com.br/distribuicao-binomial/. Acesso em: 2 fev. 2023. O PRAZER da estatística. Direção de Dan Hillman. Reino Unido: BBC, 2010. (59 min). ZERBINATTI, A. S.; ROCHA, B. de P.; ABRAS, A. L. G. Incerteza e atividade industrial brasileira: uma abordagem setorial. Nova Economia, Belo Horizonte, v. 31, n. 2, p. 455-485, 2021. Disponível em: https://www.scielo.br/j/neco/a/m48Mx6bj6yPGZGBJn5rHBww/? format=pdf&lang=pt. Acesso em: 2 fev. 2023. https://www.youtube.com/watch?v=BumI-Yh0P1M https://www.laboneconsultoria.com.br/distribuicao-binomial/ https://www.scielo.br/j/neco/a/m48Mx6bj6yPGZGBJn5rHBww/?format=pdf&lang=pt https://www.scielo.br/j/neco/a/m48Mx6bj6yPGZGBJn5rHBww/?format=pdf&lang=pt