Prévia do material em texto
UNIVERSIDADE FEDERAL DE ALAGOAS CAMPOS DE ENGENHARIAS E CIÊNCIAS AGRÁRIAS DISCIPLINA: ESTATÍSTICA EXPERIMENTAL Rio Largo, Alagoas INFERÊNCIA UFAL CECA João Messias Geraldo Veríssimo Inferência Estatística Tem como objetivo obter conclusões sobre algumas características de um conjunto de interesse, denominado população, com base na informação oriunda de um conjunto de dados disponível, denominado amostra. Fonte: http://umolharmatematico.weebly.com/populaccedilatildeoamostra.html Como uma metáfora, imagine que você está preparando um panelão se sopa! Inferência Estatística Inferência Estatística Assim, com o uso da inferência estatística, os resultados de nosso estudo passa a valer para todos os indivíduos de nossa população, inclusive os que não entraram na amostra. Fonte: http://umolharmatematico.weebly.com/populaccedilatildeoamostra.html ESTIMAÇÃO Os parâmetros são os valores populacionais, que na maioria das vezes são desconhecidos Na população temos os parâmetros: média verdadeira variância verdadeira desvio padrão verdadeiro Como trabalhamos com amostras, temos as estimativas desses parâmetros ESTIMAÇÃO ESTIMATIVA POR PONTO: é quando especificamos um único valor Exemplos de estimativas: da média (m) do desvio padrão (s) da amplitude (A) de uma proporção (p) ESTIMAÇÃO ESTIMATIVA POR INTERVALO: podemos ter intervalos (limites inferior e superior) que contenham o verdadeiro parâmetro a um nível de confiança desejado É comum usar os níveis de confiança de 95% e de 99%, com probabilidades de erros de 5% e 1%, respectivamente ESTIMAÇÃO ESTIMATIVA POR INTERVALO • Para amostras de tamanho grande (n>25), usamos a distribuição normal para obter os limites inferior e superior A expressão para o Intervalo de Confiança (IC) da média é: IC(; 1‐α): m ± z. s(m) Onde: m é a estimativa da média; s(m) é o erro padrão da média = s/n z é obtido na Tabela da Distribuição Normal Reduzida • Para α = 5%, o nível de confiança será 95% e z é igual a 1,96 • Para α = 1%, o nível de confiança será 99% e z é igual a 2,58 ESTIMAÇÃO Exemplo 1: Para os dados de Brix em 28 colmos de cana, foram estimados: m = 13,03 e s = 0,96 IC (; 0,99): 13,03 ± (2,58)(0,18) = {12,60; 13,50} OBS: Na normal reduzida z=2,58 para uma área de 0,495 (metade de 0,99) Isto indica que o intervalo {12,60; 13,50} contém a verdadeira média brix, com uma confiança de 99% ESTIMAÇÃO 12,60 13,03 13,50 0,005 0,005 0,99 IC (; 0,99): {12,57; 13,49} ESTIMAÇÃO Exemplo 2: Para Número de Insetos por planta (NIP) em 27 plantas foram estimados: m = 4 e s = 1,88 Assim: IC (; 0,95) = 4 ± (1,96)(0,36) = {3,3; 4,7} OBS: Na normal reduzida z=1,96 para uma área de 0,475 (metade de 0,95) Isto quer dizer que há uma confiança de 95% do intervalo {3,3 ; 4,7} conter a verdadeira média de NIP ESTIMATIVA POR INTERVALO PARA AMOSTRAS PEQUENAS (n<25) Para amostras de tamanho pequeno (n<25), usamos a distribuição t de “student” para obter esses limites A expressão para o Intervalo de Confiança (IC) da média é: IC (; 0,95): m ± t. s(m) Onde: m é a estimativa da média; s(m) é o erro padrão da média = s/n; t é obtido em Tabela de acordo com o nível de confiança (1‐α) e os graus de liberdade da amostra ESTIMATIVA POR INTERVALO PARA AMOSTRAS PEQUENAS (n<25) Exemplo 1: Número de insetos capturados por dois tipos de armadilhas. Temos as estimativas: m1=12; s12 = 4; n1=10; gl1 = 9 m2=15 ; s22=5; n2= 7; gl2 = 6 IC (1 ; 0,95) = 12 ± 2,26 (2/ 10) = {10,6 ; 13,4} IC (2 ; 0,95) = 15 ± 2,45 (2,236/ 7) = {12,9 ; 17,1} INTERVALO DE CONFIANÇA 1 2 Armadilha 9 10 11 12 13 14 15 16 17 18 Nú m er o de in se to s AMOSTRAGEM É muito importante a escolha da amostra a ser trabalhada na pesquisa científica. Principais tipos de amostras: Amostra simples ao acaso ou amostra aleatória Amostra estratificada Amostra sistemática Amostra por conglomerado É a mais comum. Todos os elementos da população têm a mesma chance de ser escolhido. Pode ser obtida por um simples sorteio. Exemplo: em 40 carregamentos de cana, obter uma amostra simples ao acaso de 10 canas cada uma, em oito carregamentos. Nesse caso, numeramos os carregamentos (1 a 40) e fazemos um sorteio das oito cargas. Depois escolhemos ao acaso as 10 canas de cada carga. AMOSTRAGEM SIMPLES AO ACASO AMOSTRAGEM SIMPLES AO ACASO 2 3 1 2 AMOSTRAGEM EXTRATIFICADA Em cada categoria heterogênea de estratos, processa‐se uma amostragem simples ao acaso. Exemplo: os 40 carregamentos são separados em estratos de acordo com a variedade de cana. Poderia ter 15 cargas da variedade 1 e 25 cargas da variedade 2. Depois aplicamos uma amostragem ao acaso de 10 canas em três cargas da variedade 1 e cinco cargas da variedade 2. AMOSTRAGEM EXTRATIFICADA 15 caminhões da Variedade RB92579 3 caminhões sorteados 25 caminhões da Variedade RB0442 5 caminhões sorteados É constituída por elementos retirados da população segundo um sistema. Exemplo: vamos amostrar apenas oito dos 40 carregamentos, segundo o sistema: carregamentos de número 5, 10, 15, 20, 25, 30, 35 e 40. AMOSTRA SISTEMÁTICA AMOSTRA SISTEMÁTICA Caminhão 5 Caminhão 10 Caminhão 15 Caminhão 20 Caminhão 25 Caminhão 30 Caminhão 35 Caminhão 40 AMOSTRA POR CONGLOMERADO É constituída por elementos retirados da população divididas em grupos que já existem na população e são similares. Exemplo: vamos amostrar cinco grandes hospitais de Maceió e entrevistar pacientes com covid. Para cada grupo (conglomerado) aplicamos uma amostra simples ao acaso. DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA Do ponto de vista estatístico, as mostras devem ser grandes o suficiente para garantir maior segurança as conclusões obtidas. • Hospital A: 120 nascimentos • Hospital B: 10 nascimentos Em certa ocasião nasceram em um dos hospitais duas vezes mais meninos do que meninas. Em qual hospital é mais provável que isso aconteceu? DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA A mostra só trará informações sobre a população onde foi retirada; Não se pode julgar a qualidade da amostra peloo resultado obtido; Conclusões e decisões tomadas com base na amostra só têm sentido quando as amostras representam a população; Como saber se uma amostra é tendenciosa? DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA É determinar o tamanho da amostra de uma população, com um erro de estimação previamente estipulado e com um determinado grau de confiabilidade. Vamos aplicar para amostras simples ao acaso (ASA). Para o caso de proporções, usamos a distribuição de probabilidade da normal reduzida. Para o caso de médias, usamos a distribuição de probabilidade t de “student”. DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA Se o objetivo da pesquisa é obter estimativas de proporções, usamos o Intervalo de Confiança para Proporções para determinar o tamanho da amostra: Temos que IC(p; 1‐α) = p ± Podemos considerar: nível de confiança = 1‐ α margem de erro = e = DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA Então, o tamanho da amostra é: Nem sempre p é conhecido. Ou substituímos p por uma estimativa obtida em uma amostra prévia, ou admitimos o valor máximo para o produto p(1‐p) =0,25 2 2 )1( e ppzn DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA Exemplo 1: Suponha que se deseja fazer uma pesquisa e que a proporção estimada de indivíduos com uma determinada característica deva diferir em menos de 8% do valor verdadeiro. Obter o tamanho de uma amostra com uma confiabilidade de 95% Como não conhecemos p, vamos admitir a máxima variância, ou seja, p(1‐p) = 0,25. A margem de erro é de 0,08 e o valor de z a 95% é 1,96. 150 )08,0( )25,0()96,1( 2 2 n DETERMINAÇÃO DO TAMNAHO DE UMA AMOSTRA Exemplo 2: se tivéssemos uma informação prévia de que p = 0,35 teríamos indivíduos 137 )08,0( )65,0)(35,0()96,1( 2 2 n CÁLCULO DO TAMNAHO DE UMA AMOSTRA PAR A MÉDIA Se oobjetivo da pesquisa é obter estimativas de médias, podemos usar o Intervalo de Confiança da Média: IC (; 1‐α): m ± t. s(m) = m ± t. s/n Admitindo a margem de erro: e = t. s/n CÁLCULO DO TAMNAHO DE UMA AMOSTRA PAR A MÉDIA Então, o tamanho da amostra é: 𝒏 𝒕𝟐𝒔𝟐 𝒆𝟐 Como não conhecemos m e s, geralmente fazemos uma amostra prévia para poucos dados e obtemos suas estimativas Com o valor estimado de m, obtemos uma margem de erro (uma percentagem da média, por exemplo) CÁLCULO DO TAMNAHO DE UMA AMOSTRA PAR A MÉDIA Exemplo 1: Em 10 plantas, o Brix médio foi de 13,12 com desvio padrão de 1,06. Obter um tamanho de amostra com 95% de confiança e 7% de margem de erro da média. Pela tabela t de “student” temos para 9 graus de liberdade e 5% de nível de significância, o valor 2,26 A margem de erro será: e = (0,07)(13,12) = 0,9184 𝒏 𝟐,𝟐𝟔 𝟐 𝟏,𝟎𝟔 𝟐 𝟎,𝟗𝟏𝟖𝟒 𝟐 = 6,8. Usamos indivíduos