Prévia do material em texto
TÓPICOS ESPECIAIS INTEGRADORESTÓPICOS ESPECIAIS INTEGRADORES EM ESTATÍSTICAEM ESTATÍSTICA APLICAÇÕES DAAPLICAÇÕES DA ESTATÍSTICA NAS CIÊNCIASESTATÍSTICA NAS CIÊNCIAS HUMANAS E NA SAÚDE -HUMANAS E NA SAÚDE - TESTE DE HIPÓTESESTESTE DE HIPÓTESES Au to r ( a ) : M a . V i v i a n e d e J e s u s L e i t e Au to r ( a ) : M a . A l e x a n d ra Wa l t r i c k R u s s i R ev i s o r : A n d ré d a S i l va C o u ra Tempo de leitura do conteúdo estimado em 1 hora e 3 minutos. Introdução Olá, estudante. Como vai? Você já reparou como é natural tentarmos compreender a ocorrência de uma situação, o comportamento de um grupo ou até uma característica, com base em informações disponíveis, que normalmente são pequenas e acessíveis? Vejamos um exemplo cotidiano que explique melhor essa ideia: conforme vivemos em cidade e prestamos atenção ao clima, ao longo dos dias, tentamos identi�car alguns padrões característicos para compreender e até prever a ocorrência de chuvas ou da mudança de clima. Evidentemente, é possível consultar sites ou notícias sobre uma previsão mais direta, mas quem nunca presenciou uma pessoa mais velha, com toda sua sabedoria em meteorologia, olhar pela janela e profetizar que choverá mais tarde? É importante entender, nesse exemplo, que o segredo que envolve a previsão assertiva está na observação das características que rodeiam o evento chuva e o teste de hipótese para selecionar eventos que merecem mais atenção na previsão. Ao longo de nossos estudos, veremos a de�nição dos conceitos e termos relacionados aos testes de hipótese e como são estabelecidos; que medidas populacionais são normalmente estimadas a partir de dados amostrais; os tipos de erro atrelados aos testes e a forma de dimensioná-los e como proceder com a veri�cação da signi�cância nos diferentes testes de hipóteses mais comuns. Vamos lá? Bons estudos! O objetivo da análise de conglomerados, também conhecida como análise de agrupamentos ou de cluster, é particionar um conjunto de dados em grupos que são internamente homogêneos e externamente distintos, ou seja, segmentar ou agrupar em grupos menores (subgrupos). A classi�cação é realizada com base em uma medida de similaridade ou dissimilaridade dentro e entre os grupos. As hipóteses podem surgir de diferentes formas, como nos exemplos apresentados de Triola (2017): na área da saúde, por exemplo, em geral, a�rma-se que a temperatura corporal média é de 98,6 °F, e podemos testar essa a�rmativa usando uma amostra de n temperaturas corporais com média de 98,2 °F. Dentre os parâmetros populacionais, estudaremos os mais utilizados, ao longo desta disciplina: a média populacional, representada pela letra grega µ (mi) representada com dados amostrais por ; a variância populacional, representada pela letra grega σ (sigma ao quadrado) – lembrando que, ao utilizar apenas σ, estamos apresentando o desvio-padrão, que, em dados amostrais, é representada por s ; a proporção populacional, representada pela letra p. Conforme Hair et al. (2009), para realizar uma análise de cluster cuidadosa, são necessários métodos com as seguintes características: Triola (2017) apresenta a hipótese nula como uma a�rmativa de que o valor de um parâmetro populacional é igual a algum valor especí�co, em que o termo “nula” indica ausência de mudança, efeito ou diferença, por isso chamada anteriormente de “conservadora”. Já H1 apresenta uma a�rmativa de que o parâmetro tem um valor que, Teste de Hipóteses - Introdução x̄ 2 2 de alguma forma, difere da hipótese nula. A apresentação simbólica da hipótese alternativa deve conter o símbolo < (menor que), > (maior que) ou ≠ (diferente). Observe alguns exemplos de hipóteses contextualizados: a) A altura média da população masculina, em uma determinada cidade brasileira, entre 25 e 39 anos, é de 1,73 m, segundo a Secretaria Estadual de Saúde. A ideia é testar se a média de altura em questão difere ou não da medida representação: Podemos considerar que o erro de medição sempre estará presente quando a indicação do sistema de medição não relacionar corretamente com o valor verdadeiro do mensurando. Sendo assim, de�ne-se como erro de medição a diferença entre o valor indicado pelo sistema de medição e o valor verdadeiro do componente ou da peça dimensionada. Observe a forma como as hipótesesObserve a forma como as hipóteses são apresentadas gra�camente:são apresentadas gra�camente: HH : : = (valor observado com base = (valor observado com base na amostra)na amostra) HH : : < ou > ou ≠ (valor observado < ou > ou ≠ (valor observado com base na amostra)com base na amostra) 00 θθ 11 θθ : μ = 1, 73mH0 : μ ≠ 1, 73mH1 : σ = (R$250H0 )2 : σ > (R$250H1 )2 c) A proporção da população brasileira adulta, classi�cada com algum grau de obesidade, é de 60,3% (no caso dessa pesquisa, o interesse é veri�car se o parâmetro populacional está superestimado). No decorrer de nossos estudos, veremos como os cálculos dos testes de hipóteses ocorrem. Contudo, é importante assimilar que, dependendo do tipo de hipótese estabelecida, a projeção grá�ca e o cálculo variam. Observe o infográ�co a seguir, com as três representações das possíveis hipóteses alternativas e seus respectivos nomes: REGIÕES CRÍTICAS SOB DIFERENTES HIPÓTESES ALTERNATIVAS : p = 60, 3H0 : p < 60, 3H1 Fonte: Adaptadas de Triola (2017). #PraCegoVer: o infográ�co apresenta três representações grá�cas que identi�cam as formas de cada uma das hipóteses alternativas (H ) possíveis. Todas têm a aparência de uma curva de distribuição normal e têm, nas áreas de probabilidade, destacadas, com cor mais clara, a área de não rejeição e, com cor mais acentuada, a área de rejeição. Entre as duas áreas, há uma reta que divide as regiões. Abaixo de cada grá�co, estão a identi�cação do sinal utilizado em H e o nome pertinente da representação. Uma sobre a outra, a primeira apresenta, em ambas as extremidades externas, áreas de tamanhos iguais e destacadas com cor acentuada que representam a hipótese alternativa (H ) de diferença, sendo atrelada ao “Teste bilateral”. Abaixo uma curva apresenta, apenas no extremo da cauda esquerda, a área com cor destacada, representando a hipótese alternativa (H ) com sinal de “>” e sendo pertinente ao “Teste unilateral à esquerda”. Por último, uma curva apresenta, apenas no extremo da cauda direita, a área com cor destacada, representando a hipótese alternativa (H ) com sinal de “<” e sendo pertinente ao “Teste unilateral à direita”. As projeções grá�cas das hipóteses são um recurso facilitador, mas não obrigatório, tanto para a escolha da hipótese alternativa mais adequada quanto para a identi�cação da decisão a ser tomada, entre rejeitar ou não a hipótese nula. Vale lembrar que a notação adotada para a identi�cação das hipóteses pode variar conforme o autor ou o software utilizado para análise do teste. A hipótese nula não difere da notação H0, mas a hipótese alternativa pode assumir H1 ou Ha. Até aqui, estudante, você já foi apresentado(a) à hipótese estatística, às hipóteses possíveis em um teste de hipótese e deve conseguir identi�car o par de hipóteses a serem testadas (nula e alternativa) por uma a�rmativa e expressar ambas de forma simbólica. 1 1 1 1 1 quando se trata da interpretação do resultado de um teste de hipótese, apesar de ser mais simples o entendimento, não se pode aceitar uma hipótese, e sim, não rejeitar. Agora, para �nalizar esse tópico, resolveremos uma atividade. Vamos lá? Conhecimento Teste seus Conhecimentos (Atividade não pontuada) O rótulo de uma garrafa de refrigerante contém a informação de que possui, em média, 1 litro. Para sanar a dúvida e refutar a denúncia de que a quantidade média real de refrigerante seria de 0,952 litros, com um desvio-padrão de 0,08 litros, a fábrica do refrigerante cogita conduzir uma pesquisa para veri�car a veracidade da informação apresentada nos rótulos, testando uma possível diferença de valor. Assinale a alternativa correta, que indica a forma simbólicadas hipóteses capazes de veri�car se a denúncia está equivocada: a) e b) e c) e d) e e) e : μ = H0 μ0 : μ ≤ H1 μ0 : μ = H0 μ0 : μ <H1 μ0 : μ = H0 μ0 : μ > H1 μ0 : μ = H0 μ0 : μ ≠ H1 μ0 : μ = H0 μ0 : μ ≥ H1 μ0 Erros tipo I e tipo II Caro(a) estudante, ao testar um conjunto de hipóteses, Martins e Domingues (2017) apresentam dois tipos de erros num teste de hipótese estatístico, ao tomarmos a decisão de rejeitar ou não H0: erro tipo I e erro tipo II. Ao decidir rejeitar H , quando, na verdade, a ação correta seria não rejeitar (hipótese nula é verdadeira), veri�camos a ocorrência de um erro tipo I. Esse erro também pode ser de�nido pela letra grega alfa ( ). Da mesma maneira, quando decidimos não rejeitar H quando, na verdade, a ação correta seria rejeitar (hipótese nula é falsa), veri�camos a ocorrência de um erro tipo II. Esse erro também pode ser de�nido pela letra grega beta ( ). De forma geral, o Código de Nuremberg estabeleceu que nenhum ser humano poderia ser submetido a projetos de pesquisa sem o seu devido consentimento, sendo o primeiro documento a ter alcance internacional, por conta, principalmente, do repúdio da comunidade internacional quanto aos crimes cometidos no período nazi-fascista (PALÁCIOS; REGO; SCHRAMM, 2009). 0 α 0 β A necessidade de regulamentação de pesquisas em seres humanos, para proteger seus participantes, e o desejo do corpo médico ter sua própria regulamentação foram motivações para a criação da Declaração de Helsinque, a qual foi aprovada pela Associação Médica Mundial, e cuja primeira versão é de 1964 (PALÁCIOS; REGO; SCHRAMM, 2009). Você pode encontrar em algumas referências à representação de erros dos testes de hipótese, como as apresentadas em Morettin e Bussab (2017), que apresenta os tipos de erros da seguinte forma: Em 1988, o Conselho Nacional de Saúde (CNS) do Brasil estabeleceu normas que tratam da ética em pesquisa com seres humanos e, em 10 de outubro de 1996, aprovou as diretrizes/normas que regulamentam pesquisas com seres humanos, denominada Resolução 196/96 (PALÁCIOS; REGO; SCHRAMM, 2009). A Resolução 196/96 estabeleceu princípios básicos para permitir apreciação da ética em protocolos de pesquisa, criando os Comitês de Ética em Pesquisa (CEP) e a Comissão Nacional de Ética em Pesquisa (Conep). O conteúdo da resolução incorpora as experiências históricas da regulamentação sobre ética em pesquisa, principalmente com base no Código de Nuremberg (1947), na Declaração dos Direitos Humanos (1948), na Declaração de Helsinque (desde a primeira versão de 1964), nas Diretrizes Internacionais para a Revisão Ética de Estudos Epidemiológicos e nas Diretrizes Éticas Internacionais para Pesquisas Biomédicas Envolvendo Seres Humanos, assim como em conteúdos de leis promulgadas após a aprovação da Constituição de 1988 (PALÁCIOS; REGO; SCHRAMM, 2009; NOVOA, 2014). Samohyl (2009) estabelece que o grá�co de soma acumulada (CUSUM) é um aprimoramento do grá�co de controle X de Shewhart, este, de�nido como sendo a forma de monitoramento da média de um processo especí�co cuja característica de qualidade de interesse X é uma grandeza mensurável representada. Assim sendo, o CUSUM é o mais apropriado para se reconhecer o histórico dos dados, característica ausente em grá�cos mais simples, e também para identi�car pequenas alterações nos processos muito antes dos alarmes dos grá�cos X, considerados como LSC e LIC. Uma das formas de minimizar o erro, em uma pesquisa estatística, é aumentar o tamanho amostral. Essa medida pode acarretar alguns ônus, como ampliar o tempo de pesquisa e dos custos envolvidos ou outras alterações que podem impactar signi�cativamente o estudo. Para um mesmo tamanho de amostra, a probabilidade de incorrer em um erro tipo II aumenta à medida que diminui a probabilidade do erro tipo I e vice-versa. μμ Agora que já tratamos do embasamento teórico de testes de hipótese, abordaremos a construção de testes estatísticos e como realizar um teste de signi�cância. Seguimos? Vamos lá! Para realizar um teste de signi�cância, conforme Martins e Domingues (2017), deve-se considerar apenas o erro. Dessa forma, traçamos um passo a passo, resumido, para realização dos testes de signi�cância. 1. conteúdo do item 1: Eu mi bibendum neque egestas congue quisque egestas diam in. 2. conteúdo do item 2: Eu mi bibendum neque egestas congue quisque egestas diam in. 3. conteúdo do item 3: Eu mi bibendum neque egestas congue quisque egestas diam in. Para a condução de testes de signi�cância, é muito importante delimitar bem os 5 passos, atentando para os valores e medidas. Contudo, as etapas que envolvem cálculos podem ser efetuadas como recursos computacionais, como planilhas eletrônicas ou mesmo softwares estatísticos. Na sequência, veremos como aplicar os passos de resolução para diferentes parâmetros de interesse. Vamos lá! Teste de significância para média populacional Teste de Significância Apesar de a eticidade e a cienti�cidade da pesquisa cientí�ca, em especial, daquela realizada com seres humanos, serem aspectos que caminham juntos, não cabe aos Comitês de Ética em Pesquisa (CEP) a emissão de pareceres sobre a metodologia utilizada no desenvolvimento dos estudos (NOVOA, 2014). Vamos ao 1º caso: média populacional com variância populacional ( ) conhecida 1º: São de�nidas H e H . H (hipótese nula) é apresentada como H . Já H (hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o interesse da pesquisa e do pesquisador: (a) H ou (b) H ou (c) H 2º: Fixa-se α, considerando conhecida, a variável de teste será Z (normal padronizada). 3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). σ2 0 1 0 0 : μ = μ0 1 1 : μ ≠ μ0 1 : μ > μ0 1 : μ < μ0 σ2 Figura 1.2 - Regiões críticas das hipóteses do teste sob a distribuição normal padronizada. Fonte: Adaptada de Martins e Domingues. #PraCegoVer: a imagem apresenta as três possíveis representações de região crítica das hipóteses de teste, com a informação da estatística de teste Z, sob a normal padronizada, delimitando o ponto de fronteira entre RA e RC. O 1º grá�co representa o teste de hipótese bicaudal, com a região crítica nas extremidades das duas caldas, em que Z é dividido igualmente e apresentado à esquerda como - e à direita como . Abaixo, apresenta a informação para consultar a tabela Z com o valor de α adotado. Na sequência, veri�ca-se a representação da região crítica de um teste unilateral à direita, com Z representado por e, por último, a representação de um teste unilateral à esquerda, com Z representado por - . Abaixo, dos testes unilaterais, há a informação para consultar a tabela Z com o dobro do valor de α adotado (nível de signi�cância). Não existem sistemas de medição que possam ser classi�cados como ideais. Dessa forma, é atribuição direta dos engenheiros de�nir e implantar sistemas de medição que apresentem propriedades estatísticas consideradas adequadas. Onde: = média amostral = valor da hipótese nula Z α 2 Z α 2 Zα Zα =Zcalculada −x̄ μ0 σ n√ x̄ μ0 = desvio-padrão populacional = tamanho da amostra 5º: Possíveis conclusões para: A pesquisa epidemiológica tem por base a coleta sistemática de dados sobre eventos associados, principalmente, à saúde das pessoas pertencentes a populações de interesse. O tratamento analítico dado aos fatores pesquisados tem base em três procedimentos, a saber, a mensuração de variáveis aleatórias, a estimação de parâmetros populacionais e o uso de testes estatísticos (BLOCH; COUTINHO, 2009). Se → Não rejeita H . Se > ou < → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . Agora, o 2º caso: média populacional com variância populacional ( ) desconhecida 1º: Assim como indicado para o teste com variância populacional conhecida, são de�nidas H e H . 2º: Fixar , considerando desconhecida,a variável do teste será t de Student, com . 3º: Utilizando a tabela t, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). σ n − ≤ ≤z α 2 Zcalculada Z α 2 0 Zcalculada Z α 2 Zcalculada −Z α 2 0 <Zcalculada Zα 0 >Zcalculada Zα 0 > −Zcalculada Zα 0 < −Zcalculada Zα 0 σ2 0 1 α σ2 φ = (n− 1) 4º: Cálculo do valor da estatística de teste Onde: = média amostral = valor da hipótese nula = desvio-padrão amostral = tamanho da amostra 5º: Possíveis conclusões para: Teste bicaudal: Se → Não rejeita H . Se > ou < → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . =tcalculada −x̄ μ0 S n√ x̄ μ0 S n − ≤ ≤t α 2 tcalculada t α 2 0 tcalculada t α 2 tcalculada −t α 2 0 <tcalculada tα 0 >tcalculada tα 0 > −tcalculada tα 0 < −tcalculada tα 0 Vejamos um exemplo de aplicação do teste de hipótese para média populacional. Ao assumir a gestão de um grande time de futebol de um estado brasileiro, o dirigente deveria rever os gastos com os salários dos esportistas. Para determinar os jogadores que manteria no time e os que tentaria trocar por outros, pediu um levantamento do aproveitamento, em campo, nas últimas duas partidas de treinamento. O aproveitamento seria o percentual de tempo em que esteve com a posse de bola, e a jogada resultou em gol para seu time. A expectativa era que os jogadores tivessem, em média, pelo menos 44% de aproveitamento. Ao �nal dos dois treinos, foram selecionados 20 jogadores para veri�car o aproveitamento, nessa primeira leva de avaliação. Os dados observados, já organizados em ordem crescente, são: 40, 40, 41, 42, 42, 43, 43, 43, 44, 44, 44, 44, 45, 45, 45, 46, 46, 46, 48 e 48. Considerando um nível de signi�cância de 5%, veri�que as hipóteses testadas, como foram e a que conclusão o dirigente chegou para essa primeira equipe avaliada. Para a resolução da demanda, começamos estabelecendo as hipóteses consideradas: H0: H1 = 0,01 = -2,5395 Aplicando a fórmula, temos: Como < - 2, 5395, não se rejeita H0, concluindo-se que o aproveitamento em campo foi menor que o esperado, e o dirigente deve rever a contratação desses jogadores avaliados. Vejamos, na sequência, os procedimentos para aplicação de testes de hipótese, nos casos de interesse na variância populacional. Teste de significância para variância populacional ( ) μ = 44 : μ > 44 α tα = = = −0, 0980tcalculada −x̄ μ0 S n√ 43, 95 − 44 2,28 20√ tcal σ2 Nesse subtópico, vamos aprofundar nossos conhecimentos acerca do teste de signi�cância para variância populacional ( ). Acompanhe! 1º: São de�nidas H e H . H (hipótese nula), apresentadas como H . Já H1 (hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o interesse da pesquisa e do pesquisador: (a) H ou (b) H ou (c) H 2º: Fixa-se α, e a variável de teste será (Qui-Quadrado) com . 3º: Utilizando a tabela , são determinadas as áreas de não rejeição (RA) e a região crítica (RC). Figura 1.3 - Regiões críticas das hipóteses do teste sob a distribuição Qui-Quadrado Fonte: Adaptada de Martins e Domingues (2017). #PraCegoVer: a imagem apresenta três grá�cos, que demonstram as possíveis representações de região crítica das hipóteses de teste, com a informação da estatística de teste Qui-Quadrado, sob a distribuição do mesmo nome, delimitando o ponto de fronteira entre RA e RC. O primeiro grá�co representa o teste de hipótese bicaudal, com a região crítica nas extremidades das duas caldas, onde é dividido igualmente e apresentado à esquerda como - e à direita como . Abaixo da projeção, é orientado a realizar a consulta à tabela com α/2 e ᵩ = n-1 (superior) e 1- α/2 e ᵩ = n-1 (inferior). Na sequência, veri�ca-se a representação da região crítica de um teste unilateral à direita, com representado por e, abaixo da projeção, é orientado consultar a tabela com α e ᵩ = n-1 (superior). Por último, a representação de um teste unilateral à esquerda, com representado por e, abaixo da projeção, é informado para realizar a consulta a tabela com 1 - α e ᵩ = n-1 (inferior). 4º: Cálculo do valor da estatística de teste σ2 0 1 0 0 : = σ2 σ20 1 : ≠ σ2 σ20 1 : >σ2 σ20 1 : <σ2 σ20 χ2 φ = (n− 1) χ2 χ2 χ2inferior χ2superior χ2 χ2superior χ2 χ2inferior Onde: = tamanho da amostra = variância amostral = variância populacional 5º: Possíveis conclusões para: Teste bicaudal: Se → Não rejeita H . Se > ou < → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . Teste de significância para proporção Conheceremos agora o teste de signi�cância para proporção. Acompanhe o passo a passo, que nos propiciará possíveis conclusões para os testes bicaudal, unilateral à direita e unilateral à esquerda. Vejamos: 1º: São de�nidas H e H . H (hipótese nula), apresentada como H . Já H (hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o interesse da pesquisa e do pesquisador: (a) H ou (b) H ou (c) H 2º: Fixa-se α, e a variável de teste será Z (normal padronizada). =χ2calculada S2 σ20 n S2 σ2 ≤ ≤χ2inferior χ2calculada χ2superior 0 χ2calculada χ2superior χ2calculada χ2inferior 0 <χ2calculada χ2superior 0 >χ2calculada χ2superior 0 >χ2calculada χ2inferior 0 <χ2calculada χ2inferior 0 0 1 0 0 : p = p0 1 1 : p ≠ p0 1 : p > p0 1 : p < p0 3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). 4º: Cálculo do valor da estatística de teste: Onde: = proporção amostral = valor da hipótese nula = tamanho da amostra 5º: Possíveis conclusões para: Teste bicaudal: Se → Não rejeita H . Se > ou < → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . =Zcalculada f − p0 (1− )p0 p0 n − −−−−− √ f p0 n − ≤ ≤z α 2 Zcalculada Z α 2 0 Zcalculada Z α 2 Zcalculada −Z α 2 0 <Zcalculada Zα 0 >Zcalculada Zα 0 > −Zcalculada Zα 0 < −Zcalculada Zα 0 Agora que já abordamos toda a rotina para executar um teste de hipótese de signi�cância sobre a proporção populacional, teste seu entendimento, resolvendo a atividade a seguir. Conhecimento Teste seus Conhecimentos (Atividade não pontuada) Suponha que a ocorrência de uma certa doença Y seja de 30%, ou seja p = 0,30. Uma pesquisa apresentou uma amostra de 200 pessoas. Nessa amostra, 52 pessoas apresentaram a doença Y. Com , o pesquisador delimitou H1: . Após aplicar todos os passos para a resolução do teste, qual pode ter sido a conclusão do pesquisador? REFLITA α = 0, 05 p ≠ p0 a) Não há indícios estatísticos su�cientes que cause a rejeição de H , isto é, a proporção de pessoas na amostra com a doença Y não difere estatisticamente de 0,30 sob p > 0,05. b) Há indícios estatísticos que cause a rejeição de H , isto é, a proporção de pessoas na amostra com a doença Y difere estatisticamente de 0,30 sob p > 0,05. c) Há indícios estatísticos que cause a rejeição de H , isto é, a proporção de pessoas na amostra com a doença Y difere estatisticamente de 0,30 sob p > 0,05. d) Não há indícios estatísticos su�cientes que cause a rejeição de H , isto é, a proporção de pessoas na amostra com a doença Y não difere estatisticamente de 0,30 com probabilidade de 90%. e) Há indícios estatísticos que cause a rejeição de H , isto é, a proporção de pessoas na amostra com a doença Y difere estatisticamente de 0,30 sob p < 0,05. Em alguns estudos e circunstâncias, o interesse de pesquisa está em comparar duas populações, sob a ótica de seus parâmetros populacionais. Conforme Morettin e Bussab (2017), uma questão recorrente na Ciência é a seguinte: o método A é melhor do que o de B? 0 : p = p0 0 : p = p0 1 : p ≠ p0 0 : p = p0 0 : p = p0 Teste de Significância (Para duas Populações) 1. Administraçãode empresas: Eu mi bibendum neque egestas congue quisque egestas diam in. 2. Juros compostos: Eu mi bibendum neque egestas congue quisque egestas diam in. 3. Impostos: Eu mi bibendum neque egestas congue quisque egestas diam in. 4. Recursos Humanos: Eu mi bibendum neque egestas congue quisque egestas diam in. Vamos começar? A princípio, conheceremos mais acerca do teste de signi�cância para duas médias populacionais. Acompanhe! Teste de significância para duas médias populacionais Da mesma forma como trabalhamos na veri�cação da média populacional anteriormente, podemos ter ou não as variâncias populacionais conhecidas. Vejamos cada caso, apresentado individualmente, na sequência. Acompanhe! 1º Caso: amostras aleatórias independentes, de duas populações normais com variâncias ( ) conhecidas 1º: São de�nidas H e H . H (hipótese nula), apresentadas como H , e H (hipótese alternativa) é normalmente apresentada como: H . Os testes unicaudais, à direita e à esquerda, também são utilizados especi�camente conforme o interesse da pesquisa. 2º: Deve-se �xar , considerando a variável do teste normal padrão. 3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). A referência grá�ca para delimitação das áreas é a mesma apresentada anteriormente na Figura 1.2. 4º: Cálculo do valor da estatística de teste: Onde: σ2 0 1 0 0 : = μ1 μ2 1 1 : ≠ μ1 μ2 α =Zcalculada ( − )x̄1 x̄2 +σ21 n1 σ22 n2 − −−−−−− √ = média amostral da população 1 = média amostral da população 2 = variância da população 1 = variância da população 2 = tamanho amostral da população 1 = tamanho amostral da população 2 5º: Possíveis conclusões para: Teste bicaudal: Se → Não rejeita H . Se > ou < → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . 2 º caso: amostras aleatórias independentes, de duas populações normais com variâncias ( ) desconhecidas, mas assumidas como iguais 1º: Assim como indicado para o teste com variâncias populacionais conhecidas, são de�nidas H e H . 2º: Fixar , considerando desconhecida, a variável do teste será t de Student, com . 3º: Utilizando a tabela t, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). x̄1 x̄2 σ21 σ22 n1 n2 − ≤ ≤z α 2 Zcalculada Z α 2 0 Zcalculada Z α 2 Zcalculada −Z α 2 0 <Zcalculada Zα 0 >Zcalculada Zα 0 > −Zcalculada Zα 0 < −Zcalculada Zα 0 σ2 0 1 α σ2 φ = ( + − 2)n1 n2 A forma de construção dos grá�cos para apresentação de RA e RC é similar à Figura 1.2, apenas substituindo notação para a estatística de teste com base no uso da tabela t. 4º: Cálculo do valor da estatística de teste: Onde: = média amostral da população 1 = média amostral da população 2 = tamanho da amostra da população 1 = tamanho da amostra da população 2 = desvio-padrão amostral comum Para calcular utiliza-se a fórmula: Onde = tamanho da amostra da população 1 = tamanho da amostra da população 2 = variância amostral da população 1 = variância amostral da população 2 5º: Possíveis conclusões para: Teste bicaudal: Se → Não rejeita H . Se ou → Rejeita H . Teste unilateral à direita: =tcalculada ( − )x̄1 x̄2 Sc + n1 n2 n1n2 − −−−− √ x̄ 1 x̄ 2 n1 n2 Sc Sc =Sc ( − 1) + ( − 1)n1 S21 n2 S22 + − 2n1 n2 − −−−−−−−−−−−−−−−−−−− √ n1 n2 S21 S22 − ≤ ≤t α 2 tcalculada t α 2 0 >tcalculada t α 2 < −tcalculada t α 2 0 Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . Teste de significância para duas variâncias populacionais Estudante, é importante destacar que a aplicação desse procedimento considera amostras aleatórias de duas populações normalmente distribuídas e independentes. Vejamos os procedimentos. Vamos lá! 1º: São de�nidas H e H . H (hipótese nula), apresentadas como H . Já H (hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o interesse da pesquisa e do pesquisador: H ou (b) H ou (c) H . 2º: Fixa-se α, e a variável de teste será com graus de liberdade no numerador e graus de liberdade no denominador. 3º: Utilizando a tabela F de Snedecor, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). 4º: Cálculo do valor da estatística de teste: Onde: = variância da amostra da população 1 = variância da amostra da população 2 5º: Possíveis conclusões para: <tcalculada tα 0 >tcalculada tα 0 > −tcalculada tα 0 < −tcalculada tα 0 0 1 0 0 : = σ21 σ22 1 1 : ≠ σ21 σ22 1 : >σ21 σ22 1 : <σ21 σ22 F = ( − 1)φ1 n1 = ( − 1)φ2 n2 =Fcalculada S 21 S 22 S21 S22 Teste bicaudal: Se → Não rejeita H . Se ou → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . Teste de significância para duas proporções Até aqui, certamente você já está ciente da dinâmica de execução do teste. Vamos ao passo a-passo: 1º: São de�nidas H e H . H (hipótese nula), apresentadas como H . Já H (hipótese alternativa) pode ser apresentada dentre uma das 3 opções, de acordo com o interesse da pesquisa e do pesquisador: (a) H ou (b) H ou (c) H 2º: Fixa-se α, e a variável de teste será Z (normal padronizada). 3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região crítica (RC). 4º: Cálculo do valor da estatística de teste: Onde: = frequência relativa amostral da população 1 ≤ ≤Finferior Fcalculada Fsuperior 0 >Fcalculada Fsuperior <Fcalculada Finferior 0 <Fcalculada Fsuperior 0 >Fcalculada Fsuperior 0 >Fcalculada Finferior 0 <Fcalculada Finferior 0 0 1 0 0 : = p1 p2 1 1 : ≠ p1 p2 1 : > p1 p2 1 : < p1 p2 =Zcalculada −f1 f2 (1 − )( + )p̂ p̂ 1 n1 1 n2 − −−−−−−−−−−−−−−− √ f1 sendo = frequência relativa amostral da população 2 sendo = é o estimador gerado pela seguinte fórmula: = tamanho da amostra da população 1 = tamanho da amostra da população 2 5º: Possíveis conclusões para: Teste bicaudal: Se → Não rejeita H . Se ou → Rejeita H . Teste unilateral à direita: Se → Não rejeita H . Se → Rejeita H . Teste unilateral à esquerda: Se → Não rejeita H . Se → Rejeita H . Vejamos um exemplo de exercício para teste de hipótese, considerando duas proporções populacionais. O prefeito de uma determinada cidade estava ponderando investir em parques com aparelhos de ginástica. Para saber se seria um bom investimento para a cidade, foi realizado um estudo que buscava analisar a proporção de pessoas acima do peso. Na pesquisa, observou-se a incidência de pessoas obesas e o sexo. Suponha que, em uma amostra de 600 pessoas do sexo feminino, 72 são obesas, enquanto, em uma de 400 =f1 x1 n1 f2 =f2 x2 n2 p̂ =p̂ −x1 x2 −n1 n2 n1 n2 − ≤ ≤z α 2 Zcalculada Z α 2 0 >Zcalculada Z α 2 < −Zcalculada Z α 2 0 <Zcalculada Zα 0 >Zcalculada Zα 0 > −Zcalculada Zα 0 < −Zcalculada Zα 0 pessoas do sexo masculino, 56 são obesas. Teste a seguinte hipótese H contra a hipótese alternativa H ( ). Aplicando a fórmula apresentada anteriormente, observamos os seguintes resultados: 0 : = p1 p2 1 : ≠ p1 p2 α = 0, 05 = = = 0, 128p̂ +x1 x2 +n1 n2 72 + 56 600 + 400 = = = 0, 12f1 x1 n1 72 600 = = = 0, 14f2 x2 n2 56 400 =Zcal −f1 f2 (1 − )( + )p̂ p̂ 1 n1 1 n2 − −−−−−−−−−−−−−−− √ = = −0, 93Zcal 0, 12 − 0, 14 +0,128×0,872 600 0,128×0,872 400 − −−−−−−−−−−−−−−−− √ Figura - Teste de hipótese bilateral sob a normal padronizada Fonte: Adaptada de Martins e Domingues (2017). #PraCegoVer: a imagem apresenta a ilustração de uma curva de distribuição normal padronizada, com a representação de regiões críticas, destacadas, para um teste de hipótese bilateral. Estão destacados os pontos -1,96 (limite da região crítica inferior, à esquerda), -0,93 (estatística calculada a partir da fórmula para teste de média populacional) e 1,96 (limite da região críticasuperior, à esquerda). Como o valor de Z está contido na área de não rejeição, não se pode rejeitar H , isto é, a proporção de mulheres obesas não difere da dos homens acima do peso, para um nível de signi�cância de 5%. 0 : = p1 p2 Material Complementar F I L M E O homem que mudou o jogo / Moneyball Ano: 2011 Comentário: O �lme é baseado na história real de Billy Beane, contada por Michael Lewis no livro “Moneyball: the art of winning an unfair game”. Trata-se de uma utilização um pouco peculiar do uso da estatística nos esportes. Um dirigente de um pequeno time de beisebol, que estava nas últimas posições do ranking, utiliza uma so�sticada análise estatística dos jogadores para conseguir jogadores que fossem a peça-chave para o time a um baixo custo e fazer com que o time eleve consideravelmente de posição. As técnicas utilizadas por Billy Beane eram pouco conhecidas na época no campo dos esportes, e os resultados adquiridos �zeram com que grandes times revissem o modo de administrar os times de beisebol. Para conhecer mais sobre o �lme, acesse o trailer, disponível em: TRA I LER L I V R O Controle estatístico de qualidade Autor(es): Jay L. Devore Editora: Cengage Learning Brasil Capítulos: 8 e 9 Ano: 2018 ISBN: 9788522128044 Comentário: Um parâmetro pode ser estimado a partir dos dados da amostra tanto por um único número (uma estimativa pontual) como por um intervalo inteiro de valores plausíveis (um intervalo de con�ança). Frequentemente, entretanto, o objetivo de uma investigação não é estimar um parâmetro, mas decidir qual das duas alegações contraditórias sobre o parâmetro está correta. Os métodos de decisão compreendem a parte da inferência estatística chamada teste de hipóteses. No capítulo 8 são abordados alguns dos conceitos básicos e a terminologia usada no teste de hipóteses e depois desenvolvemos os procedimentos de decisão dos problemas de teste de hipóteses encontrados com mais frequência com base em uma amostra de uma única população. No capítulo 9 são apresentas os testes para fazer inferências considerando duas populações. Fonte: DEVORE, Jay L. Probabilidade e estatística para engenharia e ciências – Tradução da 9ª edição norte-americana. Cengage Learning Brasil, 2018. E-book. ISBN 9788522128044. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788522128044 Acesso em: 30 jan. 2023. https://integrada.minhabiblioteca.com.br/#/books/9788522128044/ Conclusão Caro(a) estudante, a con�abilidade e a aceitação dos resultados obtidos pelos processos de medição são muito relevantes no âmbito das questões metrológicas. Basicamente, nenhum tipo de medição que possa ser realizada representa o verdadeiro valor mensurado. Essa variação normalmente é explicada pelas limitações inerentes ao processo dimensional, as quais limitam as quantidades de medições que podem ser realizadas, assim como está associada aos efeitos das demais variações que possam estar presentes. Obviamente, existem mais situações e técnicas além das que abordamos, e certamente você conseguirá aumentar seus conhecimentos caso tenha necessidade ou interesse. Aproveite as dicas, textos complementares e consulte mais autores para aprofundar seus estudos. Divirta- se criando e testando hipóteses, além de tomar decisões mais conscientes com seus novos conhecimentos. Bons estudos! Referência s FONSECA, J. S. da; MARTINS, G. A. Curso de estatística. 6. ed. Porto Alegre: Grupo GEN, 2012. E-book. ISBN 9788522477937. (Disponível na Minha Biblioteca). HIRAKATA, V. N.; MANCUSO, A. C. B.; CASTRO, S. M. de J. Teste de hipóteses: perguntas que você sempre quis fazer, mas nunca teve coragem. Clinical & Biomedical Research, Porto Alegre, v. 39, n. 2, 2019. Disponível em: https://search.ebscohost.com/login.aspx? direct=true&AuthType=ip,url,uid&db=edsbas&AN=edsbas.A86A0083&lang=pt-br&site=eds-live. Acesso em: 23 jan. 2023. https://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,url,uid&db=edsbas&AN=edsbas.A86A0083&lang=pt-br&site=eds-live https://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,url,uid&db=edsbas&AN=edsbas.A86A0083&lang=pt-br&site=eds-live LIMA, F. F. de. O papel da estatística em laudos periciais criminais de entorpecentes: estudo de caso. Revista brasileira de segurança pública e cidadania, Brasília, v. 2, n. 1, p. 13-22, jan./jun. 2009. MARTINS, G. A.; DOMINGUES, O. Estatística geral e aplicada. 6. ed. Porto Alegre: Grupo GEN, 2017. E-book. ISBN 9788597012682. (Disponível na Minha Biblioteca). MORETTIN, P. A.; BUSSAB, W. O. Estatística básica. São Paulo: Saraiva, 2017. E-book. ISBN 9788547220228. (Disponível na Minha Biblioteca). SANTOS, D. F. dos et al. Teste de hipótese para diferença de proporção: um estudo sobre o consumo de rádio em 2018 e 2019, na cidade de Caruaru-PE. In: ENCONTRO NACIONAL DOS ESTUDANTES DE ESTATÍSTICA, 2020, João Pessoa. Anais [...]. João Pessoa, 2020. TRIOLA, M. F. Introdução à Estatística. 12. ed. Porto Alegre: Grupo GEN, 2017. E-book. ISBN 9788521634256. (Disponível na Minha Biblioteca).