Buscar

APLICAÇÕES DA ESTATÍSTICA NAS CIÊNCIAS HUMANAS

Prévia do material em texto

TÓPICOS ESPECIAIS INTEGRADORESTÓPICOS ESPECIAIS INTEGRADORES
EM ESTATÍSTICAEM ESTATÍSTICA
APLICAÇÕES DAAPLICAÇÕES DA
ESTATÍSTICA NAS CIÊNCIASESTATÍSTICA NAS CIÊNCIAS
HUMANAS E NA SAÚDE -HUMANAS E NA SAÚDE -
TESTE DE HIPÓTESESTESTE DE HIPÓTESES
Au to r ( a ) : M a . V i v i a n e d e J e s u s L e i t e
Au to r ( a ) : M a . A l e x a n d ra Wa l t r i c k R u s s i
R ev i s o r : A n d ré d a S i l va C o u ra
Tempo de leitura do conteúdo estimado em 1 hora e 3 minutos.
Introdução
Olá, estudante. Como vai?
Você já reparou como é natural tentarmos compreender a ocorrência de uma situação, o
comportamento de um grupo ou até uma característica, com base em informações
disponíveis, que normalmente são pequenas e acessíveis? Vejamos um exemplo
cotidiano que explique melhor essa ideia: conforme vivemos em cidade e prestamos
atenção ao clima, ao longo dos dias, tentamos identi�car alguns padrões característicos
para compreender e até prever a ocorrência de chuvas ou da mudança de clima.
Evidentemente, é possível consultar sites ou notícias sobre uma previsão mais direta,
mas quem nunca presenciou uma pessoa mais velha, com toda sua sabedoria em
meteorologia, olhar pela janela e profetizar que choverá mais tarde? É importante
entender, nesse exemplo, que o segredo que envolve a previsão assertiva está na
observação das características que rodeiam o evento chuva e o teste de hipótese para
selecionar eventos que merecem mais atenção na previsão.
Ao longo de nossos estudos, veremos a de�nição dos conceitos e termos relacionados
aos testes de hipótese e como são estabelecidos; que medidas populacionais são
normalmente estimadas a partir de dados amostrais; os tipos de erro atrelados aos
testes e a forma de dimensioná-los e como proceder com a veri�cação da signi�cância
nos diferentes testes de hipóteses mais comuns. Vamos lá? Bons estudos!
O objetivo da análise de conglomerados, também conhecida como análise de
agrupamentos ou de cluster, é particionar um conjunto de dados em grupos que são
internamente homogêneos e externamente distintos, ou seja, segmentar ou agrupar em
grupos menores (subgrupos). A classi�cação é realizada com base em uma medida de
similaridade ou dissimilaridade dentro e entre os grupos.
As hipóteses podem surgir de diferentes formas, como nos exemplos apresentados de
Triola (2017): na área da saúde, por exemplo, em geral, a�rma-se que a temperatura
corporal média é de 98,6 °F, e podemos testar essa a�rmativa usando uma amostra de n
temperaturas corporais com média de 98,2 °F.
Dentre os parâmetros populacionais, estudaremos os mais utilizados, ao longo desta
disciplina:
a média populacional, representada pela letra grega µ (mi)   representada com
dados amostrais por ;
a variância populacional, representada pela letra grega σ (sigma ao quadrado) –
lembrando que, ao utilizar apenas σ, estamos apresentando o desvio-padrão, que,
em dados amostrais, é representada por s ;
a proporção populacional, representada pela letra p.
Conforme Hair et al. (2009), para realizar uma análise de cluster cuidadosa, são
necessários métodos com as seguintes características:
Triola (2017) apresenta a hipótese nula como uma a�rmativa de que o valor de um
parâmetro populacional é igual a algum valor especí�co, em que o termo “nula” indica
ausência de mudança, efeito ou diferença, por isso chamada anteriormente de
“conservadora”. Já H1 apresenta uma a�rmativa de que o parâmetro tem um valor que,
Teste de Hipóteses -
Introdução
x̄
2
2
de alguma forma, difere da hipótese nula. A apresentação simbólica da hipótese
alternativa deve conter o símbolo < (menor que), > (maior que) ou ≠ (diferente).
Observe alguns exemplos de hipóteses contextualizados:
a) A altura média da população masculina, em uma determinada cidade brasileira, entre
25 e 39 anos, é de 1,73 m, segundo a Secretaria Estadual de Saúde. A ideia é testar se a
média de altura em questão difere ou não da medida representação:
Podemos considerar que o erro de medição sempre estará presente quando a indicação
do sistema de medição não relacionar corretamente com o valor verdadeiro do
mensurando. Sendo assim, de�ne-se como erro de medição a diferença entre o valor
indicado pelo sistema de medição e o valor verdadeiro do componente ou da peça
dimensionada.
Observe a forma como as hipótesesObserve a forma como as hipóteses
são apresentadas gra�camente:são apresentadas gra�camente:
HH : : = (valor observado com base = (valor observado com base
na amostra)na amostra)
HH : : < ou > ou ≠ (valor observado < ou > ou ≠ (valor observado
com base na amostra)com base na amostra)
00 θθ
11 θθ
: μ = 1, 73mH0
: μ ≠ 1, 73mH1
: σ = (R$250H0 )2
: σ  > (R$250H1 )2
c) A proporção da população brasileira adulta, classi�cada com algum grau de
obesidade, é de 60,3% (no caso dessa pesquisa, o interesse é veri�car se o parâmetro
populacional está superestimado).
No decorrer de nossos estudos, veremos como os cálculos dos testes de hipóteses
ocorrem. Contudo, é importante assimilar que, dependendo do tipo de hipótese
estabelecida, a projeção grá�ca e o cálculo variam.
Observe o infográ�co a seguir, com as três representações das possíveis hipóteses
alternativas e seus respectivos nomes:
REGIÕES CRÍTICAS SOB DIFERENTES
HIPÓTESES ALTERNATIVAS
: p =  60, 3H0
: p < 60, 3H1
Fonte: Adaptadas de Triola (2017).
#PraCegoVer: o infográ�co apresenta três representações grá�cas que identi�cam as formas
de cada uma das hipóteses alternativas (H ) possíveis. Todas têm a aparência de uma curva
de distribuição normal e têm, nas áreas de probabilidade, destacadas, com cor mais clara, a
área de não rejeição e, com cor mais acentuada, a área de rejeição. Entre as duas áreas, há
uma reta que divide as regiões. Abaixo de cada grá�co, estão a identi�cação do sinal
utilizado em H e o nome pertinente da representação. Uma sobre a outra, a primeira
apresenta, em ambas as extremidades externas, áreas de tamanhos iguais e destacadas com
cor acentuada que representam a hipótese alternativa (H ) de diferença, sendo atrelada ao
“Teste bilateral”. Abaixo uma curva apresenta, apenas no extremo da cauda esquerda, a área
com cor destacada, representando a hipótese alternativa (H ) com sinal de “>” e sendo
pertinente ao “Teste unilateral à esquerda”. Por último, uma curva apresenta, apenas no
extremo da cauda direita, a área com cor destacada, representando a hipótese alternativa
(H ) com sinal de “<” e sendo pertinente ao “Teste unilateral à direita”.
As projeções grá�cas das hipóteses são um recurso facilitador, mas não obrigatório,
tanto para a escolha da hipótese alternativa mais adequada quanto para a identi�cação
da decisão a ser tomada, entre rejeitar ou não a hipótese nula.
Vale lembrar que a notação adotada para a identi�cação das hipóteses pode variar
conforme o autor ou o software utilizado para análise do teste. A hipótese nula não
difere da notação H0, mas a hipótese alternativa pode assumir H1 ou Ha.
Até aqui, estudante, você já foi apresentado(a) à hipótese estatística, às hipóteses
possíveis em um teste de hipótese e deve conseguir identi�car o par de hipóteses a
serem testadas (nula e alternativa) por uma a�rmativa e expressar ambas de forma
simbólica.
1
1
1
1
1
quando se trata da interpretação do resultado de um teste de hipótese,
apesar de ser mais simples o entendimento, não se pode aceitar uma
hipótese, e sim, não rejeitar.
 
Agora, para �nalizar esse tópico, resolveremos uma atividade. Vamos lá?
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
O rótulo de uma garrafa de refrigerante contém a informação de que possui, em
média, 1 litro. Para sanar a dúvida e refutar a denúncia de que a quantidade média
real de refrigerante seria de 0,952 litros, com um desvio-padrão de 0,08 litros, a fábrica
do refrigerante cogita conduzir uma pesquisa para veri�car a veracidade da
informação apresentada nos rótulos, testando uma possível diferença de valor.
Assinale a alternativa correta, que indica a forma simbólicadas hipóteses capazes de
veri�car se a denúncia está equivocada:
a) e 
b) e 
c) e 
d) e  
e) e  
: μ =  H0 μ0 : μ ≤  H1 μ0
: μ =  H0 μ0 : μ <H1 μ0
: μ =  H0 μ0 : μ >  H1 μ0
: μ =  H0 μ0 : μ ≠  H1 μ0
: μ =  H0 μ0 : μ ≥  H1 μ0
Erros tipo I e tipo II
Caro(a) estudante, ao testar um conjunto de hipóteses, Martins e Domingues (2017)
apresentam dois tipos de erros num teste de hipótese estatístico, ao tomarmos a
decisão de rejeitar ou não H0: erro tipo I e erro tipo II.
Ao decidir rejeitar H , quando, na verdade, a ação correta seria não rejeitar (hipótese
nula é verdadeira), veri�camos a ocorrência de um erro tipo I. Esse erro também pode
ser de�nido pela letra grega alfa ( ).
Da mesma maneira, quando decidimos não rejeitar H quando, na verdade, a ação
correta seria rejeitar (hipótese nula é falsa), veri�camos a ocorrência de um erro tipo II.
Esse erro também pode ser de�nido pela letra grega beta ( ).
De forma geral, o Código de Nuremberg estabeleceu que nenhum ser humano poderia
ser submetido a projetos de pesquisa sem o seu devido consentimento, sendo o
primeiro documento a ter alcance internacional, por conta, principalmente, do repúdio da
comunidade internacional quanto aos crimes cometidos no período nazi-fascista
(PALÁCIOS; REGO; SCHRAMM, 2009).
0
α
0
β
A necessidade de regulamentação de pesquisas em seres humanos, para proteger seus
participantes, e o desejo do corpo médico ter sua própria regulamentação foram
motivações para a criação da Declaração de Helsinque, a qual foi aprovada pela
Associação Médica Mundial, e cuja primeira versão é de 1964 (PALÁCIOS; REGO;
SCHRAMM, 2009).
Você pode encontrar em algumas referências à representação de erros dos testes de
hipótese, como as apresentadas em Morettin e Bussab (2017), que apresenta os tipos
de erros da seguinte forma:
Em 1988, o Conselho Nacional de Saúde (CNS) do Brasil estabeleceu normas que tratam
da ética em pesquisa com seres humanos e, em 10 de outubro de 1996, aprovou as
diretrizes/normas que regulamentam pesquisas com seres humanos, denominada
Resolução 196/96 (PALÁCIOS; REGO; SCHRAMM, 2009).
A Resolução 196/96 estabeleceu princípios básicos para permitir apreciação da ética
em protocolos de pesquisa, criando os Comitês de Ética em Pesquisa (CEP) e a
Comissão Nacional de Ética em Pesquisa (Conep). O conteúdo da resolução incorpora
as experiências históricas da regulamentação sobre ética em pesquisa, principalmente
com base no Código de Nuremberg (1947), na Declaração dos Direitos Humanos (1948),
na Declaração de Helsinque (desde a primeira versão de 1964), nas Diretrizes
Internacionais para a Revisão Ética de Estudos Epidemiológicos e nas Diretrizes Éticas
Internacionais para Pesquisas Biomédicas Envolvendo Seres Humanos, assim como em
conteúdos de leis promulgadas após a aprovação da Constituição de 1988 (PALÁCIOS;
REGO; SCHRAMM, 2009; NOVOA, 2014).
Samohyl (2009) estabelece que o grá�co de soma acumulada (CUSUM) é um
aprimoramento do grá�co de controle X de Shewhart, este, de�nido como sendo a forma
de monitoramento da média de um processo especí�co cuja característica de
qualidade de interesse X é uma grandeza mensurável representada. Assim sendo, o
CUSUM é o mais apropriado para se reconhecer o histórico dos dados, característica
ausente em grá�cos mais simples, e também para identi�car pequenas alterações nos
processos muito antes dos alarmes dos grá�cos X, considerados como LSC e LIC.
Uma das formas de minimizar o erro, em uma pesquisa estatística, é aumentar o
tamanho amostral. Essa medida pode acarretar alguns ônus, como ampliar o tempo de
pesquisa e dos custos envolvidos ou outras alterações que podem impactar
signi�cativamente o estudo. Para um mesmo tamanho de amostra, a probabilidade de
incorrer em um erro tipo II aumenta à medida que diminui a probabilidade do erro tipo I e
vice-versa.
μμ
Agora que já tratamos do embasamento teórico de testes de hipótese, abordaremos a
construção de testes estatísticos e como realizar um teste de signi�cância. Seguimos?
Vamos lá!
Para realizar um teste de signi�cância, conforme Martins e Domingues (2017), deve-se
considerar apenas o erro. Dessa forma, traçamos um passo a passo, resumido, para
realização dos testes de signi�cância.
1. conteúdo do item 1: Eu mi bibendum neque egestas congue quisque
egestas diam in.
2. conteúdo do item 2: Eu mi bibendum neque egestas congue quisque
egestas diam in.
3. conteúdo do item 3: Eu mi bibendum neque egestas congue quisque
egestas diam in.
Para a condução de testes de signi�cância, é muito importante delimitar bem os 5
passos, atentando para os valores e medidas. Contudo, as etapas que envolvem
cálculos podem ser efetuadas como recursos computacionais, como planilhas
eletrônicas ou mesmo softwares estatísticos.
Na sequência, veremos como aplicar os passos de resolução para diferentes
parâmetros de interesse. Vamos lá!
Teste de significância para média
populacional
Teste de Significância
Apesar de a eticidade e a cienti�cidade da pesquisa cientí�ca, em especial, daquela
realizada com seres humanos, serem aspectos que caminham juntos, não cabe aos
Comitês de Ética em Pesquisa (CEP) a emissão de pareceres sobre a metodologia
utilizada no desenvolvimento dos estudos (NOVOA, 2014).
Vamos ao 1º caso: média populacional com variância populacional ( ) conhecida
1º: São de�nidas H e H . H (hipótese nula) é apresentada como H . Já H
(hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o
interesse da pesquisa e do pesquisador:
(a) H   ou  (b) H  ou  (c) H 
2º: Fixa-se α, considerando conhecida, a variável de teste será Z (normal
padronizada).
3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região
crítica (RC).
σ2
0 1 0 0 : μ =  μ0 1
1 : μ ≠  μ0 1 : μ > μ0 1 : μ < μ0
σ2
Figura 1.2 - Regiões críticas das hipóteses do teste sob a distribuição normal
padronizada.
Fonte: Adaptada de Martins e Domingues.
#PraCegoVer: a imagem apresenta as três possíveis representações de região crítica das
hipóteses de teste, com a informação da estatística de teste Z, sob a normal padronizada,
delimitando o ponto de fronteira entre RA e RC. O 1º grá�co representa o teste de hipótese
bicaudal, com a região crítica nas extremidades das duas caldas, em que Z é dividido
igualmente e apresentado à esquerda como - e à direita como . Abaixo, apresenta a
informação para consultar a tabela Z com o valor de α adotado. Na sequência, veri�ca-se a
representação da região crítica de um teste unilateral à direita, com Z representado por e,
por último, a representação de um teste unilateral à esquerda, com Z representado por - .
Abaixo, dos testes unilaterais, há a informação para consultar a tabela Z com o dobro do
valor de α adotado (nível de signi�cância).
Não existem sistemas de medição que possam ser classi�cados como ideais. Dessa
forma, é atribuição direta dos engenheiros de�nir e implantar sistemas de medição que
apresentem propriedades estatísticas consideradas adequadas.
Onde:
= média amostral
= valor da hipótese nula
Z α
2
Z α
2
Zα
Zα
=Zcalculada
−x̄ μ0
σ
n√
x̄
μ0
 = desvio-padrão populacional
 = tamanho da amostra
5º: Possíveis conclusões para:
A pesquisa epidemiológica tem por base a coleta sistemática de dados sobre eventos
associados, principalmente, à saúde das pessoas pertencentes a populações de
interesse. O tratamento analítico dado aos fatores pesquisados tem base em três
procedimentos, a saber, a mensuração de variáveis aleatórias, a estimação de
parâmetros populacionais e o uso de testes estatísticos (BLOCH; COUTINHO, 2009).
Se → Não rejeita H .
Se > ou   < → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
Agora, o 2º caso: média populacional com variância populacional ( ) desconhecida
1º: Assim como indicado para o teste com variância populacional conhecida, são
de�nidas H e H .
2º: Fixar , considerando desconhecida,a variável do teste será t de Student, com
.
3º: Utilizando a tabela t, são determinadas as áreas de não rejeição (RA) e a região
crítica (RC).
σ
n
− ≤ ≤z α
2
Zcalculada Z α
2
0
Zcalculada Z α
2
Zcalculada −Z α
2
0
<Zcalculada Zα 0
>Zcalculada Zα 0
> −Zcalculada Zα 0
< −Zcalculada Zα 0
σ2
0 1
α σ2
φ = (n− 1)
4º: Cálculo do valor da estatística de teste
Onde:
 = média amostral
 = valor da hipótese nula
 = desvio-padrão amostral
 = tamanho da amostra
5º: Possíveis conclusões para:
Teste bicaudal:
Se → Não rejeita H .
Se > ou   < → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
=tcalculada
−x̄ μ0
S
n√
x̄
μ0
S
n
− ≤ ≤t α
2
tcalculada t α
2
0
tcalculada t α
2
tcalculada −t α
2
0
<tcalculada tα 0
>tcalculada tα 0
> −tcalculada tα 0
< −tcalculada tα 0
Vejamos um exemplo de aplicação do teste de hipótese para média populacional.
Ao assumir a gestão de um grande time de futebol de um estado brasileiro, o dirigente
deveria rever os gastos com os salários dos esportistas. Para determinar os jogadores
que manteria no time e os que tentaria trocar por outros, pediu um levantamento do
aproveitamento, em campo, nas últimas duas partidas de treinamento. O
aproveitamento seria o percentual de tempo em que esteve com a posse de bola, e a
jogada resultou em gol para seu time. A expectativa era que os jogadores tivessem, em
média, pelo menos 44% de aproveitamento. Ao �nal dos dois treinos, foram
selecionados 20 jogadores para veri�car o aproveitamento, nessa primeira leva de
avaliação. Os dados observados, já organizados em ordem crescente, são: 40, 40, 41, 42,
42, 43, 43, 43, 44, 44, 44, 44, 45, 45, 45, 46, 46, 46, 48 e 48. Considerando um nível de
signi�cância de 5%, veri�que as hipóteses testadas, como foram e a que conclusão o
dirigente chegou para essa primeira equipe avaliada.
Para a resolução da demanda, começamos estabelecendo as hipóteses consideradas:
H0:
H1 
 = 0,01
= -2,5395
Aplicando a fórmula, temos:
Como < - 2, 5395, não se rejeita H0, concluindo-se que o aproveitamento em campo
foi menor que o esperado, e o dirigente deve rever a contratação desses jogadores
avaliados.
Vejamos, na sequência, os procedimentos para aplicação de testes de hipótese, nos
casos de interesse na variância populacional.
Teste de significância para variância
populacional ( )
   μ  = 44
:  μ  > 44
α
tα
= = = −0, 0980tcalculada
−x̄ μ0
S
n√
43, 95 − 44
2,28
20√
tcal
σ2
Nesse subtópico, vamos aprofundar nossos conhecimentos acerca do teste de
signi�cância para variância populacional ( ). Acompanhe!
1º: São de�nidas H e H . H (hipótese nula), apresentadas como H . Já H1
(hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o
interesse da pesquisa e do pesquisador:
(a) H   ou  (b) H  ou  (c) H 
2º: Fixa-se α, e a variável de teste será (Qui-Quadrado) com .
3º: Utilizando a tabela , são determinadas as áreas de não rejeição (RA) e a região
crítica (RC).
Figura 1.3 - Regiões críticas das hipóteses do teste sob a distribuição Qui-Quadrado
Fonte: Adaptada de Martins e Domingues (2017).
#PraCegoVer: a imagem apresenta três grá�cos, que demonstram as possíveis
representações de região crítica das hipóteses de teste, com a informação da estatística de
teste Qui-Quadrado, sob a distribuição do mesmo nome, delimitando o ponto de fronteira
entre RA e RC. O primeiro grá�co representa o teste de hipótese bicaudal, com a região crítica
nas extremidades das duas caldas, onde é dividido igualmente e apresentado à esquerda
como - e à direita como . Abaixo da projeção, é orientado a realizar a
consulta à tabela com α/2 e ᵩ = n-1 (superior) e 1- α/2 e ᵩ = n-1 (inferior). Na sequência,
veri�ca-se a representação da região crítica de um teste unilateral à direita, com 
representado por e, abaixo da projeção, é orientado consultar a tabela com α e ᵩ =
n-1 (superior). Por último, a representação de um teste unilateral à esquerda, com 
representado por e, abaixo da projeção, é informado para realizar a consulta a
tabela com 1 - α e ᵩ = n-1 (inferior).
4º: Cálculo do valor da estatística de teste
σ2
0 1 0 0 : =  σ2 σ20
1 : ≠  σ2 σ20 1 : >σ2 σ20 1 : <σ2 σ20
χ2 φ = (n− 1)
χ2
χ2
χ2inferior χ2superior
χ2
χ2superior
χ2
χ2inferior
Onde:
 = tamanho da amostra
 = variância amostral
 = variância populacional
5º: Possíveis conclusões para:
Teste bicaudal:
Se → Não rejeita H .
Se > ou   < → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
Teste de significância para proporção
Conheceremos agora o teste de signi�cância para proporção. Acompanhe o passo a
passo, que nos propiciará possíveis conclusões para os testes bicaudal, unilateral à
direita e unilateral à esquerda. Vejamos:
1º: São de�nidas H e H . H (hipótese nula), apresentada como H . Já H
(hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o
interesse da pesquisa e do pesquisador:
(a) H   ou  (b) H  ou  (c) H 
2º: Fixa-se α, e a variável de teste será Z (normal padronizada).
=χ2calculada
S2
σ20
n
S2
σ2
≤ ≤χ2inferior χ2calculada χ2superior 0
χ2calculada χ2superior χ2calculada χ2inferior 0
<χ2calculada χ2superior 0
>χ2calculada χ2superior 0
>χ2calculada χ2inferior 0
<χ2calculada χ2inferior 0
0 1 0 0 : p =  p0 1
1 : p ≠  p0 1 : p > p0 1 : p < p0
3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região
crítica (RC).
4º: Cálculo do valor da estatística de teste:
Onde:
 = proporção amostral
 = valor da hipótese nula
 = tamanho da amostra
5º: Possíveis conclusões para:
Teste bicaudal:
Se → Não rejeita H .
Se > ou   < → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
=Zcalculada
f − p0
(1− )p0 p0
n
− −−−−−
√
f
p0
n
− ≤ ≤z α
2
Zcalculada Z α
2
0
Zcalculada Z α
2
Zcalculada −Z α
2
0
<Zcalculada Zα 0
>Zcalculada Zα 0
> −Zcalculada Zα 0
< −Zcalculada Zα 0
Agora que já abordamos toda a rotina para executar um teste de hipótese de
signi�cância sobre a proporção populacional, teste seu entendimento, resolvendo a
atividade a seguir.
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Suponha que a ocorrência de uma certa doença Y seja de 30%, ou seja p = 0,30. Uma
pesquisa apresentou uma amostra de 200 pessoas. Nessa amostra, 52 pessoas
apresentaram a doença Y. Com , o pesquisador delimitou H1: . Após
aplicar todos os passos para a resolução do teste, qual pode ter sido a conclusão do
pesquisador?
REFLITA
α = 0, 05 p ≠  p0
a) Não há indícios estatísticos su�cientes que cause a rejeição de H ,
isto é, a proporção de pessoas na amostra com a doença Y não difere
estatisticamente de 0,30 sob p > 0,05.
b) Há indícios estatísticos que cause a rejeição de H , isto é, a
proporção de pessoas na amostra com a doença Y difere estatisticamente de
0,30 sob p > 0,05.
c) Há indícios estatísticos que cause a rejeição de H , isto é, a
proporção de pessoas na amostra com a doença Y difere estatisticamente de
0,30 sob p > 0,05.
d) Não há indícios estatísticos su�cientes que cause a rejeição de H ,
isto é, a proporção de pessoas na amostra com a doença Y não difere
estatisticamente de 0,30 com probabilidade de 90%.
e) Há indícios estatísticos que cause a rejeição de H , isto é, a
proporção de pessoas na amostra com a doença Y difere estatisticamente de
0,30 sob p < 0,05.
Em alguns estudos e circunstâncias, o interesse de pesquisa está em comparar duas
populações, sob a ótica de seus parâmetros populacionais. Conforme Morettin e
Bussab (2017), uma questão recorrente na Ciência é a seguinte: o método A é melhor do
que o de B?
0 : p =  p0
0 : p =  p0
1 : p ≠  p0
0 : p =  p0
0 : p =  p0
Teste de Significância
(Para duas
Populações)
1. Administraçãode empresas: Eu mi bibendum neque egestas congue quisque
egestas diam in.
2. Juros compostos: Eu mi bibendum neque egestas congue quisque egestas diam in.
3. Impostos: Eu mi bibendum neque egestas congue quisque egestas diam in.
4. Recursos Humanos: Eu mi bibendum neque egestas congue quisque egestas diam
in.
Vamos começar? A princípio, conheceremos mais acerca do teste de signi�cância para
duas médias populacionais. Acompanhe!
Teste de significância para duas médias
populacionais
Da mesma forma como trabalhamos na veri�cação da média populacional
anteriormente, podemos ter ou não as variâncias populacionais conhecidas. Vejamos
cada caso, apresentado individualmente, na sequência. Acompanhe!
1º Caso: amostras aleatórias independentes, de duas populações normais com
variâncias ( ) conhecidas
1º: São de�nidas H e H . H (hipótese nula), apresentadas como H , e H
(hipótese alternativa) é normalmente apresentada como: H . Os testes
unicaudais, à direita e à esquerda, também são utilizados especi�camente conforme o
interesse da pesquisa.
2º: Deve-se �xar , considerando a variável do teste normal padrão.
3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região
crítica (RC). A referência grá�ca para delimitação das áreas é a mesma apresentada
anteriormente na Figura 1.2.
4º: Cálculo do valor da estatística de teste:
Onde:
σ2
0 1 0 0 : =  μ1 μ2 1
1 : ≠  μ1 μ2
α
=Zcalculada
( − )x̄1 x̄2
  +σ21
n1
σ22
n2
− −−−−−−
√
= média amostral da população 1
= média amostral da população 2
 = variância da população 1
 = variância da população 2
 = tamanho amostral da população 1
 = tamanho amostral da população 2
5º: Possíveis conclusões para:
Teste bicaudal:
Se → Não rejeita H .
Se > ou   < → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
2 º caso: amostras aleatórias independentes, de duas populações normais com
variâncias ( ) desconhecidas, mas assumidas como iguais
1º: Assim como indicado para o teste com variâncias populacionais conhecidas, são
de�nidas H e H .
2º: Fixar , considerando desconhecida, a variável do teste será t de Student, com
.
3º: Utilizando a tabela t, são determinadas as áreas de não rejeição (RA) e a região
crítica (RC).
 x̄1
 x̄2
σ21
σ22
n1
n2
− ≤ ≤z α
2
Zcalculada Z α
2
0
Zcalculada Z α
2
Zcalculada −Z α
2
0
<Zcalculada Zα 0
>Zcalculada Zα 0
> −Zcalculada Zα 0
< −Zcalculada Zα 0
σ2
0 1
α σ2
φ = ( +   − 2)n1 n2
A forma de construção dos grá�cos para apresentação de RA e RC é similar à Figura 1.2,
apenas substituindo notação para a estatística de teste com base no uso da tabela t.
4º: Cálculo do valor da estatística de teste:
Onde:
= média amostral da população 1
= média amostral da população 2
 = tamanho da amostra da população 1
 = tamanho da amostra da população 2
 = desvio-padrão amostral comum
Para calcular utiliza-se a fórmula:
Onde
 = tamanho da amostra da população 1
 = tamanho da amostra da população 2
 = variância amostral da população 1
 =  variância amostral da população 2
5º: Possíveis conclusões para:
Teste bicaudal:
Se → Não rejeita H .
Se ou   → Rejeita H .
Teste unilateral à direita:
=tcalculada
( − )x̄1 x̄2
Sc
+ n1 n2
n1n2
− −−−−
√
x̄ 1
x̄ 2
n1
n2
Sc
Sc
=Sc
( − 1) + ( − 1)n1 S21 n2 S22
+ − 2n1 n2
− −−−−−−−−−−−−−−−−−−−
√
n1
n2
S21
S22
− ≤ ≤t α
2
tcalculada t α
2
0
>tcalculada t α
2
< −tcalculada t α
2
0
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
Teste de significância para duas variâncias
populacionais
Estudante, é importante destacar que a aplicação desse procedimento considera
amostras aleatórias de duas populações normalmente distribuídas e independentes.
Vejamos os procedimentos.
Vamos lá!
1º: São de�nidas H e H . H (hipótese nula), apresentadas como H . Já H
(hipótese alternativa) pode ser apresentada dentre uma das 3 opções, conforme o
interesse da pesquisa e do pesquisador: H ou (b) H  ou  (c) H
.
2º: Fixa-se α, e a variável de teste será com graus de liberdade no
numerador e graus de liberdade no denominador.
3º: Utilizando a tabela F de Snedecor, são determinadas as áreas de não rejeição (RA) e
a região crítica (RC).
4º: Cálculo do valor da estatística de teste:
Onde:
 = variância da amostra da população 1
 = variância da amostra da população 2
5º: Possíveis conclusões para:
<tcalculada tα 0
>tcalculada tα 0
> −tcalculada tα 0
< −tcalculada tα 0
0 1 0 0 : =  σ21 σ22 1
1 : ≠  σ21 σ22 1 : >σ21 σ22 1
: <σ21 σ22
F = ( − 1)φ1 n1
= ( − 1)φ2 n2
=Fcalculada
S 21
S 22
S21
S22
Teste bicaudal:
Se → Não rejeita H .
Se ou   → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
Teste de significância para duas proporções
Até aqui, certamente você já está ciente da dinâmica de execução do teste. Vamos ao
passo a-passo:
1º: São de�nidas H e H . H (hipótese nula), apresentadas como H . Já H
(hipótese alternativa) pode ser apresentada dentre uma das 3 opções, de acordo com o
interesse da pesquisa e do pesquisador:
(a) H   ou  (b) H   ou  (c) H 
2º: Fixa-se α, e a variável de teste será Z (normal padronizada).
3º: Utilizando a tabela Z, são determinadas as áreas de não rejeição (RA) e a região
crítica (RC).
4º: Cálculo do valor da estatística de teste:
Onde:
= frequência relativa amostral da população 1
≤ ≤Finferior Fcalculada Fsuperior 0
>Fcalculada Fsuperior <Fcalculada Finferior 0
<Fcalculada Fsuperior 0
>Fcalculada Fsuperior 0
>Fcalculada Finferior 0
<Fcalculada Finferior 0
0 1 0 0 : =  p1 p2 1
1 : ≠  p1 p2 1 : >  p1 p2 1 : <  p1 p2
=Zcalculada
−f1 f2
(1 − )( + )p̂ p̂ 1
n1
1
n2
− −−−−−−−−−−−−−−−
√
 f1
sendo 
= frequência relativa amostral da população 2
sendo 
 = é o estimador gerado pela seguinte fórmula:
 = tamanho da amostra da população 1
 = tamanho da amostra da população 2
5º: Possíveis conclusões para:
Teste bicaudal:
Se → Não rejeita H .
Se ou   → Rejeita H .
Teste unilateral à direita:
Se → Não rejeita H .
Se → Rejeita H .
Teste unilateral à esquerda:
Se → Não rejeita H .
Se → Rejeita H .
Vejamos um exemplo de exercício para teste de hipótese, considerando duas
proporções populacionais.
O prefeito de uma determinada cidade estava ponderando investir em parques com
aparelhos de ginástica. Para saber se seria um bom investimento para a cidade, foi
realizado um estudo que buscava analisar a proporção de pessoas acima do peso. Na
pesquisa, observou-se a incidência de pessoas obesas e o sexo. Suponha que, em uma
amostra de 600 pessoas do sexo feminino, 72 são obesas, enquanto, em uma de 400
=f1
x1
n1
 f2
=f2
x2
n2
p̂
=p̂
−x1 x2
−n1 n2
n1
n2
− ≤ ≤z α
2
Zcalculada Z α
2
0
>Zcalculada Z α
2
< −Zcalculada Z α
2
0
<Zcalculada Zα 0
>Zcalculada Zα 0
> −Zcalculada Zα 0
< −Zcalculada Zα 0
pessoas do sexo masculino, 56 são obesas. Teste a seguinte hipótese H 
contra a hipótese alternativa H ( ).
Aplicando a fórmula apresentada anteriormente, observamos os seguintes resultados:
0 : =  p1 p2
1 : ≠  p1 p2 α = 0, 05
= = = 0, 128p̂
+x1 x2
+n1 n2
72 + 56
600 + 400
= = = 0, 12f1
x1
n1
72
600
= = = 0, 14f2
x2
n2
56
400
=Zcal
−f1 f2
(1 − )( + )p̂ p̂ 1
n1
1
n2
− −−−−−−−−−−−−−−−
√
= = −0, 93Zcal
0, 12 − 0, 14
+0,128×0,872
600
0,128×0,872
400
− −−−−−−−−−−−−−−−−
√
Figura - Teste de hipótese bilateral sob a normal padronizada
Fonte: Adaptada de Martins e Domingues (2017).
#PraCegoVer: a imagem apresenta a ilustração de uma curva de distribuição normal
padronizada, com a representação de regiões críticas, destacadas, para um teste de hipótese
bilateral. Estão destacados os pontos -1,96 (limite da região crítica inferior, à esquerda), -0,93
(estatística calculada a partir da fórmula para teste de média populacional) e 1,96 (limite da
região críticasuperior, à esquerda).
Como o valor de Z está contido na área de não rejeição, não se pode rejeitar H
, isto é, a proporção de mulheres obesas não difere da dos homens acima do
peso, para um nível de signi�cância de 5%.
0
: =  p1 p2
Material
Complementar
F I L M E
O homem que mudou o jogo /  Moneyball
Ano: 2011
Comentário: O �lme é baseado na história real de Billy Beane,
contada por Michael Lewis no livro “Moneyball: the art of winning
an unfair game”. Trata-se de uma utilização um pouco peculiar do
uso da estatística nos esportes. Um dirigente de um pequeno time
de beisebol, que estava nas últimas posições do ranking, utiliza
uma so�sticada análise estatística dos jogadores para conseguir
jogadores que fossem a peça-chave para o time a um baixo custo e
fazer com que o time eleve consideravelmente de posição. As
técnicas utilizadas por Billy Beane eram pouco conhecidas na
época no campo dos esportes, e os resultados adquiridos �zeram
com que grandes times revissem o modo de administrar os times
de beisebol.
Para conhecer mais sobre o �lme, acesse o trailer, disponível em:
TRA I LER
L I V R O
Controle estatístico de qualidade
Autor(es): Jay L. Devore
Editora: Cengage Learning Brasil
Capítulos: 8 e 9
Ano: 2018
ISBN: 9788522128044
Comentário: Um parâmetro pode ser estimado a partir dos dados
da amostra tanto por um único número (uma estimativa pontual)
como por um intervalo inteiro de valores plausíveis (um intervalo de
con�ança). Frequentemente, entretanto, o objetivo de uma
investigação não é estimar um parâmetro, mas decidir qual das
duas alegações contraditórias sobre o parâmetro está correta. Os
métodos de decisão compreendem a parte da inferência estatística
chamada teste de hipóteses. No capítulo 8 são abordados alguns
dos conceitos básicos e a terminologia usada no teste de
hipóteses e depois desenvolvemos os procedimentos de decisão
dos problemas de teste de hipóteses encontrados com mais
frequência com base em uma amostra de uma única população.
No capítulo 9 são apresentas os testes para fazer inferências
considerando duas populações.
Fonte: DEVORE, Jay L. Probabilidade e estatística para engenharia
e ciências – Tradução da 9ª edição norte-americana. Cengage
Learning Brasil, 2018. E-book. ISBN 9788522128044. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788522128044
Acesso em: 30 jan. 2023.
https://integrada.minhabiblioteca.com.br/#/books/9788522128044/
Conclusão
Caro(a) estudante, a con�abilidade e a aceitação dos resultados obtidos pelos processos de
medição são muito relevantes no âmbito das questões metrológicas. Basicamente, nenhum
tipo de medição que possa ser realizada representa o verdadeiro valor mensurado. Essa
variação normalmente é explicada pelas limitações inerentes ao processo dimensional, as
quais limitam as quantidades de medições que podem ser realizadas, assim como está
associada aos efeitos das demais variações que possam estar presentes.
Obviamente, existem mais situações e técnicas além das que abordamos, e certamente você
conseguirá aumentar seus conhecimentos caso tenha necessidade ou interesse. Aproveite as
dicas, textos complementares e consulte mais autores para aprofundar seus estudos. Divirta-
se criando e testando hipóteses, além de tomar decisões mais conscientes com seus novos
conhecimentos. Bons estudos!
Referência
s
FONSECA, J. S. da; MARTINS, G. A.
Curso de estatística. 6. ed. Porto
Alegre: Grupo GEN, 2012. E-book. ISBN
9788522477937. (Disponível na Minha
Biblioteca).
HIRAKATA, V. N.; MANCUSO, A. C. B.; CASTRO, S. M. de J. Teste de hipóteses: perguntas que
você sempre quis fazer, mas nunca teve coragem. Clinical & Biomedical Research, Porto
Alegre, v. 39, n. 2, 2019. Disponível em: https://search.ebscohost.com/login.aspx?
direct=true&AuthType=ip,url,uid&db=edsbas&AN=edsbas.A86A0083&lang=pt-br&site=eds-live.
Acesso em: 23 jan. 2023.
https://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,url,uid&db=edsbas&AN=edsbas.A86A0083&lang=pt-br&site=eds-live
https://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,url,uid&db=edsbas&AN=edsbas.A86A0083&lang=pt-br&site=eds-live
LIMA, F. F. de. O papel da estatística em laudos periciais criminais de entorpecentes: estudo
de caso. Revista brasileira de segurança pública e cidadania, Brasília, v. 2, n. 1, p. 13-22,
jan./jun. 2009.
MARTINS, G. A.; DOMINGUES, O. Estatística geral e aplicada. 6. ed. Porto Alegre: Grupo GEN,
2017. E-book. ISBN 9788597012682. (Disponível na Minha Biblioteca).
MORETTIN, P. A.; BUSSAB, W. O. Estatística básica. São Paulo: Saraiva, 2017. E-book. ISBN
9788547220228. (Disponível na Minha Biblioteca).
SANTOS, D. F. dos et al. Teste de hipótese para diferença de proporção: um estudo sobre o
consumo de rádio em 2018 e 2019, na cidade de Caruaru-PE. In: ENCONTRO NACIONAL DOS
ESTUDANTES DE ESTATÍSTICA, 2020, João Pessoa. Anais [...]. João Pessoa, 2020.
TRIOLA, M. F. Introdução à Estatística. 12. ed. Porto Alegre: Grupo GEN, 2017. E-book. ISBN
9788521634256. (Disponível na Minha Biblioteca).