Buscar

Intervalo de Confiança e Normalidade Transcrição de aula

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Aula 2 – Estatística Descritiva
	A classificação dos tipos de dados:
-Quantitativo: 
As variáveis são mensuráveis (Ex: Peso, tamanho).
Também pode-se fazer grupos amostrais, como por exemplo: Grupo de homem, grupo de mulher e extrair dados quantitativos a partir delas.
-Qualitativo: 
As variáveis são não mensuráveis (Ex: Presença ou não de alguma coisa, podendo atribuir números e se transformarem em quantitativos- Presencia ou ausência do sexo feminino).
Os dados são qualitativos quando eles qualificam uma população.
Ex1: 75% da minha população é mulher Qualificando.
Ex2: Tenho 116 kg Quantificando
Os dados qualitativos podem ser de ordem numérica e não numérica.
Ex3: Pesquisas sobre presidente (Qualitativa- Não é quantificado o presidente: ou é Lula, ou é Lula) – Não numérica (É analisado o nome).
Ex4: Quantos são homens? – 66% são homens - numérica.
MÉDIAS
-Média aritmética: (Soma todos os valores dividido pelo numero de valores)
-Média	 harmônica: (Quantidade de amostras dividido pelas frações de cada amostra)
-Média geométrica: (Raiz n da multiplicação de todos os valores n -Olhar slide 29 DA AULA 2.
A DESTRIBUIÇÃO GAUSSIANA SEGUE UMA DISTRIBUIÇÃO NORMAL BASEADA NA MÉDIA ARITMÉTICA.
MODA
Número que mais se repete.
MEDIANA
Quando os valores estão ordenados em ordem crescente, se a quantidade de amostras for ímpar é o numero do meio. Se for par soma os dois do meio e divide por dois.
AMPLITUDE TOTAL
Valor máximo de todos os valores menos o valor mínimo de todos os valores.
QUANDO A MODA E A MÉDIA ARITMETICA GERALMENTE A DISTRIBUIÇÃO É DO TIPO GAUSSIANA.
Quais são as características de uma distribuição normal: Em forma de sino, a média é igual a moda.
Qual é o objetivo de se extrair médias? Verificar qual média que representa o grupo amostral ou a população.
Variância
A média do grupo amostral- media da população elevado ao quadrado/pelo numero de dados menos 1. (Tem que ter 1 dado conhecido que é a media da pop).
Desvio Padrão
É a raiz quadrada da variância. (Quantifica variabilidade na população).
Erro padrão
É o erro que se tem do desvio padrão: É o desvio padrão/ pela raiz quadrada do numero total de resultados. (Quantifica a incerteza na estimativa da média).
Coeficiente de variação
É o desvio padrão / pela média multiplicado por 100 (Em porcentagem). Está ligado ao “pico” do gráfico gaussiano- quanto mais estreito menor o coef de variação. (Slide 33);
Coeficiente de assimetria
Está relacionado a média ao somatório do grupo amostral dividido pela n-1 e n-2 vezes o erro padrão.
A curtose do gráfico é divida em:
- Leptocúrtica: A distribuição é normal, simétrica e estreita.
-Mesocúrtica: A distribuição é média, larga.
-Platicúrtica: A distribuição é em forma de parábola.
Percentil
É de acordo com a média.
Desvio interquartítico= 3° Percentil –– 1° Percentil.
AULA 3
Intervalo de Confiança/ Normalidade/ Distribuição de Probabilidade
Intervalo de Confiança:
É uma estimativa que está relacionada a estudos estatísticos. (Para saber o quão confiável ele é). Sempre associado a alguma medida de associação (Um controle).
 Quanto menor o tamanho da amostra menor o nível de confiança.
Se o nível de confiança é de 95% - A taxa de significância é 0,05.
O nível de confiança está relacionado com o poder de significância (ou taxa de significância (α)) do meu teste.
O valor de alfa na maioria das vezes também é a probabilidade (p) de se encontrar dados conflitantes entre dois grupos amostrais.
A partir da taxa de significância (Ex: α= 0.05), pode-se descobrir que o p vai ser menor ou igual que 0.05.
A taxa de significância é complementar ao nível de confiança (Ex: Se o nível de confiança é de 90% a taxa de significância é de 0,10).
EXEMPLO SLIDE:
Em uma pesquisa com margem de erro de 2 pontos porcentuais para mais e para menos, 33% das pessoas entrevistadas disseram que votariam no candidato A. 
O que isso significa? 
Espera-se que, na população amostrada, a porcentagem de pessoas que dizem votar no candidato A esteja no intervalo 33% ± 2%, ou seja, entre 31% e 35%.
Existe grande probabilidade de o valor verdadeiro estar contido dentro das margens de erro – mas não existe a certeza. E de quanto é essa probabilidade? Ela deve ser fornecida pelos pesquisadores e recebe o nome de nível de confiança do intervalo.
Geralmente usam a média como medida de tendência central. (Ex quantas pessoas disseram que votavam no candidato A? Então eles usam a média da quantidade de pessoas, se, por exemplo, a média foi 35% há um intervalo de confiança de, por exemplo, 2% para mais ou para menos). O limite superior e inferior do intervalo de confiança é calculado a partir do intervalo de confiança, Ex: 95%) . Ver slide 5 e 6.
No slide 6: Pode-se dizer que ao dados variam de 28-32% com 95% de chance desses dados estarem certos (Com intervalo de confiança de 95%).
QUANTO MAIOR O NUMERO DE DADOS/AMOSTRAS, MENOR O INTERVALO DE CONFIANÇA, MAIOR A PRECISÃO DO ESTUDO.
NORMALIDADE
Na distribuição dos dados, tem que saber se eles seguem uma distribuição normal ou assimétrica (ou não normal). É preciso fazer isso pq os testes estatísticos giram em torno de probabilidade, da média.
Se o p<0,05 é pq menos que 5% dos dados estão se correlacionando (Se sobrepondo) e isso indica que houve diferença entre os dados, indicando que o estudo está estatisticamente significativo com chance de 95% dos dados estarem certos. Se for acima disso vai indicar que o controle será igual ao experimento.
Quanto menos dados estiverem se sobrepondo, mais diferentes eles são.
Se o p>0.05 isso indica que mais que 5% dos dados estão se sobrepondo, e isso indica que a média do controle está muito próxima a média do teste indicando que o estudo não é estatisticamente significativo. 
DISTRIBUIÇÃO NORMAL (Distribuição Gaussiana)
Só há distribuição normal quando a média coincidir com a moda. O gráfico é em forma de boca de sino. MESMA MÉDIA E DESVIOS DIFERENTES.
-A curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou maiores do que a média e 50% dos valores são iguais ou menores do que a média; 
- A curva abriga 100% da população. 
- A distribuição normal fica definida quando são dados dois parâmetros: a média, que se representa pela letra grega μ (lê-se mi), e o desvio padrão, que se representa pela letra grega σ (lê-se sigma). 
O teste Kolmogorov-Smirnov é um teste utilizado para dados que não seguem uma distribuição normal.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Mais conteúdos dessa disciplina