Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Aula 2 – Estatística Descritiva A classificação dos tipos de dados: -Quantitativo: As variáveis são mensuráveis (Ex: Peso, tamanho). Também pode-se fazer grupos amostrais, como por exemplo: Grupo de homem, grupo de mulher e extrair dados quantitativos a partir delas. -Qualitativo: As variáveis são não mensuráveis (Ex: Presença ou não de alguma coisa, podendo atribuir números e se transformarem em quantitativos- Presencia ou ausência do sexo feminino). Os dados são qualitativos quando eles qualificam uma população. Ex1: 75% da minha população é mulher Qualificando. Ex2: Tenho 116 kg Quantificando Os dados qualitativos podem ser de ordem numérica e não numérica. Ex3: Pesquisas sobre presidente (Qualitativa- Não é quantificado o presidente: ou é Lula, ou é Lula) – Não numérica (É analisado o nome). Ex4: Quantos são homens? – 66% são homens - numérica. MÉDIAS -Média aritmética: (Soma todos os valores dividido pelo numero de valores) -Média harmônica: (Quantidade de amostras dividido pelas frações de cada amostra) -Média geométrica: (Raiz n da multiplicação de todos os valores n -Olhar slide 29 DA AULA 2. A DESTRIBUIÇÃO GAUSSIANA SEGUE UMA DISTRIBUIÇÃO NORMAL BASEADA NA MÉDIA ARITMÉTICA. MODA Número que mais se repete. MEDIANA Quando os valores estão ordenados em ordem crescente, se a quantidade de amostras for ímpar é o numero do meio. Se for par soma os dois do meio e divide por dois. AMPLITUDE TOTAL Valor máximo de todos os valores menos o valor mínimo de todos os valores. QUANDO A MODA E A MÉDIA ARITMETICA GERALMENTE A DISTRIBUIÇÃO É DO TIPO GAUSSIANA. Quais são as características de uma distribuição normal: Em forma de sino, a média é igual a moda. Qual é o objetivo de se extrair médias? Verificar qual média que representa o grupo amostral ou a população. Variância A média do grupo amostral- media da população elevado ao quadrado/pelo numero de dados menos 1. (Tem que ter 1 dado conhecido que é a media da pop). Desvio Padrão É a raiz quadrada da variância. (Quantifica variabilidade na população). Erro padrão É o erro que se tem do desvio padrão: É o desvio padrão/ pela raiz quadrada do numero total de resultados. (Quantifica a incerteza na estimativa da média). Coeficiente de variação É o desvio padrão / pela média multiplicado por 100 (Em porcentagem). Está ligado ao “pico” do gráfico gaussiano- quanto mais estreito menor o coef de variação. (Slide 33); Coeficiente de assimetria Está relacionado a média ao somatório do grupo amostral dividido pela n-1 e n-2 vezes o erro padrão. A curtose do gráfico é divida em: - Leptocúrtica: A distribuição é normal, simétrica e estreita. -Mesocúrtica: A distribuição é média, larga. -Platicúrtica: A distribuição é em forma de parábola. Percentil É de acordo com a média. Desvio interquartítico= 3° Percentil –– 1° Percentil. AULA 3 Intervalo de Confiança/ Normalidade/ Distribuição de Probabilidade Intervalo de Confiança: É uma estimativa que está relacionada a estudos estatísticos. (Para saber o quão confiável ele é). Sempre associado a alguma medida de associação (Um controle). Quanto menor o tamanho da amostra menor o nível de confiança. Se o nível de confiança é de 95% - A taxa de significância é 0,05. O nível de confiança está relacionado com o poder de significância (ou taxa de significância (α)) do meu teste. O valor de alfa na maioria das vezes também é a probabilidade (p) de se encontrar dados conflitantes entre dois grupos amostrais. A partir da taxa de significância (Ex: α= 0.05), pode-se descobrir que o p vai ser menor ou igual que 0.05. A taxa de significância é complementar ao nível de confiança (Ex: Se o nível de confiança é de 90% a taxa de significância é de 0,10). EXEMPLO SLIDE: Em uma pesquisa com margem de erro de 2 pontos porcentuais para mais e para menos, 33% das pessoas entrevistadas disseram que votariam no candidato A. O que isso significa? Espera-se que, na população amostrada, a porcentagem de pessoas que dizem votar no candidato A esteja no intervalo 33% ± 2%, ou seja, entre 31% e 35%. Existe grande probabilidade de o valor verdadeiro estar contido dentro das margens de erro – mas não existe a certeza. E de quanto é essa probabilidade? Ela deve ser fornecida pelos pesquisadores e recebe o nome de nível de confiança do intervalo. Geralmente usam a média como medida de tendência central. (Ex quantas pessoas disseram que votavam no candidato A? Então eles usam a média da quantidade de pessoas, se, por exemplo, a média foi 35% há um intervalo de confiança de, por exemplo, 2% para mais ou para menos). O limite superior e inferior do intervalo de confiança é calculado a partir do intervalo de confiança, Ex: 95%) . Ver slide 5 e 6. No slide 6: Pode-se dizer que ao dados variam de 28-32% com 95% de chance desses dados estarem certos (Com intervalo de confiança de 95%). QUANTO MAIOR O NUMERO DE DADOS/AMOSTRAS, MENOR O INTERVALO DE CONFIANÇA, MAIOR A PRECISÃO DO ESTUDO. NORMALIDADE Na distribuição dos dados, tem que saber se eles seguem uma distribuição normal ou assimétrica (ou não normal). É preciso fazer isso pq os testes estatísticos giram em torno de probabilidade, da média. Se o p<0,05 é pq menos que 5% dos dados estão se correlacionando (Se sobrepondo) e isso indica que houve diferença entre os dados, indicando que o estudo está estatisticamente significativo com chance de 95% dos dados estarem certos. Se for acima disso vai indicar que o controle será igual ao experimento. Quanto menos dados estiverem se sobrepondo, mais diferentes eles são. Se o p>0.05 isso indica que mais que 5% dos dados estão se sobrepondo, e isso indica que a média do controle está muito próxima a média do teste indicando que o estudo não é estatisticamente significativo. DISTRIBUIÇÃO NORMAL (Distribuição Gaussiana) Só há distribuição normal quando a média coincidir com a moda. O gráfico é em forma de boca de sino. MESMA MÉDIA E DESVIOS DIFERENTES. -A curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou maiores do que a média e 50% dos valores são iguais ou menores do que a média; - A curva abriga 100% da população. - A distribuição normal fica definida quando são dados dois parâmetros: a média, que se representa pela letra grega μ (lê-se mi), e o desvio padrão, que se representa pela letra grega σ (lê-se sigma). O teste Kolmogorov-Smirnov é um teste utilizado para dados que não seguem uma distribuição normal.