Prévia do material em texto
21/05/2024 1 Estatística Descritiva05 Praticidade para análise e interpretação de dados Tabelas “forma não discursiva de apresentar informações das quais o dado numérico se destaca como informação central” https://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf Tabelas de grupamentos simples: mostram os valores obtidos e o número de vezes que cada valor foi observado Tabelas de grupamentos por intervalo de classes: resumir dados com valores que variam muito. Ex.: Peso, altura 85 86 21/05/2024 2 Tabelas Título Moldura - no mínimo, três traços horizontais paralelos, sem traços verticais que a delimitem à esquerda e à direita. Cabeçalho - indicar, complementarmente ao título, o conteúdo das colunas. Fonte Rodapé Tabelas x Quadro 87 88 21/05/2024 3 Tabelas Título Cabeçalho Rodapé V ar iá ve is Tabelas 89 90 21/05/2024 4 Tabelas Tabelas 91 92 21/05/2024 5 Tabelas Tabelas 93 94 21/05/2024 6 Tabelas Qual o problema aqui ? Tabelas Qual(is) o(s) problema(s) aqui ? 95 96 21/05/2024 7 Tabelas Gráficos Visão mais imediata de como se distribuem os valores Nas publicações são chamadas de figuras Título – Claro e no pé do desenho O que estou querendo mostrar nesse gráfico? Que tipo de dados tenho? 97 98 21/05/2024 8 Gráficos Gráfico de barras (ou de colunas) é utilizado, em geral, para representar dados de uma tabela de frequências associadas a uma variável qualitativa. Nesse tipo de gráfico, cada barra retangular representa a frequência ou a frequência relativa da respectiva opção da variável. Gráficos Gráfico de colunas 99 100 21/05/2024 9 Gráficos Gráfico de colunas Gráficos Gráfico de colunas empilhadas 101 102 21/05/2024 10 Gráficos Histograma mais utilizado para variáveis contínuas. Pode ser com barras verticais ou barras horizontais As áreas dos retângulos resultantes devem ser proporcionais à frequência. Pode representar dados de frequência simples e acumulada, assim como relativa Gráficos Histograma 103 104 21/05/2024 11 Gráficos Histograma Gráficos 105 106 21/05/2024 12 Gráficos Ogiva O gráfico denominado ogiva é um gráfico em linha usado para registrar a frequência acumulada. O processo de construção é o mesmo usado para o gráfico em linhas. Este gráfico é útil para verificar quando os elementos da amostra estão abaixo de uma determinada medida. fi Fi 0 |– 1 6 1 |– 4 10 4 |– 7 16 7 |– 10 19 10 |– 13 19 13 |– 18 26 Gráficos Ogiva 107 108 21/05/2024 13 Gráficos Ogiva O gráfico denominado ogiva é um gráfico em linha usado para registrar a frequência acumulada. O processo de construção é o mesmo usado para o gráfico em linhas. Este gráfico é útil para verificar quando os elementos da amostra estão abaixo de uma determinada medida. fi Fi 0 |– 1 6 1 |– 4 10 4 |– 7 16 7 |– 10 19 10 |– 13 19 13 |– 18 26 Gráficos 109 110 21/05/2024 14 Gráficos Linhas (ou de segmentos) é utilizado, em geral, para representar a evolução dos valores de uma variável no decorrer do tempo. Gráficos Linhas (ou de segmentos) 111 112 21/05/2024 15 Gráficos Setores Também conhecido como “gráfico de pizza”, é utilizado, em geral, para representar partes de um todo. Gráficos Pictograma ou gráfico pictórico A fim de tornar os gráficos mais atraentes, os meios de comunicação, como revistas, jornais, entre outros, costumam ilustrá-los com imagens relacionadas ao contexto do qual as informações fazem parte. Assim como nos gráficos tradicionais, as dimensões das imagens devem ser proporcionais ao dados apresentados. 113 114 21/05/2024 16 Gráficos Gráficos 115 116 21/05/2024 17 Gráficos Gráficos Figura 2. Área de clareira criada durante a queda das árvores com nenhuma conexão de cipós para as árvores vizinhas, poucas (três a cinco) conexões e muitas (mais de sete) conexões na Fazenda Agrosete, Paragominas, Pará. Os valores sem letras em comum são significativamente diferentes no nível de 5% (teste de Tukey). 117 118 21/05/2024 18 Gráficos Rendimento de grãos em função dos níveis de potássio e umidade do solo. Letras minúsculas comparam níveis de potássio em um mesmo nível de umidade, as letras maiúsculas fazem o inverso Medidas de Tendência Central06 Será que os dados do meio de dizem muito do todo? 119 120 21/05/2024 19 Média aritmética Dado obtido pela soma de todos os e dados e dividido pelo número deles. É considerada uma medida de tendência central e é muito utilizada no cotidiano Média aritmética Exemplo De um paciente foi acompanhado os valores de glicose (mg/dL), em jejum, por 5 semanas. Qual a média de glicose nesse período Qual o valor médio de glicose por semana? 1 2 3 4 5 122 133 102 108 115 580 / 5 = 116 mg/dL 121 122 21/05/2024 20 Média aritmética Exemplo A tabela abaixo apresenta as Notas em bioestatística de uma turma de 30 alunos. Qual a média da turma? Dados agrupados 3+4,5+5+6,5+7+8+9+10 8 = 53 = 6,625 8 Média ponderada Para cada valor deve-se levar em conta o valor do seu peso. É calculada através do somatório das multiplicações entre valores e pesos divididos pelo somatório dos pesos. 123 124 21/05/2024 21 Média ponderada Alcebíades participou de um concurso, onde foram realizadas provas de Português, Matemática, Biologia e História. Essas provas tinham peso 3, 3, 2 e 2, respectivamente. Sabendo que tirou 8,0 em Português, 7,5 em Matemática, 5,0 em Biologia e 4,0 em História, qual foi a média que ele obteve? Outlier Valor aberrante ou valor atípico, é uma observação que apresenta um grande afastamento das demais da série (que esta "fora" dela) A presença implica em prejuízos a interpretação dos resultados dos testes estatísticos. 1 – 1 – 2 – 3 – 3 –14 24 6 4 1 – 1 – 2 – 3 – 3 10 5 2 14 125 126 21/05/2024 22 Outlier Valor atípico positivo média + 2 desvio padrão Valor atípico negativo média - 2 desvio padrão Mediana É o valor numérico que separa a parte superior dos dados da parte inferior. É utilizado como um possível parâmetro de localização. 50%50% - Mediana - 1º passo – ordenar os dados 2º passo – encontrar a posição 3º passo – calcular, se necessário 127 128 21/05/2024 23 Mediana Como encontrar a posição da mediana? Quando o número de dados é impar, a mediana é o elemento central Quando o número de dados é par, a mediana é a média dos dois valores centrais n+1/2 n/2 e n/2+1 Mediana Exemplos. 1. Com o conjunto de dados {8,5,1,3,10} Qual a posição da mediana e seu valor? Qual a média? 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? 129 130 21/05/2024 24 Mediana 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? Exemplos. 3. Com o conjunto de dados {1,11,6,8,3,10} Qual a posição da mediana e seu valor? Qual a média? Obs.: A mediana é muito forte na presença de valores extremos, enquanto que a média é muito sensível. Mediana 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? Fi 4 9 11 14 20 25 29 30 A tabela ao lado apresenta as notas em bioestatística de uma turma de 30 alunos. Qual a mediana da turma? 131 132 21/05/2024 25 Moda 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? É o valor que detém o maior número de observações, ou seja, o valor ou valores mais frequentes, ou ainda "o valor que ocorre com maior frequência num conjunto de dados, o valor mais comum. A moda não é necessariamente única, ao contrário da média ou da mediana. É especialmente útil quando os valores ou observações não são numéricos. Um conjunto de observações também poderá não ter moda ou ser mais de uma. Moda 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? A moda de {ótimo, bom, ótimo, bom, ruim, regular, bom} é bom. A série {1, 3, 5, 5, 6, 6} apresenta duas modas (BIMODAL): 5 e 6. A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda (AMODAL). A série{1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas (MULTIMODAL): 5, 6 e 7 133 134 21/05/2024 26 Moda 2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? A tabela ao lado apresenta as notas em bioestatística de uma turma de 30 alunos. Qual a moda? Medidas de dispersão07 Se variam e quanto variam os dados 135 136 21/05/2024 27 Dispersão 1+2+3+4+5+6 1+2+3+4+5 Dispersão Em muitos casos, a média não é suficiente para avaliar um conjunto de dados! Com isso é necessário saber como essa média varia ou se dispersa do conjunto de valores da população ou amostra Produto I II III IV A 9 6 5 8 B 8 7 6 7 137 138 21/05/2024 28 AMPLITUDE É a diferença entre o maior e o menor valor do conjunto de dados. É o mais simples e pouco informativa por depender somente dos valores extremos da série. Fácil de compreender DISPERSÃO Vejamos duas situações de percepção de dor por 2 pacientes ao longo do dia Pac 1 Pac 2 9 9 7 9 5 9 3 2 2 2 Quem parece ter dor mais regular? 139 140 21/05/2024 29 DISPERSÃO 1º passo – Elevar os valores ao quadrado e somar Pac 1 x1 2 Pac 2 x2 2 9 81 9 81 7 49 9 81 5 25 9 81 3 9 2 4 2 4 2 4 Soma 168 251 DISPERSÃO 2º passo – Divide a soma por N (população) ou n-1 (amostra) Pac 1 x1 2 Pac 2 x2 2 9 81 9 81 7 49 9 81 5 25 9 81 3 9 2 4 2 4 2 4 Soma 168/5 251/5 141 142 21/05/2024 30 DISPERSÃO 3º passo – Elevar a média ao quadrado Pac 1 x1 2 µ1 2 Pac 2 x2 2 µ2 2 9 81 5,2 9 81 6,2 7 49 9 81 5 25 9 81 3 9 2 4 2 4 2 4 Soma: 168/5 27,04 251/5 38,44 Variância (σ² ou S²) S1 2 = 168 - 5x27,04= 8,2 Para amostras σ2 1 = 168 - 27,04 = 6,56 5 σ2 2 = 251 - 38,44 = 11,76 5 5-1 5-1 S2 2 = 251 - 5x38,44 = 14,7 5-1 5-1 N n Erro amostral 143 144 21/05/2024 31 Desvio padrão (σ ou S) Com estes dados podemos estabelecer o desvio padrão, que é a raiz quadrada da variância Então: Dp1 = √6,56 =2,56 Dp2 = √ 11,76 =3,42 Pac1 = 5,2±2,56 Pac2 = 6,2±3,42 Quem teve a percepção de dor mais regular? Desvio padrão Para a população Para a amostra 145 146 21/05/2024 32 Variância Para a população Para a amostra Coeficiente de variação (CV) A variabilidade dos dados em relação à média. Quanto menor o CV mais homogêneo é o conjunto de dados. Usualmente expresso em porcentagem, indicando o percentual que o desvio padrão é menor. Pode ser bastante útil na comparação de duas variáveis ou dois grupos que a princípio não são comparáveis. CV= S/média 147 148 21/05/2024 33 Coeficiente de variação (CV) Em um grupo de pacientes foram tomadas as pulsações (batidas por minuto) e dosadas as taxas de ácido úrico (mg/100mL). As médias e os desvios padrão foram: A pulsação é mais estável do que o ácido úrico? Dispersão Considerações 1- Caso cada valor da série seja multiplicado por uma valor K, a variância será multiplicada por K² e o desvio por K 2- Mesmo se uma constante k é somada a cada valor do conjunto, o desvio continuará o mesmo 149 150 21/05/2024 34 Dispersão O Controle Estatístico de Processos é a base para o moderno Controle Interno da Qualidade (CIQ). O laboratório realiza análise em materiais de controle e os resultados são lançados e plotados no Gráfico de Levey-Jennings. Os profissionais de laboratório clínico poderão identificar se os pontos estão dentro dos limites de controle estabelecidos https://www.who.int/tools/child-growth-standards/standards/length-height-for-age 151 152 http://ead.qualichart.com.br/#!/items/20130327115513502 http://ead.qualichart.com.br/#!/items/20130327115513502 21/05/2024 35 Distribuição Normal08 Em busca de padrões Tipos de Distribuição Distribuições simétricas Uma distribuição é dita simétrica quando apresenta o mesmo valor para a moda, a média e a mediana. Ou seja, essas medidas, teoricamente, coincidem no ponto central da distribuição. 153 154 21/05/2024 36 Tipos de Distribuição Distribuições simétricas Tipos de Distribuição Distribuições simétricas A simetria em torno de um eixo indica que o formato da distribuição é o mesmo à esquerda e à direita desse eixo. Se uma distribuição é simétrica então a média é o seu ponto de simetria, indicando que intervalos de mesma magnitude à esquerda e à direita da média têm as mesmas concentrações de valores 155 156 21/05/2024 37 Tipos de Distribuição Distribuições simétricas Tipos de Distribuição Distribuições assimétricas A distribuição das frequências apresenta valores menores num dos lados 157 158 21/05/2024 38 Tipos de Distribuição Distribuições assimétricas Tipos de Distribuição Distribuições assimétricas Assimetria positiva implica numa concentração maior dos menores valores, possuindo uma cauda mais alongada à direita. Assim, majoritariamente, a magnitude dos desvios à direita é maior que a magnitude à esquerda. Assimetria positiva Assimetria negativa 159 160 21/05/2024 39 Tipos de Distribuição Distribuições assimétricas Tipos de Distribuição Distribuições assimétricas 161 162 21/05/2024 40 Resumindo Tipos de Distribuição - Normal A distribuição estatística é uma função que define uma curva, e a área sob essa curva determina a probabilidade de ocorrer o evento por ela correlacionado. Existem vários tipos de distribuição estatística, como a binomial, a poisson, a uniforme e a gaussiana. 163 164 21/05/2024 41 Tipos de Distribuição - Normal A distribuição gaussiana é a que ocorre com maior frequência na natureza, e por este motivo recebeu a denominação de normal. Carl F. Gauss no início do século XIX É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino. A distribuição normal é o resultado da atuação conjunta de causas aleatórias. Tipos de Distribuição - Normal 165 166 21/05/2024 42 Tipos de Distribuição - Normal O desvio Padrão σ, é a distância entre a média e o ponto de inflexão da curva. A área total sob a curva normal é igual a 1, pela própria equação da probabilidade. Em virtude da simetria as áreas à direita e à esquerda do valor μ são iguais Tipos de Distribuição - Normal 1. A curva, teoricamente, jamais toca o eixo x 2. A curva é simétrica em relação a média 3. A média, moda e mediana são iguais 4. A área sob a curva totaliza 1 ou 100% 5. Aproximadamente 68% dos valores de x situam-se entre µ-σ e µ+σ; 95% µ-2σ e µ+2σ; 99,7% µ-3σ e µ+3σ 167 168 21/05/2024 43 Tipos de Distribuição - Normal Tipos de Distribuição - Normal Distributions of systolic blood pressure in middle-aged men in two populations. Geoffrey Rose Int. J. Epidemiol. 2001;30:427-432 169 170 21/05/2024 44 Tipos de Distribuição - Normal Curva normal padronizada ou reduzida Tabela de distribuição normal Informa a área entre a média e o valor de z Ex.: Quando z = (isto é, igual σ) a área é 0,3413 ou 34,13% Transformação de x em z Z = (x- µ)/ σ Tipos de Distribuição - Normal Exemplos Qual a área de z acima de 1,55? 1. A curva =1, cada lado 0,5 2. Na tabela da curva normal verificar a área entre 0 e 1,55 3. Subtrair o valor de 0,5 171 172 21/05/2024 45 Tipos de Distribuição - Normal Exemplos Um treinador deseja selecionar jogadores com estatura acima de 180 cm. Qual a porcentagem esperada de jogadores com este potencial, sabendo que a estatura tem distribuição normal, média de 175 cm e desvio de 6 cm? 173 174 21/05/2024 46 Tipos de Distribuição - Normal Exemplos Vamos supor que a taxa normal de glicose no sangue humano seja uma variável aleatória com distribuição normal de média x = 100 mg/dl de sangue e desvio padrão s = 6 mg/dl de sangue. Calcule a probabilidade de um indivíduo com taxa normal de glicose, apresentar: a) taxa superior a 110mg/dl de sangue; b) taxa inferior a 90 mg/dl de sangue; c) taxa entre 90 e 110 mg/dl de sangue. 175 Slide 85: Estatística Descritiva Slide 86: Tabelas Slide 87: Tabelas Slide 88: Tabelas x Quadro Slide 89: Tabelas Slide 90: Tabelas Slide 91: Tabelas Slide 92: Tabelas Slide 93: Tabelas Slide 94: Tabelas Slide 95:Tabelas Slide 96: Tabelas Slide 97: Tabelas Slide 98: Gráficos Slide 99: Gráficos Slide 100: Gráficos Slide 101: Gráficos Slide 102: Gráficos Slide 103: Gráficos Slide 104: Gráficos Slide 105: Gráficos Slide 106: Gráficos Slide 107: Gráficos Slide 108: Gráficos Slide 109: Gráficos Slide 110: Gráficos Slide 111: Gráficos Slide 112: Gráficos Slide 113: Gráficos Slide 114: Gráficos Slide 115: Gráficos Slide 116: Gráficos Slide 117: Gráficos Slide 118: Gráficos Slide 119: Gráficos Slide 120: Medidas de Tendência Central Slide 121: Média aritmética Slide 122: Média aritmética Slide 123: Média aritmética Slide 124: Média ponderada Slide 125: Média ponderada Slide 126: Outlier Slide 127: Outlier Slide 128: Mediana Slide 129: Mediana Slide 130: Mediana Slide 131: Mediana Slide 132: Mediana Slide 133: Moda Slide 134: Moda Slide 135: Moda Slide 136: Medidas de dispersão Slide 137: Dispersão Slide 138: Dispersão Slide 139: AMPLITUDE Slide 140: DISPERSÃO Slide 141: DISPERSÃO Slide 142: DISPERSÃO Slide 143: DISPERSÃO Slide 144: Variância (σ² ou S²) Slide 145 Slide 146: Desvio padrão Slide 147: Variância Slide 148: Coeficiente de variação (CV) Slide 149: Coeficiente de variação (CV) Slide 150: Dispersão Slide 151: Dispersão Slide 152 Slide 153: Distribuição Normal Slide 154: Tipos de Distribuição Slide 155: Tipos de Distribuição Slide 156: Tipos de Distribuição Slide 157: Tipos de Distribuição Slide 158: Tipos de Distribuição Slide 159: Tipos de Distribuição Slide 160: Tipos de Distribuição Slide 161: Tipos de Distribuição Slide 162: Tipos de Distribuição Slide 163: Resumindo Slide 164: Tipos de Distribuição - Normal Slide 165: Tipos de Distribuição - Normal Slide 166: Tipos de Distribuição - Normal Slide 167: Tipos de Distribuição - Normal Slide 168: Tipos de Distribuição - Normal Slide 169: Tipos de Distribuição - Normal Slide 170 Slide 171 Slide 172 Slide 173 Slide 174 Slide 175