Prévia do material em texto
Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA GET00209 - Introdução à Estat́ıstica - 4ª Lista de Exerćıcios 1. Mostre que: (a) n∑ i=1 (xi − x̄) = 0 (b) n∑ i=1 (xi − x̄)2 = n∑ i=1 x2 i − nx̄2 = n∑ i=1 x2 i − ( ∑n i=1 xi) 2 n (c) n∑ i=1 ni(xi − x̄)2 = n∑ i=1 nix 2 i − nx̄2 (d) n∑ i=1 fi(xi − x̄)2 = n∑ i=1 fix 2 i − x̄2 2. Dados os valores 3, 8, 5, 5, 4, 3 e 7, encontre: (a) n∑ i=1 xixi (b) n∑ i=1 (xi − x̄)2 3. São dados os tempos, em minutos, para o preparo de 1m3 de uma mistura para construção em solo de cimento por um único operário. Encontre as medidas de posição e as medidas de dispersão que você conhece para os dados abaixo. 78 72 68 76 76 76 69 81 76 83 69 79 72 85 72 76 Tabela 1: Tempo, em minutos, de preparo de 1m3 de uma mistura para construção em solo de cimento por um único operário 4. A margem de lucro na venda de produtos artesanais é variável, mas, ao longo de seis meses, um revendedor registrou os valores apresentados na tabela a seguir. Calcule a média, a mediana, a variância amostral e o intervalo interquartil para a margem de lucro. Os valores encontrados são exatos ou aproximados? classe freq. absoluta 15 ⊢ 25 30 25 ⊢ 35 45 35 ⊢ 45 150 45 ⊢ 55 45 55 ⊢ 65 30 Tabela 2: Margens de lucro, em termos de percentual do valor de compra. 5. O que acontece com a variância e o desvio padrão de um conjunto de dados quando: (a) cada observação é multiplicada por 2? (b) soma-se 10 a cada observação? (c) subtrai-se a média x̄ de cada observação? 6. Para facilitar o projeto de ampliação da rede de esgoto de uma certa região da cidade, as autoridades tomaram uma amostra de tamanho 50 dos 270 quarteirões que compõem a região, e foram encontrados os seguintes números de casas por quarteirão: 2 2 3 10 13 14 15 15 16 16 18 18 20 21 22 22 23 24 25 25 26 27 29 29 30 32 36 42 44 45 45 46 48 52 58 59 61 61 61 65 66 66 68 75 78 80 89 90 92 97 Tabela 3: Números de casas por quarteirão. Construa o boxplot para o números de casas por quarteirão e faça comentários sobre o comportamento dos dados baseados no gráfico obtido. 7. A distribuição de frequências do salário dos moradores do bairro A que têm alguma forma de rendimento é apresentada na tabela abaixo: faixa salarial frequência 0 ⊢ 2 10000 2 ⊢ 4 3900 4 ⊢ 6 2000 6 ⊢ 8 1100 8 ⊢ 10 800 10 ⊢ 12 700 12 ⊢ 14 2000 total 20500 Tabela 4: Distribuição de frequências do salário dos moradores do bairro A. (a) Construa um histograma da distribuição dos dados. (b) Qual a média e o desvio padrão da variável salário? (c) O bairro B apresenta, para a mesma variável, uma média de 7,2 e um desvio padrão de 15,1. Em qual dos bairros a população é mais homogênea quanto à renda? (d) Qual o intervalo interquartil? 8. Para se estudar o desempenho de 2 companhias corretoras de ações, selecionou-se de cada uma delas amostras das ações negociadas. Para cada ação selecionada, computou-se a porcentagem de lucro apresentada durante um peŕıodo fixado de tempo, obtendo-se os dados abaixo. Com base nos coeficientes de variação, qual companhia teve melhor desempenho? Corretora A 38 45 48 48 54 54 55 55 55 55 56 59 60 60 62 64 65 70 Corretora B 50 50 51 52 52 53 54 55 55 55 56 56 57 57 57 58 58 59 59 59 61 9. Com base na Tabela abaixo, calcule a mediana e o intervalo interquartil. número de freq. simples freq. acumulada empregados 152 ⊢ 6277 6277 ⊢ 12402 12402 ⊢ 18527 18527 ⊢ 24652 24652 ⊢ 30777 abs. rel. (%) 51 63,75 21 26,25 4 5,00 3 3,75 1 1,25 abs. rel. (%) 51 63,75 72 90,00 76 95,00 79 98,75 80 100,00 10. Um problema nas universidades brasileiras é que os alunos chegam atrasados e saem antes do término das aulas - mesmo em cursos de bom ńıvel. Um professor que tem 25 alunos conta o número de alunos que já estão em sala de aula no horário estabelecido e conta os que estão na sala quando o horário termina, nas manhãs das quartas-feiras durante 6 semanas. ińıcio 5 4 7 4 6 22 término 23 20 24 25 23 23 Tabela 5: Número de alunos em sala de aula de acordo com o momento. (a) Encontre a média, a mediana e o desvio padrão dos dois conjuntos de dados (número de alunos por turno). (b) Faça um boxplot para cada um dos conjuntos de dados. (c) Compare os resultados obtidos com os dois diferentes conjuntos de dados. Quais as diferenças percebidas através dos gráficos do item anterior? 11. Uma escola faz uma pesquisa sobre o tempo, em horas, que os estudantes dedicam ao estudo durante o dia, fora da aula. Com uma amostra aleatória de 60 estudantes, obtiveram-se os dados da tabela de frequência a seguir. Calcule os coeficientes de assimetria de Pearson e de Bowley e classifique a assimetria da distribuição de frequência obtida. Calcule também a curtose e classifique a distribuição. horas de estudo número de alunos 0,5 ⊢ 1,5 25 1,5 ⊢ 2,5 17 2,5 ⊢ 3,5 10 3,5 ⊢ 5,5 6 5,5 ⊢ 8,5 2 12. Uma maternidade está analisando a idade das mulheres que tiveram o seu primeiro filho. Os dados obtidos são: 25 23 21 28 41 18 19 23 20 22 23 Considerando os dados como amostrais, calcule a média, a mediana, a moda e o desvio padrão desses dados. Classifique os dados em relação à assimetria. 13. Considere as seguintes medidas, relativas a três distribuições de freqüência. Calcule os graus de curtose para cada distribuição e classifique cada uma das distribuições em relação à curva normal. Distribuições q1 q3 p10 p90 A 814 935 772 1012 B 63,7 80,3 55,0 86,6 C 28,8 45,6 20,5 49,8 14. Determine o grau de curtose e classifique a distribuição em relação à curva normal: pesos (kg) número de operários 50 ⊢ 58 10 58 ⊢ 66 15 66 ⊢ 74 25 74 ⊢ 82 24 82 ⊢ 90 16 90 ⊢ 98 10 15. A amostra abaixo é referente ao salário mensal de 60 funcionários de uma empresa (medidos em salários mı́nimos). 5 7 6,3 6 7 5,8 5 7 3 6,3 1 7 2,4 6 6 5,8 5 6 7 7,5 2 6 4,5 4 7 6,3 7 6 7 6,9 5 7 5,5 7 6 4,5 7 5 7 1,3 6 5 3,7 7 7 6,6 6 6 6 5,4 5 6 6,8 7 7 5,8 6 4 6 6,5 (a) Sabe-se que no mês de janeiro será dado um bônus salarial de meio salário mı́nimo para todos os funcionários. Qual será o salário médio mensal de ja- neiro? Qual será o salário mediano e o salário modal de janeiro? (b) Faça um gráfico apropriado para representar a variável que ajude a tirar conclusões sobre caracteŕısticas de posição, dispersão e assimetria. Faça co- mentários sobre os comportamentos observados no gráfico. 16. A amostra abaixo é referente ao salário mensal de 20 funcionários de uma empresa (medidos em salários mı́nimos), de modo que os 10 primeiros valores são salários referentes aos 10 indiv́ıduos do sexo masculino da amostra e os 10 seguintes são referentes aos indiv́ıduos do sexo feminino da amostra. 5 7 6,3 6 7 5,8 5 7 29 6,3 1 7 2,4 6 6 5,8 5 6 7 7,5 (a) Apresente o boxplot dos dados acima. (b) Apresente gráficos que ajudem a comparar os salários de homens e mulheres. Faça alguns comentários. (c) Pode-se dizer que os dados são simétricos? E os dados somente dos homens são simétricos? E os dados somente das mulheres são simétricos? 17. A amostra abaixo é referente as notas dos alunos da disciplina de Análise Multiva- riada do semestre de 2012/2. 1,5 7,9 6,3 6 7 5,8 5 7 2,9 8,3 0,1 9 2,4 6 2 5,8 5 6 7 7,5 (a) Apresente o boxplot dos dados acima. (b) Faça alguns comentários sobre o gráfico, avaliando, inclusive, a simetria dos dados. 18. Uma amostra de 20 indiv́ıduos apontou o seguinte rol de notas de QI: 50 52 53 54 55 55 57 59 60 60 69 71 73 73 74 74 76 77 77 78 (a) Faça um boxplot para os dados. (b) Avalie a assimetria dos dados através do coeficiente de assimetria e grafica- mente. (c) Avalie a curtose via coeficiente de curtose. 19. A seguir encontra-se um gráfico referente a acuidade visual de pacientes segundo o tipo de lente utilizada: Figura 1: Acuidade visual dos pacientes segundo o tipo de lente utilizada. ● ● ● ● ● ●Quiz Vert Leeo 0 20 40 60 80 Lentes A cu id ad e vi su al A medida de acuidade visual indica o “quão boa” se encontra a visão do indiv́ıduo. Quanto maior a medida de acuidade visual melhor. Com base nestas informações julgue as três lentes utilizadas neste estudo. 20. Decidiu-se investigar a distribuição do colesterol e do número de glóbulos vermelhos de profissionais da área da saúde. As informações pertinentes foram obtidas e encontram-se na tabela abaixo. O colesterol está expresso em mg/dL. Note que as informações do colesterol foram apresentadas para a amostra toda e também apresentada por gênero. Variável x̄ x(1) md q(0,75) x(n) Colesterol 100,00 14,00 120,32 200,15 217,32 Colesterol (Homem) 120,00 13,00 118,00 170,15 216,00 Colesterol (Mulher) 80,00 16,00 98,00 157,00 217,32 Número de glóbulos vermelhos 500,00 46,00 518,00 650,00 716,00 (a) Qual medida você recomenda para sintetizar o colesterol dos homens? Por quê? Com base na medida apontada o que você conclui? (b) Faça uma comparação entre os colesteróis de homens e mulheres segundo todas as medidas apresentadas. (c) Interprete a mediana, o 3o quartil e o máximo para a variável Número de glóbulos vermelhos.