Prévia do material em texto
Es ta t í s t i ca Ap l i cad a 1. Introdução à Estatística 1.1. Entendendo a importância da Estatística Jornais, televisão, rádio, revistas e outros meios de comunicação nos bombardeiam, diariamente, com notícias, baseadas em estatísticas, como se fossem verdades absolutas. Nessa hora, provavelmente, você sente a importância de ser capaz de avaliar corretamente o que lhe dizem. Todavia, será que os números apresentados resultam de uma análise estatística cuidadosa? O perigo está no fato de que, se não consegue distinguir as afirmações falsas das verdadeiras, então você está vulnerável à manipulação por outras pessoas, cujas conclusões podem conduzir você para decidir contra os interesses seus e, depois, arrepender-se. Por estas razões, conhecer Estatística é um grande passo no sentido de você tomar controle da sua vida (embora não seja, obviamente, a única maneira necessária para esta finalidade). Observe os seguintes exemplos de afirmações recentemente publicadas em dez meios de comunicação (não estou dizendo que cada uma delas seja verdadeira). Sua expectativa é de que a inflação feche o ano entre 6% e 7%. (Folha de São Paulo, Dinheiro, 16 de maio de 2005) Atualmente, a taxa de pacientes com câncer de pulmão que não apresentam reincidência depois de cinco anos de tratamento é de 17% – um avanço de 70% em relação à década de 70. (Revista Veja, edição 1905, 18 de maio de 2005) As projeções de mercado para o IPCA de 2005 subiram de 6,30% para 6,39% em pesquisa semanal feita pelo Banco Central e divulgada hoje. (O Estado de São Paulo, 16 de maio de 2005) Um estudo da Corporate Executive Board mostrou que a produtividade de um funcionário brilhante chega a ser até 12 vezes superior à do colega mediano. (Revista Exame, edição 841, 27 de abril de 2005) De acordo com a Embratur (Empresa Brasileira de Turismo), a companhia aérea trouxe 1.473.183 dos 6.138.000 passageiros que entraram no país no ano passado, o equivalente a 24% desses passageiros. (Revista Aeromagazine, Notícias, 16 de maio de 2005) IBGE: Emprego industrial cai 0,2% em março. (JB Online, 16 de maio de 2005) Os investidores que colocam todo seu dinheiro em uma única ação estão elevando em mais de 50% a chance de queda do poder de compra de seu investimento em um período de 20 anos, aponta o estudo. (JB Online, 17 de abril de 2005) Nordestinos já são 52,6% dos migrantes. (Jornal O Globo, 16 de maio de 2005) Comércio varejista cresce 1,75% em volume de vendas e 2,44% em receita nominal. (IBGE, 12 de maio de 2005) Se a vítima não fosse o prefeito de Santo André, o impacto não seria o mesmo e o caso teria sido tratado como mera estatística. (Márcio Coimbra em http://www.ambito-juridico.com.br/aj/cron0237.htm) Todas essas notícias são, na sua essência, Estatística. Elas parecem familiares, embora os exemplos sejam de áreas bastante distintas: economia, medicina, gestão, turismo, social, investimentos, comércio e até política. Em resumo, os números (também expressos por meio de tabelas e gráficos) e a interpretação deles surgem nos discursos de praticamente todo aspecto da vida contemporânea. Desse modo, as estatísticas são, freqüentemente, apresentadas como um testemunho de credibilidade a um argumento ou a uma recomendação, fato que você pode comprovar ouvindo o veiculado nos meios de comunicação: o primeiro pensamento é acreditar na notícia como se fosse verdade absoluta. Recorde-se, então, do ex-primeiro- ministro britânico Benjamin Disraeli (1804-1881), quando afirmou que “Há três espécies de mentiras: mentiras, mentiras deslavadas e estatísticas”. No entanto, Estatística é método, ciência e arte. É método quando, na Física, na Biologia, na Medicina ou na Pedagogia, aplica-se a populações específicas, isto é, serve a uma ciência particular, da qual se torna instrumento. É ciência quando, graças às suas teorias, estuda grandes conjuntos, independentemente da natureza destes, sendo autônoma e universal. Finalmente, é arte na construção de modelos para representar a realidade. Assim sendo, nem tudo está perdido, porque a Estatística pode ajudar você a reagir de modo inteligente às informações que lê ou escuta e, neste sentido, torna-se um dos mais importantes assuntos que provavelmente estudou. O presente artigo tem o objetivo de motivar você a ser mais um dos consumidores inteligentes de estatísticas e, para ser um deles, o primeiro passo é refletir e começar a questionar aquelas que encontrar. Por esta razão, convido você a reformar os seus hábitos estatísticos a partir de agora. Simplesmente, não mais aceite números, tabelas, gráficos e conclusões. Ao invés disso, comece a pensar nas fontes de informação e, mais importante, nos procedimentos usados Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 3 Es ta t í s t i ca Ap l i cad a para gerar essa informação. Defenda-se contra afirmações falsas, embrulhadas como se fossem estatísticas. Aprenda a reconhecer se uma evidência estatística apóia, realmente, uma conclusão apresentada. A Estatística está toda ela em volta de você, algumas vezes usada de modo adequado, outras vezes não. Como o objetivo da Estatística é auxiliar a sua tomada de decisões em situações de incerteza, distinguir as boas das más estatísticas é mais do que nunca, um dever, uma obrigação. 1.2. Objeto da Estatística Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão. A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados mesmo antes de se recolher a amostra, isto é, deve-se planejar a experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo de informação relevante para o problema em estudo, ou seja para a população de onde os dados provêm. Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando de lado a aleatoriedade presente. Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. Exemplo: Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de saladas, de sobremesas e de carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que seja provado um tipo de cada opção para concluirmos que estamos sendo bem servidos e que a comida está dentro dos padrões. 1.2. Método Estatístico 1.2.1. O Método Científico Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo. Podemos dizer, então, que: Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o estatístico. 1.2.2. O Método Experimental O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química, etc. 1.2.3. O Método Estatístico Muitas vezes temos a necessidade de descobrirfatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 4 Es ta t í s t i ca Ap l i cad a Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço. Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades etc. Mas isso tudo é impossível. Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método estatístico. O método estatístico, diante da impossibilidade de manter as causas constantes, adimite todas essas causas presentes variando-as, registrando esses variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 1.3. A Estatística Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos. Podemos dizer, então, que: A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.), desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcedam os dados obtidos inicialmente. Assim, a análise e interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação. 1.4. Fases do Método Estatístico Podemos distinguir no método estatístico as seguintes fases: 1.4.1. Coleta de Dados A coleta de dados pode ser direta e indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo prórpio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico, etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) contínua (registro) – quando feita continuamente, tal como a de nescimentos e óbitos e a de frequencia dos alunos às aulas; b) periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos; c) ocasional – quando feita exporadicamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 5 Es ta t í s t i ca Ap l i cad a 1.4.2. Apuração dos Dados Após a coleta dos dados, torna-se necessária sua apuração, ou contagem, denominando-a Tabulação. Para tanto, de posse dos dados, devemos ordená-los mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. 1.4.3. Apresentação dos Dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo estudado. 1.4.4. Análise dos Resultados O objetivo último da estatística é tirar conlusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 1.5. Abusos da Estatística 1.5.1. Más Amostras Outra fonte de estatística enganosa são os métodos inadequados de coleta de dados. É comum um pesquisador analisar dados e formular conclusões errôneas porque o método de coleta de dados foi deficiente. Considere o seguinte exemplo: Um jornal fez a seguinte pergunta: “Se você tivesse que começar novamente, você teria filhos? Escreva-nos. Algumas semanas depois o jornal informava que 70% dos pais dizem que não vale a pena ter filhos. Será que está amostra não era tendenciosa constituída dos pais que queriam desabafar. Como os próprios pais é que decidiram se seriam incluídos na pesquisa, temos um exemplo de pesquisa auto- selecionada, ou seja, uma pesquisa em que os próprios entrevistados decidem se serão incluídos. 1.5.2. Pequenas Amostras Os resultados obtidos com pequenas amostras não são necessariamente más, entretanto, os resultados obtidos com pequenas podem por vezes ser usados como uma forma de “mentira” estatística. As preferências de apenas 10 dentistas por determinado creme dental não devem servir de base para uma afirmação generalizada como “A pasta WW é recomendada por 8 em cada 10 dentistas.” Mesmo que a amostra seja grande, ela deve ser não tendenciosa e representativa da população de onde provém. 1.5.3. Estimativas por Suposição Outra fonte de engano estatístico envolve estimativas que são, na verdade, suposições (palpites), podendo apresentar erros substanciais. É preciso considerar a fonte da estimativa e a maneira como foi estabelecida. 1.5.4. Porcentagens Distorcidas: Por vezes utilizam-se porcentagens confusas ou distorcidas. Em um anúncio de página inteira, a Continental Airlines anuncia melhores serviços. No tocante ao caso de bagagem extraviada, o anúncio afirmava que se trata de uma área em que já melhoramos 100% nos últimos seis meses”. Em um editorial criticando essa estatística, o New York Times interpretou corretamente a melhora de 100% como significando que agora não se extravia mais qualquer bagagem – o que ainda não foi conseguido pela Continental Airlines. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 6 Es ta t í s t i ca Ap l i cad a 1.5.5. Perguntas Tendenciosas As perguntas em uma pesquisa podem ser formuladas de modo a “sugerirem” uma resposta. Por exemplo, Considere estas duas perguntas: Que rádio você prefere? A pergunta não sugere a resposta enquanto que a pergunta: A rádio Transamérica é a sua rádio preferida? Bom claro que é. Esta pergunta força a resposta. 1.5.6. Pressão do Pesquisador Quando se formulam perguntas a indivíduos pesquisados, esses freqüentemente dão respostas favoráveis à sua auto-imagem. Em uma pesquisa telefônica, 94% dos que responderam disseram que lavam suas mãos após usar um banheiro, mas a observação em lugares mostrou que o percentual efetivo é de apenas 68%. Outros exemplos: 1. Para determinar a reação do público à continuação de certo programa governamental,o pesquisador pergunta: “Acha que este programa dispendioso deve ser interrompido?” Explique por que esta pergunta provavelmente não proporcionará a informação desejada. Resposta: Ao formular a questão, o entrevistador está de fato, sugerindo que o programa é dispendioso. 2. Para estudar a reação do consumidor a um novo tipo de alimento enlatado, faz-se uma pesquisa de casa em casa durante as manhãs dos dias úteis, sem plano de voltar no caso de não ser encontrado ninguém em casa. Explique por que esta abordagem pode conduzir a uma informação enganadora. Resposta: Esta pesquisa não atinge os que têm maior probabilidade de usar o produto, pessoas solteiras ou casais em que ambos trabalham fora. 3. Uma estatística enganosa pode resultar, também da formulação de perguntas no lugar errado ou no momento errado. Explique por que, no caso seguinte, poderemos obter dados inúteis. Para predizer uma eleição, um pesquisar entrevista pessoas que saem do edifício onde está a sede nacional de um partido político. Resposta: As pessoas que saem de um edifício onde está a sede de um partido político provavelmente são filiadas ao partido. 4. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar por telefone 1500 consumidores. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra? Resposta: Excluem-se as pessoas com números não listados e pessoas sem telefone. 5. A revista Glamour publicou o seguinte resultado de uma pesquisa: “79% dos que responderam à nossa pesquisa de agosto afirmaram crer que os americanos se tornaram demasiadamente propensos a apelar para a justiça em casos corriqueiros”. A questão foi publicada na revista e os leitores podiam responder por correio, fax ou e-mail (tellus@galamour.com). Até que ponto é válido o resultado de 79%. Resposta: Como os pesquisados são auto-selecionados, os resultados da pesquisa não são válidos. 6. “De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituem o motivo mais comum para que um homem que procura emprego não cause boa impressão à primeira vista.” Os jornais apresentaram essa alegação com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa para sapatos. Faça um comentário sobre a razão por que os resultados de tal pesquisa podem ser questionados. Resposta: Um fabricante de graxa para sapatos obviamente tem interesse na importância do seu produto, e há muitas maneiras de este fato afetar os resultados da pesquisa. 7. O jornal Newport Chronicle afirma que as mães grávidas podem aumentar suas chances de ter uma criança sadia comendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nascidas de mães que comem lagostas têm menos problemas de saúde do que as nascidas de mães que não comem lagostas. Resposta: Mães que comem lagostas tendem a ser mais ricas e portanto podem pagar por melhor atendimento médico. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 7 Es ta t í s t i ca Ap l i cad a 2. População e Amostra 2.1. Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo: para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino; para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ..., n; para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos acima nos dizem que uma variável pode ser: a) qualitativa – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor da pele (branca, preta, amarela, vermelha, parda), etc.; b) quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = {1, 2, 3, ..., 58, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325, etc. Logo, é uma variável discreta. Já o peso desses alunos é uma variável contínua, pois um dos alunos pode pesar 72 kg, como 72,5 kg, como 72,54 kg, etc., dependendo esse valor da precisão da medida. 2.2. População e Amostra A Estatística é uma ciência baseada na teoria das probabilidades, cujo principal objetivo é nos auxiliar a tirar conclusões, em situações de incerteza, a partir de informações numéricas de uma amostra. É comum, por exemplo, às vésperas de uma eleição, um jornal afirmar que um candidato A vencerá com uma certa margem de votos. Em geral, esse tipo de afirmação está baseado numa pesquisa feita entre alguns eleitores, que constituem a amostra da pesquisa, uma vez que é impossível fazer a pesquisa com todos os eleitores (população envolvida). A primeira tarefa de um estatístico é definir clara e precisamente o problema a ser estudado, qual a população envolvida e que amostra irá utilizar. Exemplo 1: Queremos obter informações sobre a audiência de certo programa de TV, na Grande Vitória. - População: conjunto de todos os domicílios da região da Grande Vitória que possuem TV. - Amostra: conjunto de domicílios que serão visitados. Exemplo 2: Estudar a procedência dos candidatos a uma certa universidade. - População: conjunto de todos os candidatos à referida universidade. - Amostra: conjunto dos candidatos que serão entrevistados. Todos os elementos do grupo a ser estudado constituem a população. A parte da população efetivamente examinada é a amostra. Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 (oitocentas) pessoas. Nesse caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos examinar alguns desses elementos. É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionar exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos concluir que todos elementos da população também o são. Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a conclusões erradas, mas este risco diminui à medida qua aumenta a quantidade de elementos a serem examinados. Devemos estabelecer um número mínimo de elementos para compor a amostra. Essa quantidade não deve ser Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 8 Es ta t í s t i ca Ap l i cad a menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances das informações da amostra se afastarem demasiadamente daquelas que obteríamos se examinássemos toda a população. No exemplo citado anteriormente, como a população tem 800 elementos, devemos escolher uma amostra com, no mínimo, 80 pessoas (10% de 800). Podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática e amostragem estratificada proporcional. 2.2.1. Amostragem Aleatória Simples Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando- se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Vamos obter uma amostra representativa para uma pesquisa da estatura de 90 (noventa) alunos de uma escola: a) Numeramos os alunos de 01 a 90. b) Escrevemos os números, de 01 a 90, em pedaços iguais de ummesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, 9 (nove) números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da população é grande, esse tipo de sorteio torna-se muito trabalhoso. 2.2.2. Amostragem Sistemática Continuemos a considerar a população de 90 elementos de nossa lista numerada. Para organizar uma amostragem sistemática, sorteamos um número de 1 a 10, ao acaso. Suponhamos que tenha sido obtido o número 6. Ele será o primeiro elemento da amostra, e os demais serão determinados em intervalos de dez unidades. Assim, nossa amostra será: 6 16 26 36 46 56 66 76 86 A amostragem sistemática é simples de ser realizada e, no caso de amostras muito grandes, acarreta economia de tempo e dinheiro. 2.2.3. Amostragem Estratificada Proporcional Muitas vezes a população se divide em subpopulações – estratos. Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem estratificada proporcional, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra estratificada proporcional. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: Sexo População 10% Amostra M 54 4,554 100 10 =× 5 F 36 6,336 100 10 =× 4 Total 90 0,990 100 10 =× 9 Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 9 Es ta t í s t i ca Ap l i cad a EXERCÍCIOS: Série Aula: 1) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas): a) Universo: alunos de uma escola. Variável: cor dos cabelos – .................................... b) Universo: casais residentes em uma cidade. Variável: número de filhos – .................................... c) Universo: as jogadas de um dado. Variável: o ponto obtido em cada jogada – .................................... d) Universo: peças produzidas por certa máquina. Variável: nº de peças produzidas por hora – .................................... e) Universo: peças produzidas por certa máquina. Variável: diâmetro externo – .................................... f) População: alunos de uma escola. Variável: cor dos olhos – .................................... g) P.: casais residentes em uma cidade. V.: sexo dos filhos – .................................... 2) Diga quais variáveis abaixo são discretas e quais são contínuas: a) P.: estação meteorológica de uma cidade. V.: precipitação pluviométrica, durante um ano – .................................... b) P.: Bolsa de Valores de São Paulo. V.: nº de ações negociadas – .................................... c) P.: funcionários de uma empresa. V.: salários – .................................... d) P.: pregos produzidos por uma máquina. V.: comprimento – .................................... e) P.: propriedades agrícolas do Brasil. V.: produção de algodão – .................................... f) P.: segmentos de reta. V.: comprimento – .................................... g) P.: bibliotecas da cidade de São Paulo. V.: número de volumes – .................................... h) P.: aparelhos produzidos em uma linha de montagem. V.: nº de defeitos por unidade – .................................... i) P.: indústrias de uma cidade. V.: índice de liquidez – .................................... 3) Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes, entre os 1.000 matriculados. Responda: a) Qual é a população envolvida na pesquisa? b) Que tipo de amostragem foi utilizada e qual é a amostra considerada? 4) A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da cidade de Morro Grande é apresentada abaixo. Baseando-se nesses dados, estratifique uma amostra com 200 elementos. Escola População A 500 B 250 C 440 D 360 Total 1.550 5) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª série, 28 na 4ª série, 35 na 5ª série, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos preenchendo a tabela abaixo. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 10 Es ta t í s t i ca Ap l i cad a Séries População Cálculo Proporcional Amostra 1ª 35 6,5 250 4035 =⋅ 6 2ª __ = __ 3ª __ = __ 4ª 28 = __ 5ª __ = 6 6ª __ = __ 7ª __ = __ 8ª __ = __ Total 250 40 6) Uma cidade X apresenta o seguinte quadro relativo às escolas de Ensino Fundamental. Obtenha uma amostra estratificada proporcional de 120 estudantes. Escolas Nº de Estudantes Masculino Feminino A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 Total 876 955 Série Casa: 1) População ou universo é: a) Um conjunto de pessoas; b) Um conjunto de elementos quaisquer; c) Um conjunto de pessoas com uma característica comum; d) Um conjunto de elementos com pelo menos uma característica em comum; e) Um conjunto de indivíduo de mesmo município, estado ou país. 2) Uma parte da população retirada para analisá-la denomina-se: a) Universo; b) Parte; c) Pedaço; d) Dados brutos; e) Amostra. 3) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial; d) Estatística Descritiva; e) Estatística Grupal. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 11 Es ta t í s t i ca Ap l i cad a 4) Diga qual tipo de variável estamos trabalhando nos casos abaixo: a) Número de inscrições no Seguro Social; b) Número de passageiros no ônibus da linha Rio/São Paulo; c) Escolaridade d) Peso médio dos recém nascidos; e) Altitude acima do nível do mar; f) Uma pesquisa efetuada em 1.015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line; g) Cada cigarro Camel tem 16,13 mg de alcatrão; h) O radar indica que Nolan Ryan rebateu a última bola a 82,3 km/h 5) Classifique as seguintes variáveis: a) Cor dos olhos: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. b) Número de filhos de um casal: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. c) Peso de um indivíduo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. d) Altura de um indivíduo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. e) Número de alunos de uma escola: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. f) Tipo sanguíneo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua. 6) Na Escola São Miguel, as classes têm 20, 40, 25 e 15 alunos. Determine uma amostra estratificada com 20 elementos. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 12 Es ta t í s t i ca Ap l i cad a 7) Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem. a) Qual a população envolvida na pesquisa? b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200 pessoas. 8) Quer fazer-se um estudo que estabeleça a relação entre faixa salarial e interesse por teatro, tomando-se um grupo de 1.550 pessoas.A tabela abaixo indica o número de pessoas de determinadas faixas salariais. Determine uma amostra com 200 elementos. Faixa salarial Nº de pessoas Até 3 salários mínimos 776 De 3 a 6 salários mínimos 387 De 6 a 9 salários mínimos 232 Acima de 9 salários mínimos 155 Total 1.550 3. Séries Estatísticas 3.1. Tabelas Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. Tabela é um quadro que resume um conjunto de observações. 3.2. Séries Estatísticas Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica. 3.2.1. Séries Históricas, Cronológicas ou Temporais Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Exemplo: PREÇO DO ACÉM NO VAREJO SÃO PAULO – 1989-94 Anos Preço Médio (US$) 1989 2,24 1990 2,73 1991 2,12 1992 1,89 1993 2,04 1994 2,62 FONTE: APA. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 13 Es ta t í s t i ca Ap l i cad a 3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo: DURAÇÃO MÉDIA DOS ESTUDOS SUPERIORES – 1994 Países Número de Anos Itália 7,5 Alemanha 7,0 França 7,0 Holanda 5,9 Inglaterra Menos de 4 FONTE: Revista Veja. 3.2.3. Séries Específicas ou Categórica Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: REBANHOS BRASILEIROS – 1992 Espécies Quantidade (1.000 cabeças) Bovinos 154.440,8 Bubalinos 1.423,3 Eqüinos 549,5 Asininos 47,1 Muares 208,5 Suínos 34.532,2 Ovinos 19.955,9 Caprinos 12.159,6 Coelhos 6,1 FONTE: IBGE. 3.2.4. Séries Conjugadas – Tabela de Dupla Entrada Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Exemplo: TERMINAIS TELEFÔNICOS EM SERVIÇO – 1991-93 Regiões 1991 1992 1993 Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro-Oeste 713.357 778.925 884.822 FONTE: Ministério das Comunicações. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 14 Es ta t í s t i ca Ap l i cad a A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico- histórica ou geográfico-temporal. Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou mais entradas. 3.3. Dados Absolutos e Dados Relativos Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de porcentagens, índices, coeficientes e taxas. 3.3.1. As Porcentagens Considere a série: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 Categorias Número de Alunos 1º grau 19.286 2º grau 1.681 3º grau 234 Total 21.201 Dados fictícios. Calculemos as porcentagens dos alunos de cada grau: 1º grau: 0,9196,90100 201.21 286.19 ==⋅ 2º grau: 9,792,7100 201.21 681.1 ==⋅ 3º grau: 1,110,1100 201.21 234 ==⋅ Com esses dados, podemos formar uma nova coluna na série em estudo: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 Categorias Número de Alunos % 1º grau 19.286 91,0 2º grau 1.681 7,9 3º grau 234 1,1 Total 21.201 100,0 Dados fictícios. Os valores dessa nova coluna nos diz que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau, 8, aproximadamente, no 2º grau e 1 no 3º grau. O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo. Considere, agora, a série: Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 15 Es ta t í s t i ca Ap l i cad a MATRÍCULAS NAS ESCOLAS DAS CIDADES A E B – 1995 Categorias Nº de Alunos Cidade A Cidade B 1º grau 19.286 38.660 2º grau 1.681 3.399 3º grau 234 424 Total 21.201 42.483 Dados fictícios. Qual das cidades tem, comparativamente, maior número de alunos em cada grau? Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes às poscentagens, obtemos: MATRÍCULAS NAS ESCOLAS DAS CIDADES A E B – 1995 Categorias Cidade A Cidade B Nº de Alunos % Nº de Alunos % 1º grau 19.286 91,0 38.660 91,0 2º grau 1.681 7,9 3.399 8,0 3º grau 234 1,1 424 1,0 Total 21.201 100,0 42.483 100,0 Dados fictícios. o que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau. 3.3.2. Os Índices Os índices são razões entre duas grandezas tais que uma não inclui a outra. São exemplos de índices: Índice cefálico = 100 crânio do allongitudin diâmetro crânio do transverso diâmetro × Quociente intelectual = 100 crônica idade mental idade × Densidade demográfica = superfície população Índices econômicos: Produção per capita = população produção da total valor Consumo per capita = população bem do consumo Renda per capita = população renda Receita per capita = população receita Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 16 Es ta t í s t i ca Ap l i cad a 3.3.3. Os Coeficientes Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número de não-ocorrências). São exemplos de coeficientes: Coeficiente de natalidade = total população snascimento de número Coeficiente de mortalidade = total população óbitos de número Coeficiente educacionais: Coeficiente de evasão escolar = matrículas de inicial número evadidos alunos de número Coeficiente de aproveitamento escolar = matrículas de final número aprovados alunos de número Coeficiente de recuperação escolar = orecuparaçã em alunos de número srecuperado alunos de número 3.3.4. As Taxas As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc.) para tornar o resultado mais inteligível. São exemplos de taxas: Taxa de natalidade = coeficiente de natalidade x 1.000 Taxa de mortalidade = coeficiente de maortalidade x 1.000 Taxa de evasão escolar = coeficiente de evasão escolar x 100 EXERCÍCIOS: Série Aula: 1) Clasifique as séries: a) PRODUÇÃO DE BORRACHA NATURAL – 1991-93 Anos Toneladas 1991 29.543 1992 30.712 1993 40.663 FONTE: IBGE. b) AVICULTURA BRASILEIRA – 1992 Espécies Número (1.000 cabeças) Galinhas 204.160 Galos, frangos, frangas e pintos 435.465 Codornas 2.488 FONTE: IBGE. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 17 Es ta t í s t i ca Ap l i cad a c) VACINAÇÃO CONTRA A POLIOMIELITE – 1993 Regiões Quantidade Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823 FONTE: Ministério da Saúde. d) AQUECIMENTO DE UM MOTOR DEAVIÃO DE MARCA X Minutos Temperatura (ºC) 0 20 1 27 2 34 3 41 4 49 5 56 6 63 Dados fictícios. 2) A tabela seguinte foi elaborada a partir da leitura do texto de Philip M. Fearnsinde, do Instituto Nacional da Amazônia. DESMATAMENTO EM RONDÔNIA Regiões 1975 1978 1980 1983 Área (km2) 1.216,5 4.184,5 7.579,3 13.955,2 % 0,5 1,72 3,12 5,74 FONTE: Revista Ciência Hoje, nº 19. a) Que tipo de fonte (primária ou secundária) foi consultada para a elaboração da tabela? b) Que tipo de série está representada na tabela? 3) Uma série estatística é denominada espacial quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 4) Uma série estatística é denominada cronológica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 5) Uma série estatística é denominada composta quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 6) Construa a tabela e especifique o tipo de série em cada caso: Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 18 Es ta t í s t i ca Ap l i cad a a) As capacidades dos estádios do Maracanã (Rio de Janeiro), do Morumbi (São Paulo) e do Mineirão (Belo Horizonte) são, respectivamente: 220.000, 150.000, 110.000 pessoas. (Fonte: Brasil em dados) b) A população do Brasil em 1962 era de 74.100.000 habitantes; em 1964, de 78.800.000; em 1966, de 83.900.000 e em 1969, de 92.300.000. (Fonte: IBGE) 7) Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35 alunos. A taxa de evasão foi de: %5,12100100 40 35 - 40 100 inicial matrícula nº evadidos de nº =×=×=×=TEE 8) Complete a tabela abaixo: Escolas Nº de Alunos Dados Relativos Por 1 Por 100 A 175 0,098 9,8 B 222 _____ _____ C 202 _____ _____ D 362 _____ _____ E 280 _____ _____ F 540 _____ _____ Total 1.781 1,000 100,0 9) São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que sua área terrestre é de 248.256 km2, calcule a sua densidade demográfica. 10) Um professor preencheu um quadro, enviado pela D.E., com os seguintes dados: Série Nº de Alunos 30/03 Nº de Alunos 30/11 Promovidos sem recuperaçã o Retidos sem recuperaçã o Em recuperaçã o Recuperados Não- recuperado s Total Geral Promovido s Retidos 1º A 49 44 35 03 06 05 01 40 04 1º B 49 42 42 00 00 00 00 42 00 1º C 47 35 27 00 08 03 05 30 05 1º D 47 40 33 06 01 00 01 33 07 Total 192 161 137 09 15 08 07 145 16 Calcule: a) a taxa de evasão, por classe. b) a taxa de evasão total. c) a taxa de aprovação, por classe. d) a taxa de aprovação geral. e) a taxa de recuperação, por classe. f) a taxa de recuperação geral. g) a taxa de reprovação na recuperação geral. h) a taxa de aprovação, sem a recuperação. i) a taxa de retidos, sem a recuperação. Série Casa: 1) Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação de 36 alunos. 2) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE): população: 15.957,6 mil habitantes; superfície: 586.624 km2; nascimentos: 292.036; óbitos: 99.281. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 19 Cálculos: A → 098,01 781.1 175 =× Es ta t í s t i ca Ap l i cad a Calcule: a) o índice de densidade demográfica; b) a taxa de natalidade; c) a taxa de mortalidade. 3) Uma série estatística é denominada categórica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 4) Uma série estatística é denominada geográfica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 5) Uma série estatística é denominada específica quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 6) Uma série estatística é denominada mista quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 7) Uma série estatística é denominada temporal quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os resultados são agrupados em subintervalos do intervalo observado. 8) Uma escola apresentava, no final do ano, o seguinte quadro: Séries Matrículas Março Novembro 1ª 480 475 2ª 458 456 3ª 436 430 4ª 420 420 Total 1.794 1.781 a) Calcule a taxa de evasão por série. b) Calcule a taxa de evasão da escola. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 20 Es ta t í s t i ca Ap l i cad a 4. Distribuição de Frequência Praticamente se resume na maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível sua leitura, tanto no sentido horizontal quanto no vertical. 4.1. Tabela Primitiva / Rol Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 (quarenta) alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores: ESTATURA DE 40 ALUNOS DO COLÉGIO A 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol. ESTATURA DE 40 ALUNOS DO COLÉGIO A 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos qua há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. 4.2. Distribuição de Freqüência Denominamos frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência: ESTAT. (cm) FREQ. ESTAT. (cm) FREQ. ESTAT. (cm) FREQ. 150 1 158 2 167 1 151 1 160 5 168 2 152 1 161 4 169 1 153 1 162 2 170 1 154 1 163 2 172 1 155 4 164 3 173 1 156 3 165 1 Total 40 157 1 166 1 Este tipo de tabela não é aconselhavel quando estamos trabalhando com amostragens grandes, sendo que poderá ficar muito extensa, dificultando, além de sua elaboração, as análises e conclusões dos dados pesquisados. Sendo possível, a solução mais aceitável é o agrupamento dos valores em vários intervalos. Chamando de frequênciade uma classe o número de valores da variável pertencentes à classe, os dados da tabela acima, podem ser dispostos como na tabela abaixo, denominada distribuição de frequência com intervalo de classe: ESTATURA DE 40 ALUNOS DO COLÉGIO A Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 21 Es ta t í s t i ca Ap l i cad a Estaturas (cm) Frequência 150 |–– 154 4 154 |–– 158 9 158 |–– 162 11 162 |–– 166 8 166 |–– 170 5 170 |–– 174 3 Total 40 4.3. Elementos de uma Distribuição de Freqüência 4.3.1. Classe Classes são intervalos de variação da variável. 4.3.2. Limites de Classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (Li) e o maior número, o limite superior da classe (Lf). 4.3.3. Amplitude de um Intervalo de Classe Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por h. Assim: h = Lf – Li 4.3.4. Amplitude Total da Distribuição Amplitude total da distribuição (At) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primenra classe (limite inferior mínimo): At = Lf (máx.) – Li (mín.) 4.3.5. Ponto Médio de uma Classe É o ponto que divide o intervalo de classe em duas partes iguais. 2 LL Pm fi + = 4.4. Determinação do número de Classes Não existe regra fixa para se determinar o número de classes. Sturges sugere uma regra para a determinação do número de classes (desde que se conheça o número de observações ou informações), que é a seguinte: n = 1 + 3,3 . log N onde, n = número de classes N = número de dados (observações) a distribuir Outra maneira de estipular o número de classes é empregando a seguinte relação (conhecendo a amplitude): Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 22 Es ta t í s t i ca Ap l i cad a n = h At 4.5. Tipos de Freqüências Freqüências simples ou absoluta (Fi) são os valores que realmente representam o número de dados de cada classe. Assim, a soma das freqüências simples é igual ao número total dos dados: ∑ = NFi Freqüências simples relativas (fi) são os valores das razões entre freqüências simples e a freqüência total: ∑ = i i i F F f Freqüência acumulada (Fa) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: )k...,,2,1i(FFa i == ∑ Freqüência acumulada relativa (fa) são os valores das razões entre freqüências simples e a freqüência total: ∑ = iF Fa fa Considerando a tabela do exemplo anterior (item 4.2), podemos montar a seguinte tabela com as frequências estudadas: ESTATURA DE 40 ALUNOS DO COLÉGIO A i Estaturas (cm) Fi Pm fi Fa fa 1 150 |–– 154 4 152 0,100 4 0,100 2 154 |–– 158 9 156 0,225 13 0,325 3 158 |–– 162 11 160 0,275 24 0,600 4 162 |–– 166 8 164 0,200 32 0,800 5 166 |–– 170 5 168 0,125 37 0,925 6 170 |–– 174 3 172 0,075 40 1,000 Total ∑ = 40 ∑ = 1,000 4.6. Distribuição de Freqüência sem Intervalos de Classe Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado com um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalo de classe, tomando a seguinte forma: xi Fi x1 F1 x2 F2 x3 F3 … F4 xN F5 Σ Fi = N Exemplo: Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”: i xi Fi Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 23 Es ta t í s t i ca Ap l i cad a 1 2 4 2 3 7 3 4 5 4 5 2 5 6 1 6 7 1 Σ = 20 Completada com os vários tipos de freqüências, temos: i xi Fi Fa fi fa 1 2 4 4 0,20 0,20 2 3 7 11 0,35 0,55 3 4 5 16 0,25 0,80 4 5 2 18 0,10 0,90 5 6 1 19 0,05 0,95 6 7 1 20 0,05 1,00 ∑ = 20 ∑ = 1,00 EXERCÍCIOS: Série Aula: 1) As notas obtidas por 50 alunos de uma classe foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 Complete a distribuição de freqüência abaixo: i Notas Pm Fi 1 0 |–– 2 1 1 2 2 |–– 4 ___ ___ 3 4 |–– 6 ___ ___ 4 6 |–– 8 ___ ___ 5 8 |–– 10 ___ ___ ∑ = 50 2) Complete a tabela abaixo: i Classes Fi Fa fi (%) fa (%) 1 0 |–– 8 4 ___ ___ ___ 2 8 |–– 16 10 ___ ___ ___ 3 16 |–– 24 14 ___ ___ ___ 4 24 |–– 32 9 ___ ___ ___ 5 32 |–– 40 3 ___ ___ ___ ∑ = 40 ∑ = 100 % 3) Complete os dados que faltam na distribuição de freqüência: Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 24 Es ta t í s t i ca Ap l i cad a i xi Fi Fa fi (%) fa (%) 1 0 1 ___ 5,0 ___ 2 1 ___ 4 15,0 ___ 3 2 4 ___ ___ ___ 4 3 ___ 13 25,0 ___ 5 4 3 ___ 15,0 ___ 6 5 2 18 ___ ___ 7 6 ___ 19 ___ ___ 8 7 ___ ___ ___ ___ ∑ = 20 ∑ = 100 % 4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: Áreas (m2) 300 |–– 400 |–– 500 |–– 600 |–– 700 |–– 800 |–– 900 |–– 1.000 |–– 1.100 |–– 1.200 Nº de Lotes 14 46 58 7 6 68 6 2 48 22 6 Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a freqüência da quarta classe; g) a freqüência relativa absoluta da sexta classe; h) a freqüência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m2; j) o número de lotes cuja área atinge e ultrapassa 800 m2; k) a porcentagem de lotes cuja área não atinge 600 m2; l) a porcentagem de lotes cuja área seja maior ou igual a 900 m2; m) a porcentagem de lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2; n) a classe do 72º lote; o) até que classe estão incluídos 60% dos lotes. Série Casa: 1) Complete a distribuição abaixo, determinando as frequências absolutas: i xi Fi Fa 1 2 ___ 2 2 3 ___ 9 3 4 ___ 21 4 5 ___ 29 5 6 ___ 34 ∑ = 34 2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº de acidentes 0 1 2 3 4 5 6 7 Nº de motoristas 20 10 16 9 6 5 3 1 Determine: a) o número de motoristas que não sofreram nenhum acidente; b) o número de motoristas que sofreram pelo menos 4 acidentes; Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 25 Es ta t í s t i ca Ap l i cad a c) o número de motoristas que sofreram menos de 3 acidentes; d) o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; e) a porcentagem dos motoristas que sofreram no máximo 2 acidentes. 3) Complete os dados que faltam na distribuição de freqüência: i Classes Pm Fi Fa fi (%) fa (%) 1 0 |–– 2 1 4 ___ 4,0 ___ 2 2 |–– 4 ___ 8 ___ ___ ___ 3 4 |–– 6 5 ___ 30 18,0 ___ 4 __ |–– __ 7 27 ___ 27,0 ___ 5 8 |–– 10 ___ 15 72 ___ ___ 6 10 |–– 12 ___ ___ 83 ___ ___ 7 __ |–– __ 13 10 93 10,0 ___ 8 14 |–– 16 ___ ___ ___ 7,0 ___ ∑ = ___ ∑ = ___ 4) Conhecidas as notas de 50 alunos: 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 5) As notas obtidas em Matemática por 80 estudantes de uma escola X estão relacionadas abaixo: 68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74 62 95 78 63 72 66 78 82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75 65 80 73 57 88 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77 a) Organize o rol colocando os dados em ordem crescente. b) Qual é a menor nota? Qual é a maior nota? c) Qual é a amplitude total? d) Qual é a nota do estudante classificado em 10º lugar? e) Organize os dados em classes considerando 5 como amplitude. f) Faça a distribuição de freqüências. g) Quantos estudantes receberam nota superior ou igual a 85? Qual a porcentagem? 6) Observando a tabela abaixo, responda: Faixa de renda Habitações Até 1 salário mínimo 224.740 De 1 a 3 salários mínimos 363.860 De 4 a 8 salários mínimos 155.700 Acima de 8 saláriosmínimos 47.500 Total 791.800 a) Qual é a porcentagem de domicílios onde a renda é superior a 8 salários mínimos? b) Quantos são os domicílios onde a renda está entre 1 e 3 salários? c) Quantos são os domicílios onde a renda está abaixo de 3 salários? 7) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição de freqüência abaixo: Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 26 Es ta t í s t i ca Ap l i cad a Duração (em horas) Nº de lâmpadas 300 |–– 400 14 400 |–– 500 46 500 |–– 600 58 600 |–– 700 76 700 |–– 800 68 800 |–– 900 62 900 |–– 1.000 48 1.000 |–– 1.100 22 1.100 |–– 1.200 6 Total ∑ = 400 Observando a tabela, responda: a) Qual a amplitude de cada classe? b) Qual a amplitude total da distribuição? c) Qual o ponto médio da quinta classe? d) Qual a freqüência relativa absoluta da sexta classe? e) Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas? f) Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais? g) Construir uma tabela de distribuição de freqüência, em que apareçam Pm, Fi, Fa, fi e fa. 5. Gráficos Estatísticos 5.1. Representação Gráfica Os gráficos constituem um poderoso instrumento de análise e interpretação de um conjunto de dados. Eles aparecem nos mais variados veículos de comunicação. Pesquisas de opinião pública, pesquisas eleitorais, economia, agricultura, saúde são apenas alguns exemplos de assuntos em que as representações gráficas assumem um papel fundamental para explicar o comportamento do objeto de estudo. Os mais importantes recursos fornecidos pelos gráficos são a facilidade e a rapidez na absorção e interpretação dos resultados, por parte do leitor. 5.1.1. Gráfico de Linha Os gráficos de linhas são bastante utilizados na identificação de tendências de aumento ou diminuição dos valores numéricos de uma dada informação. Assim, vamos encontrar com frequência esse tipo de representação em análises tais como lucros de empresas, incidência de moléstias, índices de crescimento populacional ou de mortalidade infantil, índices de custo de vida, etc. Seu traço é feito no plano cartesiano. Exemplo: Na cidade de São Joaquim (SC), foi anotada a temperatura registrada às 8 horas, durante sete dias consecutivos, conforme a seguinte tabela: TEMPERATURA NA CIDADE DE SÃO JOAQUIM – SC Dia Temperatura (ºC) 1º 1 2º –2 3º –3 4º 4 5º 5 6º 6 7º 7 Com base na tabela, façamos a representação gráfica da variação de temperatura. Solução: Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 27 Es ta t í s t i ca Ap l i cad a -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 1º 2º 3º 4º 5º 6º 7º Dia Te m pe ra tu ra (º C ) 5.1.2. Gráfico de Colunas ou de Barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplo: a) Gráfico em colunas PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL BRUTO 1989-92 Anos Quant. Produzida (1.000 t) 1989 18.196 1990 11.168 1991 10.468 1992 9.241 Fonte: Ministério da Agricultura 0 5.000 10.000 15.000 20.000 1989 1990 1991 1992 Anos M il to ne la da s b) Gráfico em barras Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 28 Es ta t í s t i ca Ap l i cad a EXPORTAÇÕES BRASILEIRAS MARÇO – 1995 Estados Valor (US$ milhões) São Paulo 1.344 Minas Gerais 542 Rio Grande do Sul 332 Espírito Santo 285 Paraná 250 Santa Catarina 202 Fonte: SECEX 0 500 1.000 1.500 Santa Catarina Paraná Espírito Santo Rio Grande do Sul Minas Gerais São Paulo Milhões de dólares 5.1.3. Gráfico de Colunas ou de Barras Múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Exemplo: BALANÇA COMERCIAL DO BRASIL – 1989-93 Especificações Valor (US$ 1.000.000) 1989 1990 1991 1992 1993 Exportação (FOB) 34.383 31.414 31.620 35.793 38.783 Importação 18.263 20.661 21.041 20.554 25.711 Fonte: Ministério da Fazenda 0 10.000 20.000 30.000 40.000 1989 1990 1991 1992 1993 U S$ m ilh ão Exportação (FOB) Importação 5.1.4. Gráfico de Setores A estatística recorre com frequência a esse tipo de gráfico, que consiste em distribuir num círculo setores proporcionais aos dados do problema. O gráfico de setores, ou setograma, é utilizado principalmente quando as quantidades a serem comparadas são muito diferentes umas das outras, caso em que uma ou mais delas se salientam em relação ao conjunto. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 29 Es ta t í s t i ca Ap l i cad a Exemplo: DISTRIBUIÇÃO DE REMUNERAÇÕES MENSAIS NO BRASIL – 1983 Faixa Salarial (em salários mínimos) Nº de empregados % Até 3 salários 11.770.000 67,1 De 3 a 7 salários 3.931.000 22,4 De 7 a 15 salários 1.355.000 7,7 Mais de 15 salários 483.000 2,8 Total 17.539.000 100,0 Mais de 15 salários De 7 a 15 salários De 3 a 7 salários Até 3 salários 5.2. Representação Gráfica de Distribuição de Frequência Uma distribuição de frequência pode ser representada graficamente pelo histograma, pelo polígono de frequência e pelo polígono de frequência acumulada. 5.2.1. Histograma O histograma é um gráfico constituído no plano cartesiano por retângulos em número igual ao número de classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua frequência. Trata-se também de um gráfico de área. É utilizado para variáveis contínuas; por isso, o gráfico também é contínuo: as colunas são justapostas. A área de cada coluna é proporcional à frequência da classe representada. Logo, a área de todo o histograma é proporcional à soma total das frequências. Exemplo: i Classes Pm Fi Fa fi (%) fa (%) 1 150 |--- 155 152,5 6 6 15,0 15,0 2 155 |--- 160 157,5 10 16 25,0 40,0 3 160 |--- 165 162,5 15 31 38,0 78,0 4 165 |--- 170 167,5 5 36 12,0 90,0 5 170 |--- 175 172,5 3 39 8,0 98,0 6 175 |--- 180 177,5 1 40 2,0 100,0 Total 40 100,0 Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 30 % Grau s 67,1 241, 6 22,4 80,6 7,7 27,7 Es ta t í s t i ca Ap l i cad a 0 5 10 15 F i 5.2.2. Polígono de Frequência Num sistema de coordenadas cartesianas ortogonais, tomamos sobre o eixo das abscissas segmentos proporcionais aos valores dos pontos médios das classes, e sobre o eixo das ordenadas segmentos proporcionais às frequências, determinando pontos no plano. Unindo os pontos obtidos, determinamos um diagrama poligonal, que convencionalmente é fechado no eixo das abscissas pelo ponto médio da classe imediatamente inferior à inicial e pelo ponto médio da classse imediatamente superior à final. Desta forma, obtemos um polígono de frequência. Vejamos agora como, a partir da tabela do item anterior, podemos construir um polígono de frequência. 0 3 6 9 12 15 F i 5.2.3. Ogiva A ogiva é um gráfico de frequências acumuladas, o que justifica ser também denominada curva de caumulação de frequências. Retomando o exemplo do item 5.2.1., podemos construir um gráfico de ogiva com os valores de frequência acumulada (Fa). 0 10 20 30 40 150 155 160 165 170 175 180 Fa Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 31 150 155 160 165 170 175 180 150 155 160 165 170 175 180 Vestuário (5,08) Educação, leitura e recreação (9,23) Saúde e cuidados pessoais (12,01) Transportes (13,95) Alimentação (25,12)Despesas diversas (inclui bebidas, cigarros e jogos eletrônicos) (3,46) Habitação (31,15) Es ta t í s t i ca Ap l i cad a EXERCÍCIOS: Série Aula: 1) Retrato do Orçamento Familiar Itens que maispesam (%) Capital Renda média familiar (em salários mínimos) Renda per capita (em salários mínimos) Belém 7,52 1,95 Belo Horizonte 10,76 2,69 Brasília 23,83 6,40 Curitiba 12,59 3,57 Florianópolis 12,06 3,34 Fortaleza 9,34 2,24 Goiânia 7,42 1,86 Porto Alegre 12,73 3,88 Recife 9,08 2,26 Salvador 6,06 1,43 Rio de Janeiro* 17,20 5,60 São Paulo* 15,62 4,27 * Para o Rio e São Paulo, os dados são referentes à Pesquisa do Orçamento Familiar de 1997/98. Fonte: O Estado de São Paulo, 15/03/2001. Considerando que, nos primeiros meses de 2002, o salário mínimo era de R$ 200,00, aproximadamente, analise as informações seguintes, classificando-as em V ou F, justificando: I. Em Belém, uma família gastava, em média, R$ 468,00 por mês em moradia. II. No Recife, um indivíduo gastava menos de R$ 65,00 por mês em transporte. III. Os gastos com saúde de uma família em Fortaleza superavam os gastos com transportes de uma família em Goiânia. IV. Descontados os gastos com habitação e alimentação, sobravam a uma família paulista menos de R$ 1.300,00 por mês. 2) Analisando o gráfico de colunas ao lado, classifique em V ou F cada sentença seguinte, justificando: a) Se esse conjunto de dados fosse representado em um gráfico de setores (pizza), o ângulo correspondente à região Sul seria menor que 90º. b) O número de emissoras da região Sudeste supera a soma do número de emissoras das regiões Nordeste, Centro-Oeste e Norte. c) Supondo que Goiás concentre 60% das emissoras de sua região, o percentual de emissoras do país representado por este Estado é menor que 5%. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 32 Rádio Emissoras - 2000 1064 762 664 227 165 Sudeste Sul Nordeste Centro-Oeste Norte O pesadelo vai continuar Não 96% Sim 4% Total de participantes: 1.061 VEJA on-line perguntou aos internautas: “Capturando Bin Laden, os EUA estarão livres de novos atentados?” Es ta t í s t i ca Ap l i cad a 3) a) Quais as medidas dos ângulos apresentados no gráfico ao lado? b) Quantos internautas responderam “sim”? 4) O histograma abaixo representa o tempo de espera (em minutos) na fila de um banco, em certa manhã, no centro de Belo Horizonte. Que porcentagem do total de pessoas esperou até 20 minutos na fila? 16 12 6 4 2 5) Considere os resultados abaixo de medição de temperatura, obtidos durante 10 dias, no mesmo horário, e construa um gráfico de linha. Dia 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º Temperatura (ºC) 32 35 34 30 28 31 32 33 30 29 6) A tabela abaixo representa, em termos percentuais, a distribuição da população brasileira por cor. Construa: a) um gráfico de setores; b) um gráfico de colunas. Cor % Branca 54,23 Preta 5,92 Amarela 0,56 Parda 38,85 Sem declaração 0,44 Total 100,00 Fonte: IBGE. 7) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos, responda? a) Qual é o intervalo de classe que tem maior freqüência? b) Qual a amplitude total da distribuição? c) Qual o número total de alunos? d) Qual é a freqüência do intervalo de classe 110 |–– 120? e) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 33 Fi Tempo 8 12 16 20 24 28 Es ta t í s t i ca Ap l i cad a f) Quantos alunos receberam notas de teste não inferiores a 100? Série Casa: 1) Construa um gráfico de linha a partir da seguinte tabela: COMÉRCIO EXTERIOR BRASIL – 1984-93 Anos Quantidade (1.000 t) Exportação Importação 1984 141.737 53.988 1985 146.351 48.870 1986 133.832 60.597 1987 142.378 61.975 1988 169.666 58.085 1989 177.033 57.293 1990 168.095 57.184 1991 165.974 63.278 1992 167.295 68.059 1993 182.561 77.813 2) Represente as tabelas usando o gráfico de colunas: a) PRODUÇÃO BRASILEIRA DE PETRÓLEO BRUTO 1991-93 Anos Quantidade (1.000 m3) 1991 36.180,4 1992 36.410,5 1993 37.164,3 Fonte: Petrobrás b) ENTREGA DE GASOLINA PARA CONSUMO BRASIL – 1988-91 Anos Volume (1.000 m3) 1988 9.267,7 1989 9.723,1 1990 10.121,3 1991 12.345,4 Fonte: IBGE 3) Represente as tabelas usando o gráfico de barras: a) PRODUÇÃO DE OVOS DE GALINHA BRASIL – 1992 Regiões Quantidade (1.000 dúzias) Norte 57.297 Nordeste 414.804 Sudeste 984.659 Sul 615.978 Centro-Oeste 126.345 Fonte: IBGE b) PRODUÇÃO DE VEÍCULOS DE AUTOPROPULSÃO BRASIL – 1993 Tipos Quantidade Automóveis 1.100.278 Comerciais leves 224.387 Comerciais pesados 66.771 Fonte: ANFAVEA 4) Construa um gráfico de colunas múltiplas a partir da seguinte tabela: Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 34 0 5 10 15 20 25 30 20 40 60 80 100 120 140 160 Es ta t í s t i ca Ap l i cad a PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO BRASIL – 1990-91 Anos NATUREZA Próprios (%) Alugados (%) Cedidos (%) 1990 62,7 22,9 14,4 1991 70,3 16,5 13,2 5) Represente as tabelas por meio de gráficos de setores: a) ÁREA TERRESTRE BRASIL Regiões Relativa (%) Norte 45,25 Nordeste 18,28 Sudeste 10,85 Sul 6,76 Centro-Oeste 18,86 Total 100,0 Fonte: IBGE b) PRODUÇÃO DE FERRO-GUSA BRASIL – 1993 Estados Produção (1.000 t) Minas Gerais 12.888 Espírito Santo 3.174 Rio de Janeiro 5.008 São Paulo 2.912 Fonte: Instituto Brasileiro de Siderurgia 6) A tabela a seguir mostra as áreas, em milhões de km2, dos oceanos. Representar graficamente os dados, usando: a) um gráfico de colunas; b) um gráfico de setores. Oceano Antártico Ártico Atlântico Índico Pacífico Área (milhões de km2) 36,8 23,2 199,4 137,9 342,7 7) Construa um gráfico de setores a partir da seguinte tabela: Espécie Quantidade Auxílio-natalidade 901.000 Auxílio-doença 467.000 Auxílio-funeral 88.000 Aposentadoria por Invalidez 40.000 Aposentadoria por Tempo de Serviço 39.000 Abono Permanente em Serviço 30.000 Pensão por Morte 73.000 Outras Espécies 44.000 8) Dada a amostra: 3, 4, 4, 5, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-se: a) construir a distribuição das freqüências absolutas; b) determinar as freqüências acumuladas, relativas absolutas e relativas acumuladas. c) construir o gráfico das freqüências absolutas (faça o gráfico que preferir). 9) De um exame final de Estatística, aplicado em 54 alunos da Faculdade FESAV, resultaram as seguintes notas: 7,0 6,7 3,5 4,2 5,0 6,2 7,2 8,9 9,0 7,1 6,9 6,7 7,4 6,2 5,1 4,3 6,9 7,0 2,1 4,2 6,4 7,1 8,3 9,2 6,6 7,1 1,7 2,8 4,5 5,7 6,1 6,8 7,5 6,4 6,5 8,3 8,6 7,0 9,8 10,0 7,5 7,8 6,9 6,1 5,0 8,0 7,8 7,0 8,0 7,2 7,0 7,4 6,9 5,0 Pede-se: a) Construir uma tabela de distribuição de freqüência, iniciando com 1,6 e adotando amplitude do intervalo de classe igual a 1,4, fechado à esquerda. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 35 Es ta t í s t i ca Ap l i cad a b) Os pontos médios. c) Elaborar uma distribuição de freqüência acumulada e percentual (absoluta e acumulada). d) Quantos alunos obtiveram notas inferiores a 5,0? e) Quantos alunos obtiveram notas entre 5,0 e 8,0? f) Que porcentagem de alunos obteve notas acima ou igual a 7,0? g) Construa o gráfico de setores para as classes. 10) Construa um gráfico de colunas considerando a tabela abaixo: DISTRIBUIÇÃO DE RENDA NO BRASIL – 1971 Faixa de renda Habitações Até 1 salário mínimo 224.740 De 1 a 3 salários mínimos 363.860 De 4 a 8 salários mínimos 155.700 Acima de 8 salários mínimos 47.500 Total 791.800 11) Represente num gráfico de setores as faixas de renda observadas no Brasil, em 1971, de acordo com a tabela observada no exercício 14 acima. Para isso, utilize as freqüências relativas absolutas. 12) A tabela abaixo no fornece as principais altas de preço verificadas no Brasil, no período de setembro a 11 de novembro de 1984. Construa um gráfico de colunas, com estes dados. ELEVAÇÃO ACUMULADA DE SETEMBRO A 11 DE NOVEMBRO DE 1984 Produto % de alta Carne 2,5 Leite 10,7 Frutas 18,7 Vestuário 14,5 Fonte: IBGE. 13) Considerando as distribuições de freqüência seguintes, confeccione,para cada uma: a) o histograma; b) o polígono de freqüência; c) a ogiva. I. i Pesos (kg) Fi 1 40 |–– 44 2 2 44 |–– 48 5 3 48 |–– 52 9 4 52 |–– 46 6 5 56 |–– 60 4 Σ = 26 II. i Estaturas (cm) Fi 1 150 |–– 156 1 2 156 |–– 162 5 3 162 |–– 168 8 4 168 |–– 174 13 5 174 |–– 180 3 Σ = 30 III. i Salários (R$) Fi 1 500 |–– 700 8 2 700 |–– 900 20 3 900 |–– 1.100 7 4 1.100 |–– 1.300 5 5 1.300 |–– 1.500 2 Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 36 Es ta t í s t i ca Ap l i cad a 6 1.500 |–– 1.700 1 7 1.700 |–– 1.900 1 Σ = 44 14) Conhecidas as notas de 50 alunos: 68 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 Determine: a) a distribuição de freqüência começando por 30 e adotando o intervalo de classe de amplitude igual a 10; b) as freqüências acumuladas; c) as freqüências relativas; d) o histograma, o polígono de freqüência e a ogiva. 15) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo: Nebulosidade 0 |–– 0,5 |–– 1,5 |–– 2,5 |–– 3,5 |–– 4,5 |–– 5,5 |–– 6,5 |–– 7,5 |–– 8,5 |–– 9,5 |–– 10,0 Fi 320 125 75 65 45 45 55 65 90 145 676 Construa o histograma correspondente. Prof. Rosiel Sousa blog: rosielsousa.blogspot.com 37 E s t a t í s t i c a A p l i c a d a 6. Medidas de Posição: Medidas de Tendência Central As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato dos dados observados tenderem, em geral, a se agrupar em torno de valores centrais. Dentre as medidas de tendência central, destacamos: - A média aritmética - A mediana - A moda As outras medidas de posição são as separatrizes, que englobam: - A própria média aritmética - Os quartis - Os percentis 6.1. Média Aritmética ( x) Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos estudos iremos nos limitar à mais importante: a média aritmética. Média aritmética é o quociente da soma dos valores da variável pelo número deles: n x x i Σ = sendo: x é a média aritmética; ix os valores da variável; n o número de valores. 6.1.1. Dados não-agupados Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a média aritmética simples. Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda média diária na semana de: 14 7 12181615131410 n x x i =++++++= Σ = Logo: x = 14 kg 6.1.2. Desvio em relação à média É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:. xxd ii −= . No exemplo anterior temos sete desvios:. d1 = 10 – 14 = –4 d5 = 16 – 14 = 2 d2 = 14 – 14 = 0 d6 = 18 – 14 = 4 d3 = 13 – 14 = –1 d7 = 12 – 14 = –2 d4 = 15 – 14 = 1 E s t a t í s t i c a A p l i c a d a 6.1.3. Propriedades da média 1ª propriedade: A soma algébrica dos desvios em relação à média é nula: 0d k 1i i =∑ = No exemplo anterior: 0d07)7()2(421)1(0)4(d 7 1i i 7 1i i =⇒=+−=−++++−++−= ∑∑ == 2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante: cxycxy ii ±=⇒±= Somando 2 a cada um dos valores da variável do exemplo dado, temos: y1 = 12, y2 = 16, y3 = 15, y4 = 17, y5 = 18, y6 = 20 e y7 = 14, Daí: 11214201817151612y k 1i i =++++++=∑ = Logo: 2xy21416y16 7 112 y +=⇒+==⇒== 3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante: cxycxy ii ×=⇒×= ou c x y c x y ii =⇒= Multiplicando por 3 cada um dos valores da variável do exemplo dado, temos: y1 = 30, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54 e y7 = 36, Daí: 29436544845394230y k 1i i =++++++=∑ = Logo: 3xy31442y42 7 294 y ×=⇒×==⇒== 6.1.4. Dados agrupados 6.1.4.1. Sem intervalos de classe Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: E s t a t í s t i c a A p l i c a d a Nº de meninos Fi 0 2 1 6 2 10 3 12 4 4 Σ = 34 Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: i ii F Fx x Σ ⋅Σ = O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos ii Fx ⋅ : Nº de meninos Fi ii Fx ⋅ 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 Σ = 34 Σ = 78 Temos, então: 3,2x29,2 34 78 F Fx x i ii =⇒== Σ ⋅Σ= Logo: x = 2,3 meninos. 6.1.4.2. Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio (Pm), e determinamos a média aritmética ponderada por meio da fórmula: i ii F Fx x Σ ⋅Σ = onde xi é o ponto médio (Pm) da classe. Exemplo: Calcular a estatura média dos alunos de uma escola conforme a tabela abaixo. i Estaturas (cm) Fi 1 150 |–– 154 4 2 154 |–– 158 9 3 158 |–– 162 11 4 162 |–– 166 8 5 166 |–– 170 5 6 170 |–– 174 3 Σ = 40 E s t a t í s t i c a A p l i c a d a Vamos abrir uma coluna para os pontos médios e outra para os produtos ii Fx ⋅ : i Estaturas (cm) Fi xi ii Fx ⋅ 1 150 |–– 154 4 152 608 2 154 |–– 158 9 156 1.404 3 158 |–– 162 11 160 1.760 4 162 |–– 166 8 164 1.312 5 166 |–– 170 5 168 840 6 170 |–– 174 3 172 516 Σ = 40 Σ = 6.440 Temos, então: 161x161 40 440.6 F Fx x i ii =⇒== Σ ⋅Σ = Logo: x = 161 cm. 6.1.5. Emprego da média A média é utilizada quando: a) desejamos obter a medida de posição que possui a maior estabilidade; b) houver necessidade de um tratamento algebrico posterior. EXERCÍCIOS: Série Aula: 1) Calcule a média aritmética da série: a) X: 1, 2, 8, 10, 12, 16, 21, 30. b) Y: 5, 6, 6, 10, 11, 11, 20. c) Z: 3,4; 7,8; 9,23; 12,15. 2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 40 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5; 3,5; 4; 5; 5,5; 4; 5, este lote será aprovado? Qual o peso médio do produto? 3) Um produto é vendido em três supermecados por R$ 13,00/kg, R$ 13,20/kg e R$ 13,50/kg. Determine quantos R$/kg se paga em média pelo produto. 4) Calcule a média aritmética da série: xi Fi 2 1 3 4 4 3 5 2 5) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo: E s t a t í s t i c a A p l i c a d a i Aluguel (R$) Nº de casas Fi 1 0 |––– 200,00 30 2 200,00 |––– 400,00 52 3 400,00 |––– 600,00 28 4 600,00 |––– 800,00 7 5 800,00 |––– 1.000,00 3 6.2. Mediana (Md) A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. 6.2.1. Dados não-agrupados Dada uma série de valores como, por exemplo: 5, 2, 6, 13, 9, 15, 10 de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15 O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. Se, porém, a série dada tiver um número par de termos, a mediana será a média aritmética dos valores centrais da série. Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para a mediana a média aritmética entre 10 e 12. Logo: Md = 11 2 22 2 1210 ==+ ⇒ Md = 11 Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano (P) será: 2 1n P+= Para comprovar tal fato nas séries dadas: - Para n = 7, temos 4 2 17 P =+= . Logo, a mediana é o 4º termo da série, isto é: Md = 9. - Para n = 8, temos 5,4 2 18 P =+= . Logo, a mediana é a média aritmética do 4º e 5º termos da série, isto é: 11 2 1210 Md =+= ⇒ Md = 11. Notas: E s t a t í s t i c a A p l i c a d a • Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. • Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. • Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. • A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: 5, 7, 10, 13, 15 ⇒ x = 10 e Md = 10 5, 7, 10, 13, 65 ⇒ x = 20 e Md = 10 isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. 6.2.2. Dados agrupados Se os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: 2 1n P += 6.2.2.1. Sem intervalos de classe Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior ao valor de P. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Tomemos a tabela do item 6.1.4.1., completando-a com a coluna correspondente à freqüência acumulada: Nº de meninos Fi Fa 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 Σ = 34 Sendo: 5,17 2 134 P =+= a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo esse o valor mediano. Logo, Md = 2. Nota: No caso de existir uma freqüência acumulada (Fa), tal que: P – Fa = 0,5, a mediana será dada pela média aritmética dos valores das variáveis correspondentes às freqüências acumuladas imediatamente inferior e superior a P. Exemplo: E s t a t í s t i c a A p l i c a d a xi Fi Fa 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Σ = 8 Temos: 5,4 2 18 P =+= Logo: 5,15 2 31 2 1615 Md ==+= 6.2.2.2. Com intervalos de classe Devemos seguir os seguintes passos: 1º) Determinamos as freqüências acumuladas; 2º) Calculamos 2 1n P += ; 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à P. Tal classe será a classe mediana; 4º) Calculamos a Mediana pela seguinte fórmula: Fi h)FaP( LiMd * ⋅− += Li = é o limite inferior da classe mediana. Fa* = é a freqüência acumulada da classe anterior à classe mediana. Fi = é a freqüência simples da classe mediana. h = é a amplitude do intervalo da classe mediana. Exemplo: i Estaturas (cm) Fi Fa 1 50 |–– 54 4 4 2 54 |–– 58 9 13 3 58 |–– 62 11 24 4 62 |–– 66 8 32 5 66 |–– 70 5 37 6 70 |–– 74 3 40 Σ = 40 Temos: 5,20 2 140 P =+= Logo,.a classe mediana será a terceira (i = 3). Li = 58 Fa* = 13 Fi = 11 h = 4 Substituindo esses valores na fórmula, obtemos: 73,60 11 4)135,20( 58Md Fi h)FaP( LiMd * =⋅−+=⇒⋅−+= Isto é: Md = 60,73. OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição. E s t a t í s t i c a A p l i c a d a 6.2.3. Emprego da Mediana • Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. • Quando há valores extremos que afetam de maneira acentuada a média aritmética. • Quando a variável em estudo é salário. EXERCÍCIOS: Série Aula: 1) Calcule a mediana da sequência: a) X: 2, 5, 8, 10, 12, 15, 8, 5, 12. b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8. 2) Calcule a mediana da distribuição: xi Fi 2 5 4 20 5 32 6 40 8 2 3) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o quadro abaixo. Determine o valor mediano da série. i Consumo por nota (R$) Nº de notas 1 0 |––– 50,00 10 2 50,00 |––– 100,00 28 3 100,00 |––– 150,00 12 4 150,00 |––– 200,00 2 5 200,00 |––– 250,00 1 6 250,00 |––– 300,00 1 6.3. Moda (Mo) É o valor que ocorre com maior freqüência em uma série de valores. Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. 6.3.1. Dados não-agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal. E s t a t í s t i c a A p l i c a d a 6.3.2. Dados agrupados 6.3.2.1. Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Qual a temperatura mais comum medida no mês abaixo: Temperatura (ºC) Fi 0 3 1 9 2 12 3 6 Σ = 30 Na distribuição acima a freqüência máxima é 12, correspondente ao valor 2 da variável. Logo, a temperatura mais comum é 2 ºC. 6.3.2.2. Com intervalos de classe A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. 2 LiLs Mo += onde: Li = é o limite inferior da classe modal. Ls = é o limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo. i Estaturas (cm) Fi 1 50 |–– 54 4 2 54 |–– 58 9 3 58 |–– 62 11 4 62 |–– 66 8 5 66 |–– 70 5 6 70 |–– 74 3 Σ = 40 Temos que a classe modal é i = 3. Como: 60 2 5862 2 LiLs Mo =+=+= Logo: Mo = 60 cm Para determinar a moda de uma variável contínua (com intervalos de classe), podemos optar por vários processos. Daremos destaque para a moda de Pearson, a moda de King e a moda de Czuber. 1º Processo: Moda de Pearson Segundo Pearson, a moda de uma variável contínua pode ser obtida através do valor da média e da mediana: E s t a t í s t i c a A p l i c a d a x2Md3Mo −= 2º Processo: Moda de King King levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência absoluta da classe posterior à classe modal. h FF F LMo postant post i ⋅+ += onde: Li = limite inferior da classe modal. Fpost = freqüência absoluta da classe posterior à classe modal. Fant = freqüência absoluta da classe anterior à classe modal. h = amplitude do intervalo de classe. 3º Processo: Moda de Czuber Czuber levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência absoluta da classe posterior, além da freqüência absoluta da classe modal. h )FF(F2 FF LMo postanti anti i ⋅+− − += onde: Li = limite inferior da classe modal. Fi = freqüência absoluta da classe modal. Fpost = freqüência absoluta da classe posterior à classe modal. Fant = freqüência absoluta da classe anterior à classe modal. h = amplitude do intervalo de classe. Comentários: A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana da distribuição, a fórmula de Pearson é a mais trabalhosa. A fórmula de King é a mais simples delas, mas não é a mais precisa. A fórmula de Czuberé mais precisa que a fórmula de King, pois leva também em consideração a freqüência da classe modal. Normalmente o processo mais confiável é o valor de Czuber. EXERCÍCIOS: Série Aula: 1) Calcule a moda das séries abaixo: a) X: 2, 3, 5, 4, 5, 2, 5, 7 b) Y: 4, 12, 5, 9, 12, 4, 3 c) Z: 7, 7, 7, 7 7 d) J: 4, 5, 6, 6, 6, 7, 8, 8, 8, 9, 10, 10, 10, 11 e) T: 2, 5, 9, 8, 10, 12 2) Calcule a moda da distribuição: xi Fi 2 1 3 7 4 2 E s t a t í s t i c a A p l i c a d a 5 2 3) Calcule a moda de Czuber para a distribuição representativa dos salários de 25 funcionários de uma empresa. i Salários (R$) Nº de funcionários 1 1.000,00 |––– 1.200,00 2 2 1.200,00 |––– 1.400,00 6 3 1.400,00 |––– 1.600,00 10 4 1.600,00 |––– 1.800,00 5 5 1.800,00 |––– 2.000,00 2 6.4. Utilização das Medidas de Tendência Central Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente precisamos de apenas uma das medidas para caracterizar o centro da série. Surge, então, a questão: qual medida deve ser utilizada? A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. Quando todos os dados de uma série são iguais, a média, a mediana e a moda coincidirão com este valor e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática. Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação ao valor da medida não serão bem representados por ela. Assim: - Devemos optar pela média, quando houver forte concentração de dados na área central da série; - Devemos optar pela mediana, quando houver forte concentração de dados no início ou no final da série; e - Devemos optar pela moda apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da série. EXERCÍCIOS: Série Aula: 1) Uma loja vende cinco produtos básicos, A, B, C, D e E. O lucro por unidade cormecializada destes produtos vale respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00 e R$ 5.000,00. A loja vendeu em determinado mês 20, 30, 20, 10 e 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja? 2) Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada, 500 caixa de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que sá permite passagens a caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no caminhão? E s t a t í s t i c a A p l i c a d a 3) Num quartel, constatou-se que o peso médio de 40 soldados era de 69 quilos. Posteriormente, verificou-se que a balança estava desregulada, ocasionando um peso indicado superior em 15 gramas ao peso verdadeiro. Qual era a média verdadeira dos pesos dos soldados? 4) Calcule o número médio de acidentes por dia em uma determinada esquina. Nº de acidentes por dia: xi Nº de dias Fi 0 30 1 5 2 3 3 1 4 1 Série Casa: 1) Considerando os conjuntos de dados: I. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 II. 20, 9, 7, 2, 12, 7, 20, 15, 7 III. 51,6; 48,7; 50,3; 49,5; 48,9 IV. 15, 18, 20, 13, 10, 16, 14 Calcule: a) a média aritmética b) a mediana c) a moda 2) Os salários-hora de cinco funcionários de uma companhia são: R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00; R$ 88,00 Determine: a) a média dos salários-hora b) o salário-hora mediano 3) As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) a nota média b) a nota mediana c) a nota modal 4) Considerando a distribuição abaixo: xi 3 4 5 6 7 8 Fi 4 8 11 10 8 3 Calcule: a) a média b) a mediana c) a moda 5) Em uma das classes de 50 alunos, as notas obtidas formaram a seguinte distribuição: Notas 2 3 4 5 6 7 8 9 10 Nº de Alunos 1 3 6 10 13 8 5 3 1 Calcule: E s t a t í s t i c a A p l i c a d a a) a nota média b) a nota mediana c) a nota modal 6) Calcule a média, a mediana e a moda das distribuições de freqüência abaixo: I. i Notas Fi 1 0 |–– 2 5 2 2 |–– 4 8 3 4 |–– 6 14 4 6 |–– 8 10 5 8 |–– 10 7 Σ = 44 II. i Estaturas (cm) Fi 1 150 |–– 158 5 2 158 |–– 166 12 3 166 |–– 174 18 4 174 |–– 182 27 5 182 |–– 190 8 Σ = 70 III. i Salários (R$) Fi 1 500 |–– 700 18 2 700 |–– 900 31 3 900 |–– 1.100 15 4 1.100 |–– 1.300 3 5 1.300 |–– 1.500 1 6 1.500 |–– 1.700 1 7 1.700 |–– 1.900 1 Σ = 70 IV. i Pesos (kg) Fi 1 145 |–– 151 10 2 151 |–– 157 9 3 157 |–– 163 8 4 163 |–– 169 6 5 169 |–– 175 3 6 175 |–– 181 3 7 181 |–– 187 1 Σ = 40 7) Calcule a idade média e a idade mediana dos alunos de uma classe de primeiro ano de determinada Faculdade, em anos. Idade (anos) xi Nº de alunos Fi 17 3 18 18 19 17 20 8 21 4 8) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule a salário médio destes funcionários. i Salário (R$) Nº de funcionários Fi 1 400,00 |––– 500,00 12 2 500,00 |––– 600,00 15 3 600,00 |––– 700,00 8 4 700,00 |––– 800,00 3 5 800,00 |––– 900,00 1 6 900,00 |––– 1.000,00 1 9) Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados de uma empresa. i Salário (R$) Nº de funcionários Fi 1 1.000,00 |––– 1.200,00 2 2 1.200,00 |––– 1.400,00 6 3 1.400,00 |––– 1.600,00 10 4 1.600,00 |––– 1.800,00 5 5 1.800,00 |––– 2.000,00 2 10) Calcule a moda de Czuber para a distribuição de valores de 54 notas fiscais, emitidas na mesma dada, selecionadas em uma loja de departamentos: i Consumo por nota (R$) Nº de notas 1 0 |––– 50,00 10 2 50,00 |––– 100,00 28 3 100,00 |––– 150,00 12 4 150,00 |––– 200,00 2 5 200,00 |––– 250,00 1 6 250,00 |––– 300,00 1 11) Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova de matemática: i Notas Nº de alunos 1 0 |––– 2 5 2 2 |––– 4 20 3 4 |––– 6 12 4 6 |––– 8 20 5 8 |––– 10 3 REFERÊNCIAS - BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. Ed. Saraiva. 5ª edição. 2004. - CRESPO, A. A. Estatística Fácil. Ed. Saraiva. 16ª edição. 1998. - DOWNING, D., CLARK, J. Estatística Aplicada. Ed. Saraiva. 2ª edição. 2005. - FONSECA, J. S., MARTINS, G. A. Curso de Estatística. Ed. Atlas. 6ª edição. 1996. - LAPPONI, J. C. Estatírtico Usando Excel. Ed. Lapponi. 2000. - MARTINS, G. A. Estatística Geral e Aplicada. Ed. Atlas. 2ª edição. 2002. - MARTINS, G. A., DONAIRE, D. Princípios de Estatística. Ed. Atlas. 4ª edição. 1995. - NAZARETH, H. Curso Básico de Estatística. Ed. Ática. 7ª edição. 1995. - PEREIRA, W., TANAKA, O. K. Estatística – Conceitos Básicos. Ed. Makron Books. - SILVA, E. M., GONÇALVES, V., MUROLO, A. C. Estatística para os cursos de: Economia, Administração e Ciências Contábeis. Ed. Atlas. 3ª edição. 1999. - TOLEDO, G. L., OVALLE, I. I. Estatística Básica. Ed. Atlas. 2ª edição. 1995. SUMÁRIO 1. INTRODUÇÃO À ESTATÍSTICA.....................................................................................................................................3 1.1. ENTENDENDO A IMPORTÂNCIA DA ESTATÍSTICA..................................................................................................................3 1.2. OBJETO DA ESTATÍSTICA................................................................................................................................................4 1.2. MÉTODO ESTATÍSTICO...................................................................................................................................................4 1.2.1. O Método Científico..........................................................................................................................................41.2.2. O Método Experimental.....................................................................................................................................4 1.2.3. O Método Estatístico.........................................................................................................................................4 1.3. A ESTATÍSTICA.............................................................................................................................................................5 1.4. FASES DO MÉTODO ESTATÍSTICO.....................................................................................................................................5 1.4.1. Coleta de Dados................................................................................................................................................5 1.4.2. Apuração dos Dados.........................................................................................................................................6 1.4.3. Apresentação dos Dados...................................................................................................................................6 1.4.4. Análise dos Resultados......................................................................................................................................6 1.5. ABUSOS DA ESTATÍSTICA................................................................................................................................................6 1.5.1. Más Amostras....................................................................................................................................................6 1.5.2. Pequenas Amostras...........................................................................................................................................6 1.5.3. Estimativas por Suposição.................................................................................................................................6 1.5.4. Porcentagens Distorcidas:................................................................................................................................6 1.5.5. Perguntas Tendenciosas....................................................................................................................................7 1.5.6. Pressão do Pesquisador....................................................................................................................................7 2. POPULAÇÃO E AMOSTRA...............................................................................................................................................8 2.1. VARIÁVEIS...................................................................................................................................................................8 2.2. POPULAÇÃO E AMOSTRA................................................................................................................................................8 2.2.1. Amostragem Aleatória Simples..........................................................................................................................9 2.2.2. Amostragem Sistemática....................................................................................................................................9 2.2.3. Amostragem Estratificada Proporcional...........................................................................................................9 3. SÉRIES ESTATÍSTICAS...................................................................................................................................................13 3.1. TABELAS....................................................................................................................................................................13 3.2. SÉRIES ESTATÍSTICAS...................................................................................................................................................13 3.2.1. Séries Históricas, Cronológicas ou Temporais................................................................................................13 3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização........................................................................14 3.2.3. Séries Específicas ou Categórica.....................................................................................................................14 3.2.4. Séries Conjugadas – Tabela de Dupla Entrada...............................................................................................14 3.3. DADOS ABSOLUTOS E DADOS RELATIVOS.......................................................................................................................15 3.3.1. As Porcentagens..............................................................................................................................................15 3.3.2. Os Índices........................................................................................................................................................16 3.3.3. Os Coeficientes................................................................................................................................................17 3.3.4. As Taxas..........................................................................................................................................................17 4. DISTRIBUIÇÃO DE FREQUÊNCIA...............................................................................................................................21 4.1. TABELA PRIMITIVA / ROL.............................................................................................................................................21 4.2. DISTRIBUIÇÃO DE FREQÜÊNCIA......................................................................................................................................21 4.3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA.........................................................................................................22 4.3.1. Classe..............................................................................................................................................................22 4.3.2. Limites de Classe.............................................................................................................................................22 4.3.3. Amplitude de um Intervalo de Classe...............................................................................................................22 4.3.4. Amplitude Total da Distribuição.....................................................................................................................22 4.3.5. Ponto Médio de uma Classe............................................................................................................................22 4.4. DETERMINAÇÃO DO NÚMERO DE CLASSES.......................................................................................................................22 4.5. TIPOS DE FREQÜÊNCIAS................................................................................................................................................23 4.6. DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE.............................................................................................23 5. GRÁFICOS ESTATÍSTICOS............................................................................................................................................27 5.1. REPRESENTAÇÃO GRÁFICA............................................................................................................................................27 5.1.1. Gráfico de Linha..............................................................................................................................................27 5.1.2. Gráfico de Colunas ou de Barras....................................................................................................................285.1.3. Gráfico de Colunas ou de Barras Múltiplas....................................................................................................29 5.1.4. Gráfico de Setores...........................................................................................................................................29 5.2. REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQUÊNCIA............................................................................................30 5.2.1. Histograma......................................................................................................................................................30 5.2.2. Polígono de Frequência..................................................................................................................................31 5.2.3. Ogiva...............................................................................................................................................................31 6. MEDIDAS DE POSIÇÃO: MEDIDAS DE TENDÊNCIA CENTRAL........................................................................40 6.1. MÉDIA ARITMÉTICA ().................................................................................................................................................40 6.1.1. Dados não-agupados.......................................................................................................................................40 6.1.2. Desvio em relação à média..............................................................................................................................40 6.1.3. Propriedades da média....................................................................................................................................41 6.1.4. Dados agrupados.............................................................................................................................................41 6.1.4.1. Sem intervalos de classe..................................................................................................................................................41 6.1.4.2. Com intervalos de classe.................................................................................................................................................42 6.1.5. Emprego da média...........................................................................................................................................43 6.2. MEDIANA (MD)..........................................................................................................................................................44 6.2.1. Dados não-agrupados.....................................................................................................................................44 6.2.2. Dados agrupados.............................................................................................................................................45 6.2.2.1. Sem intervalos de classe..................................................................................................................................................45 6.2.2.2. Com intervalos de classe.................................................................................................................................................46 6.2.3. Emprego da Mediana......................................................................................................................................47 6.3. MODA (MO)..............................................................................................................................................................47 6.3.1. Dados não-agrupados.....................................................................................................................................47 6.3.2. Dados agrupados.............................................................................................................................................48 6.3.2.1. Sem intervalos de classe..................................................................................................................................................48 6.3.2.2. Com intervalos de classe.................................................................................................................................................48 6.4. UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................50 REFERÊNCIAS.......................................................................................................................................................................54 ESTATÍSTICA APLICADAESTATÍSTICA APLICADA Tecnico em Segurança do Trabalho Prof. Rosiel Sousa do Nascimento Bacabal (MA) agosto 2012 1. Introdução à Estatística 1.1. Entendendo a importância da Estatística 1.2. Objeto da Estatística 1.2. Método Estatístico 1.2.1. O Método Científico 1.2.2. O Método Experimental 1.2.3. O Método Estatístico 1.3. A Estatística 1.4. Fases do Método Estatístico 1.4.1. Coleta de Dados 1.4.2. Apuração dos Dados 1.4.3. Apresentação dos Dados 1.4.4. Análise dos Resultados 1.5. Abusos da Estatística 1.5.1. Más Amostras 1.5.2. Pequenas Amostras 1.5.3. Estimativas por Suposição 1.5.4. Porcentagens Distorcidas: 1.5.5. Perguntas Tendenciosas 1.5.6. Pressão do Pesquisador 2. População e Amostra 2.1. Variáveis 2.2. População e Amostra 2.2.1. Amostragem Aleatória Simples 2.2.2. Amostragem Sistemática 2.2.3. Amostragem Estratificada Proporcional 3. Séries Estatísticas 3.1. Tabelas 3.2. Séries Estatísticas 3.2.1. Séries Históricas, Cronológicas ou Temporais 3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização 3.2.3. Séries Específicas ou Categórica 3.2.4. Séries Conjugadas – Tabela de Dupla Entrada 3.3. Dados Absolutos e Dados Relativos 3.3.1. As Porcentagens 3.3.2. Os Índices 3.3.3. Os Coeficientes 3.3.4. As Taxas 4. Distribuição de Frequência 4.1. Tabela Primitiva / Rol 4.2. Distribuição de Freqüência 4.3. Elementos de uma Distribuição de Freqüência 4.3.1. Classe 4.3.2. Limites de Classe 4.3.3. Amplitude de um Intervalo de Classe 4.3.4. Amplitude Total da Distribuição 4.3.5. Ponto Médio de uma Classe 4.4. Determinação do número de Classes 4.5. Tipos de Freqüências 4.6. Distribuição de Freqüência sem Intervalos de Classe 5. Gráficos Estatísticos 5.1. Representação Gráfica 5.1.1. Gráfico de Linha 5.1.2. Gráfico de Colunas ou de Barras 5.1.3. Gráfico de Colunas ou de Barras Múltiplas 5.1.4. Gráfico de Setores 5.2. Representação Gráfica de Distribuição de Frequência 5.2.1. Histograma 5.2.2. Polígono de Frequência 5.2.3. Ogiva 6. Medidas de Posição: Medidas de Tendência Central 6.1. Média Aritmética () 6.1.1. Dados não-agupados 6.1.2. Desvio em relação à média 6.1.3. Propriedades da média 6.1.4. Dados agrupados 6.1.4.1. Sem intervalos de classe 6.1.4.2. Com intervalos de classe 6.1.5. Emprego da média 6.2. Mediana (Md) 6.2.1. Dados não-agrupados 6.2.2. Dados agrupados 6.2.2.1. Sem intervalos de classe 6.2.2.2. Com intervalos de classe 6.2.3. Emprego da Mediana 6.3. Moda (Mo) 6.3.1. Dados não-agrupados 6.3.2. Dados agrupados 6.3.2.1. Sem intervalos de classe 6.3.2.2. Com intervalos de classe 6.4. Utilização das Medidas de Tendência Central REFERÊNCIAS