Prévia do material em texto
Estatística Estatística é o ramo da matemática que permite, de forma organizada, recolher dados sobre uma população, analisá-los e tirar conclusões. O uso da pesquisa é bastante comum nas várias atividades humanas. População e Amostra A estatística trabalha com dois conjuntos de dados: a população e a amostra. Apesar de a estatística se preocupar em obter informações sobre a população, dificilmente ela estuda todos os componentes da mesma (censo). População – Conjuntos de elementos para os quais se deseja investigar uma ou mais características. Pode ser formada por pessoas, domicílios, peças de produção, cobaias, etc. Pode ser finita ou infinita. Finita – possui um número determinado de elementos exemplo: número de alunos da classe. Infinita – um grande número de elementos exemplo: a população da cidade de São Paulo. Amostra – é um subconjunto da população, ou seja, uma parte dela. Quando há um número muito grande de elementos, fica difícil a observação dos aspectos a serem estudados de cada um dos elementos devido ao alto custo, ao intenso trabalho e ao tempo despendido para levar a cabo uma exaustiva observação de todos os elementos da população, nesse caso fazemos a seleção de uma amostra (cerca de 10% da população a ser estudada), e através dessa observação estaremos aptos a analisar os resultados da mesma forma que se estudássemos toda a população. Variável É aquilo que está sendo pesquisado na amostra ou na população. As variáveis podem ser qualitativa – o que se pesquisa é um atributo como, por exemplo, a cor do cabelo – ou quantitativa, por exemplo, o número de filhos de uma determinada amostra. Tipos de variáveis Qualitativa - os valores representam atributos ou qualidades, mas não tem uma relação de ordem entre eles, ou ainda valores representam atributos ou qualidades mas incluem uma relação de ordem. Ex: sexo, grupo sanguíneo, raça, classe social, grau de instrução, etc. Quantitativa - valores são medidos numa escala métrica e onde todos os valores fraccionários são possíveis, ou ainda, valores medidos numa escala métrica e porem só admitem valores inteiros. Ex: altura, peso, temperatura, número de filhos, número de alunos, Frequência Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo. Distribuição de Frequência É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Composição de uma tabela: Título – conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?- Quando?- Onde?- localizado no topo da tabela. Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas; Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo; Profº Nerilton Vidal de Almeida 3° Ano EEB Almirante Boiteux Página 1 de 6 Fonte (Rodapé) – referência de onde se obteve os dados, colocado, de preferência, no rodapé. Considere o próximo exemplo: Qual das cidades tem, comparativamente, maior número de alunos em cada grau? Distribuição de Frequência CLASSE Em alguns casos, os dados coletados são muito variados e a tabela ficaria com muitas linhas, conforme o exemplo a seguir: Dessa forma, reorganizamos os dados em classes, usando o símbolo ⊢. Para saber o número mais adequado de classes, faz-se a raiz quadrada do número total de objetos pesquisados, no caso os alunos. Então 𝑘 = √𝑛, ou seja, 𝑘 = √22 ≅ 4,7 ≅ 5 classes. Para saber a amplitude de cada classe, dividimos a amplitude total pelo número de classes, assim temos: At = 38 – 18 = 20 Logo a amplitude de cada classe será: AC = 20 / 5 = 4. Depois, manualmente ou com o auxílio de software, conta-se a frequência dos dados em cada classe. Outras definições relevantes: LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe (Li) e o maior número, limite superior de classe (LS). Ex: Para a terceira classe temos os seguintes dados: 26 |--- 30, para este caso os limites serão: Li = 26 e LS = 30. ATENÇÃO: O símbolo |--- representa um intervalo fechado à esquerda e aberto à direita. O dado 30 do ROL não pertence a classe 3 e sim a classe 4 representada por 30 |--- 34. AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por AC = LS - Li. Ex: na tabela anterior AC = 30 – 26 = 4. Obs: Na distribuição de frequência com classe a AC será igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. ATD = LD(max) - LD(min). Ex: na tabela anterior ATD = 38 - 18= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde ATA = LA(max) – LA(min). Em nosso exemplo ATA = 37 - 18 = 19. Obs: ATD sempre será maior que ATA. PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. . Profº Nerilton Vidal de Almeida 3° Ano EEB Almirante Boiteux Página 2 de 6 Ex: em 26 |--- 30 o ponto médio x3 = (30+26)/2 = 28, ou seja x3=( l3 + L3 )/2. Exercícios 1 – Classifique as variáveis (qualitativa ou quantitativa): a) Vitamina (A, B1, B2, B6, B12) b) Quantidade de caloria na batata frita. c) Classificação de uma lesão (lesão fatal; severa; moderada; pequena). d) Paridade (primeira gestação, segunda gestação, terceira ...) e) Número de nascidos vivos em certo hospital em junho/99 2 – Em certa pesquisa sobre a idade de um grupo de consumidores foram obtidos os seguintes dados: 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51. Pede-se: a) Monte o ROL dos dados coletados. b) Construa uma tabela com os dados coletados. c) Construa uma tabela com os dados em classes. d) Determine a amplitude total da amostra, amplitude de cada classe e a amplitude total da distribuição. 3 – Os dados a seguir referem-se ao tempo, em horas, que 80 pacientes hospitalizados dormiram durante a administração de certo anestésico: a) Encontre a frequência relativa de cada classe. b) Determine a amplitude de cada classe e a total. c) Determine o ponto médio de cada classe. 4 – (ENEM – 2021) Uma rede de hamburgueria tem três franquias em cidades distintas. Visando incluir um novo tipo de lanche no cardápio, o gerente de marketing da rede sugeriu que fossem colocados à venda cinco novos tipos de lanche, em edições especiais. Os lanches foram oferecidos pelo mesmo período de tempo em todos os franqueados. O tipo que apresentasse a maior média por franquia seria incluído definitivamente no cardápio. Terminado o período de experiência, a gerência recebeu um relatório descrevendo as quantidades vendidas, em unidade, de cada um dos cinco tipos de lanche nas três franquias. Com base nessas informações, a gerência decidiu incluir no cardápio o lanche de tipo: a) I b) II c) III d) IV e) V 5 – (ENEM – 2021) A demografia médica é o estudoda população de médicos no Brasil nos aspectos quantitativo e qualitativo, sendo um dos seus objetivos fazer projeções sobre a necessidade da formação de novos médicos. Um desses estudos gerou um conjunto de dados que aborda a evolução do número de médicos e da população brasileira por várias décadas. O quadro apresenta parte desses dados. Segundo uma projeção estatística, a variação do número de médicos e o da população brasileira de 2010 para 2020 será a média entre a variação de 1990 para 2000 e a de 2000 para 2010. Com o resultado dessa projeção, determina-se o número de médicos por mil habitantes no ano de 2020. O número, com duas casas na parte decimal, mais próximo do número de médicos por mil habitantes no ano de 2020 seria de a) 0,17 b) 0,49 c) 1,71 d) 2,06 e) 3,32 Profº Nerilton Vidal de Almeida 3° Ano EEB Almirante Boiteux Página 3 de 6 Gráficos A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há uma única maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados quando da elaboração de um gráfico. Eis os principais tipos de gráficos: 1. Gráfico em Colunas 2. Gráfico em Barras Quando as legendas não são breves usa- se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica É semelhante ao gráfico em colunas, porém os retângulos são dispostos horizontalmente. Eis uma configuração: 3. Gráficos em Setores É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado principalmente quando se pretende comparar cada valor da série como o total. Para construí-lo, divide–se o círculo em setores, cujas áreas serão proporcionadas aos valores da série. Essa divisão poderá ser obtida pela solução da regra de três. Total -------- 360° Parte ----------- x° Exemplo: Obs: As séries temporais geralmente não são representadas por este tipo de gráfico. Profº Nerilton Vidal de Almeida 3° Ano EEB Almirante Boiteux Página 4 de 6 4. Gráficos em Curvas São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desses fenômenos é denominada de área de excesso. 5. Histograma Para dados agrupados em classes. Exercícios 1 - O gráfico abaixo representa as vendas de aparelhos celulares em uma loja no primeiro semestre do ano. Essa loja tinha uma meta de vender, no primeiro semestre, 250 aparelhos celulares. Pode-se afirmar que: a) a meta foi atingida. b) a meta foi superada. c) faltaram menos de 50 unidades para se alcançar a meta. d) as vendas ficaram 75 unidades abaixo da meta. e) as vendas aumentaram mês a mês. 2 - Uma rede de supermercados resolveu fazer uma pesquisa para saber qual horário as pessoas mais gostavam de ir ao supermercado. Foram entrevistadas 2000 pessoas e o resultado está no gráfico abaixo. Durante qual horário a maioria das pessoas entrevistadas preferem ir ao supermercado? a) 8h às 12h. b) 12h às 16h. c) 16h às 20h. d) 20h às 23h. e) 23h às 24h. 3 - O gráfico abaixo mostra o número de desempregados no mundo, em milhões de pessoas, no período de 2000 a 2005. Profº Nerilton Vidal de Almeida 3° Ano EEB Almirante Boiteux Página 5 de 6 Com base nesse gráfico, observa-se que a quantidade de pessoas sem trabalho no mundo a) permaneceu a mesma entre 2000 e 2001. b) permanece a mesma desde o ano de 2002. c) aumentou de 8,5 milhões entre 2001 e 2002. d) aumentou de 19 milhões entre 2001 e 2003. e) diminuiu entre 2000 e 2002. 4 - (Enem 2011) O gráfico representa a relação entre o tamanho e a totalidade dos imóveis rurais no Brasil. Que característica da estrutura fundiária brasileira está evidente no gráfico apresentado? a) A concentração de terras nas mãos de poucos b) A existência de poucas terras agricultáveis c) O domínio territorial dos minifúndios d) A primazia da agricultura familiar e) A debilidade dos plantations modernos 5 - (ENEM 2011) Uma enquete, realizada em março de 2010, perguntava aos internautas se eles acreditavam que as atividades humanas provocam o aquecimento global. Eram três alternativas possíveis e 279 internautas responderam à enquete, como mostra o gráfico. Analisando os dados do gráfico, quantos internautas responderam “NÃO” à enquete? a) menos de 23 b) mais de 23 e menos de 25 c) mais de 50 e menos de 75 d) mais de 100 e menos de 190 e) mais de 200 6 - (ENEM 2011) O termo agronegócios não se refere apenas à agricultura e à pecuária, pois as atividades ligadas a essa produção incluem fornecedores de equipamentos, serviços para a zona rural, industrialização e comercialização dos produtos. O gráfico seguinte mostra a participação percentual do agronegócio no PIB brasileiro Esse gráfico foi usado em uma palestra na qual o orador ressaltou uma queda da participação do agronegócio no PIB brasileiro e a posterior recuperação dessa participação, em termos percentuais. Segundo o gráfico, o período de queda ocorreu entre os anos de: a) 1998 e 2001 b) 2001 e 2003 c) 2003 e 2006 d) 2003 e 2007 e) 2003 e 2008