Prévia do material em texto
Versão Condensada ESTATÍSTICA Introdução à estatística 2 A L F A C O N Sumário Introdução à estatística �������������������������������������������������������������������������������������������������3 1� Conceito������������������������������������������������������������������������������������������������������������������������������������������������������������������� 3 2� Ramos da estatística ����������������������������������������������������������������������������������������������������������������������������������������������� 4 2.1 Estatística descritiva .......................................................................................................................................................... 4 2.2 Estatística inferencial .........................................................................................................................................................5 3� Objeto de estudo ����������������������������������������������������������������������������������������������������������������������������������������������������� 6 3.1 Elementos avaliados: população .......................................................................................................................................6 3.2 Característica avaliada: variável .......................................................................................................................................9 4� Exemplos ���������������������������������������������������������������������������������������������������������������������������������������������������������������� 11 Introdução à estatística 3 A L F A C O N Introdução à estatística 1. Conceito A Estatística compreende uma ciência que utiliza um conjunto de métodos científicos, especialmente apropriados, com a finalidade de: Dessa forma, o principal objetivo da Estatística é o estudo e a compreensão de uma realidade específica (de fenômenos que ocorrem no mundo real, do cotidiano) e, com isso, é possível extrair informações úteis para investigação e influenciar diretamente na tomada de decisões. Portanto, de modo geral, a Estatística é uma ciência especializada em transformar dados brutos, coletados de qualquer campo de estudo, em informação. Em adição, combinada com outras ciências, é capaz de gerar conhecimento, inteli- gência e novas tecnologias. A Estatística utiliza, principalmente, a Matemática aplicada para fazer a transformação dos dados em conhecimento, portanto, entenda que a utilização da Matemática é apenas uma das ferramentas usadas na Estatística para obter esse resultado. É muito importante que o aluno compreenda, primeiramente, a essência da disciplina e veja todas as dedu- ções e cálculos matemáticos apenas como instrumentos para compreender os fenômenos que ocorrem no mundo real. Introdução à estatística 4 A L F A C O N 2. Ramos da estatística Antes de começar o estudo direcionado aos tópicos do edital de Estatística, é interessante compreender alguns con- ceitos e classificações que serão utilizados durante todo o raciocínio desenvolvido pela disciplina. Inicialmente, deve-se entender que a Estatística é dividida em dois grandes campos conforme o objetivo das análises utilizadas: 2.1 Estatística descritiva A Estatística Descritiva consiste em análises que resumem concisamente um conjunto de dados, sintetizam em poucas informações, organizam em tabelas, e ilustram por meio de gráficos. Esse campo da Estatística também é aplicado para efetuar análises exploratórias sobre um conjunto de dados, pois é possível compreender uma tendência genérica dos resultados. Com uso de medidas descritivas, gráficos e tabelas, pode ser observado um comportamento padrão, intuitivo e representativo do fenômeno em estudo. Por exemplo, com o desempenho médio de uma determinada característica obtida a partir de um conjunto de dados brutos, é possível levantar hipóteses sobre o real desempenho desse objeto de estudo, ou até mesmo, se sua perfor- mance pode ser superior a um outro fenômeno estudado. Um conjunto de dados brutos pode ser descritos a partir de medidas como média e desvio-padrão, ou organizados em tabela de frequência. Exemplo: As informações geradas pela Estatística Descritiva, no exemplo acima, resumem o valor da tendência central dos dados pela média, uma ideia do quanto os dados se dispersam pelo desvio-padrão, e a quantidade de repetições de cada observação pela tabela de frequência. Introdução à estatística 5 A L F A C O N A Estatística Descritiva somente é completa e autossuficiente quando é possível obter dados, com exatidão, de todos os elementos que compõem seu objeto de estudo (população). Nessa situação, apenas descrever o conjunto de dados já bastaria para obter conclusões sobre o fenômeno em estudo. No entanto, a Estatística Descritiva, a partir de uma amostra (informações incompletas), por si só, apenas descreve os dados dessa amostra e não permite inferir sobra toda a população. Seria uma afirmação equivocada comparar duas médias estimadas simplesmente pela magnitude do valor. Para isso, é necessário o uso de métodos da Estatística Inferencial. 2.2 Estatística inferencial A Estatística Inferencial utiliza informações incompletas para tomar decisões, tirar conclusões satisfatórias e genera- lizar informações sobre o fenômeno em estudo. Para obter inferências fidedignas do objeto de estudo, é necessário o conhecimento aplicado da teoria da probabilidade, de uma amostragem representativa e da Estatística Descritiva para explorar hipóteses. Esses três tópicos, estudados na disciplina de Estatística, podem ser compreendidos como alicerces necessários para aplicação eficiente da Estatística Inferencial. As principais técnicas empregadas na Estatística Inferencial são a estimação pontual, a estimação intervalar e o teste de hipóteses. O uso da Estatística Inferencial é valioso quando não é conveniente ou possível examinar todos os ele- mentos de uma população. Quando se obtêm informações a partir de uma amostra, é necessário entender que essas informações foram obtidas por um subconjunto da população e que possuem uma probabilidade de corresponder coerentemente ao fenômeno estudado. Por isso, essas informações estão sujeitas a erros e imprecisão, e, desse modo, cabe à Estatística Inferencial quantificar essas incertezas e avaliar a credibilidade da informação. Exemplo: Introdução à estatística 6 A L F A C O N O valor da média estimada por um conjunto de dados de uma amostra é composto por um possível erro de estimativa. Baseado nisso, calcula-se um intervalo de confiança em que o valor estimado pode oscilar, isto é, a média é 12,8, mas pode oscilar entre 10,33 até 15,27� De forma bem genérica, essa é a ideia da Estatística Inferencial que trabalha com informações incompletas e usa Matemática aplicada para generalizar a informação obtida. 3. Objeto de estudo O objeto de estudo na disciplina de Estatística compreende a um fenômeno do mundo real, uma realidade específica. Em outras palavras, tudo aquilo que ocorre ao redor do homem e que ele tem interesse de compreender suas carac- terísticas e seus comportamentos. Desse modo, o objeto de estudo pode ser: fenômenos biológicos e naturais; comportamentos sociais; aspectos políti- cos; avaliação de equipamentos; entre outros. Praticamente, o objeto de estudo da disciplina é um “coringa”, ou seja, a Estatística pode ser aplicada em qualquer fenômeno/realidade em que é possível extrair dados. O fenômeno estudado em cada análise estatística é caracterizado basicamente por dois componentes essenciais: os elementos que serão estudados (População) e a característica que será avaliada (Variável). Segue a ilustração: Dessa forma, em toda questão de Estatística, o aluno deve primeiramente analisar o cenário apresentado em cada questão. Com isso, deve ser identificado quem são os elementos avaliados ao qual pretende-se fazer inferências e o que será avaliado em cada elemento (qual característica,atributo será observado, contabilizado ou mensurado). Essa é uma leitura essencial para iniciar a resolução de uma questão de Estatística. 3.1 Elementos avaliados: população Quando se refere aos elementos avaliados, deve-se ter o conhecimento pleno de quem corresponde ao conjunto total de elementos do fenômeno estudado. Isso porque todas as inferências obtidas na Estatística serão válidas para todo esse conjunto, portanto não deve haver conclusões incoerentes a população de estudo. Além disso, é importante entender que o termo elementos corresponde a todas as unidades de avaliação de que serão extraídos dados. Assim, os elementos podem ser compostos por indivíduos, objetos ou eventos, dependendo do fenômeno estudado. • População x Amostra Durante a explicação anterior, foram abordados temas como população e amostra. Dessa forma, agora, iremos com- preender a essência desses dois conceitos. Sempre que a Estatística é aplicada para estudar um fenômeno qualquer, Introdução à estatística 7 A L F A C O N é preciso saber quem são os elementos que compõem o objeto de estudo, em cada situação particular. O conjunto de todos os elementos representa o nosso universo estatístico, também denominado de população. Então, população corresponde ao conjunto de elementos sobre os quais se desejam obter dados de características que são comuns a todos. Portanto, população é todo o universo de um objeto de estudo de interesse. Entretanto, acontece que muitas vezes a população torna-se infinitamente grande e fica muito oneroso, impraticável, inviável, demorado demais avaliar todos os elementos. Nesse momento, uma alternativa interessante para estudar um fenômeno é avaliar parte dessa população e utilizar métodos, como a Estatística Inferencial, para generalizar as infor- mações dessa parte para toda população. Veja a ilustração a seguir: Conforme apresentado na ilustração, a fração de elementos retirada de uma população, para serem avaliados, corres- ponde a amostra. Desse modo, a amostra é um subconjunto de elementos da população que são coletados e analisados com objetivo de representar fidedignamente toda a população de estudo. Ao mesmo tempo, amostragem é a técnica de seleção de indivíduos da população para compor a amostra. Já a genera- lização consiste nas inferências obtidas a partir da análise de uma amostra (principal objetivo da Estatística Inferencial). • Censo x Amostragem A análise estatística mais valiosa será sempre obter dados sobre toda a população, o que denominamos de censo. Dessa forma, denomina-se Censo a coleta exaustiva de dados referente a todos os elementos que compõem a população, ou seja, quando se trata de informações completas da população em estudo. No entanto, sabe-se que, muitas vezes, não será possível efetuar um censo. Em contraponto, trabalha-se com o conjunto de dados proveniente da técnica de amostragem. Assim, a amostragem consiste na coleta de um conjunto de dados incompletos de uma população. Essa técnica deve seguir um método criterioso e adequado para que os dados extraí- dos representem o fenômeno de estudo presente na população. Mais à frente, teremos um tópico somente estudando sobre a amostragem e suas técnicas. Introdução à estatística 8 A L F A C O N • Parâmetro x Estimativa Quando coletamos dados referentes ao nosso objeto de estudo, é necessário compreender que as informações geradas (por exemplo, média, desvio-padrão, tamanho), a partir de uma população ou de uma amostra, possuem características diferentes e específicas. As informações obtidas de uma população, quando possível, são constantes que se referem ao verdadeiro valor do fenômeno estudado. Isso porque, se todos os elementos de um objeto de estudo forem analisados, será obtido um valor único e uma informação absoluta sobre o fenômeno. Portanto, definimos que as informações provenientes de uma população são parâmetros, ou seja, constantes, muitas vezes desconhecidas, de um valor representativo que permite modelar a realidade. Por outro lado, quando se obtêm valores provenientes da amostra, sabe-se que as informações geradas representam uma fração do fenômeno estudado e, portanto, são valores variáveis e aleatórios. Com isso, tem-se a ideia de que as informações obtidas da amostra são estimativas de um parâmetro ao qual se deseja conhecer. Então, denomina-se estimativa as informações provenientes de dados incompletos com objetivo de generalizar um parâmetro populacional. Assim, é possível esquematizar: Introdução à estatística 9 A L F A C O N Sobretudo, as principais informações estudadas – média, desvio-padrão, variância, tamanho e proporção – são simboli- zadas por letras gregas ou maiúsculas, quando se referem a parâmetros da população, e por letras do alfabeto comum ou minúsculas quando se referem a estimativas da amostra. Em síntese a todos esses conceitos abordados, pode ser aplicado o seguinte esquema conceitual: 3.2 Característica avaliada: variável Após identificar os elementos em que serão extraídos os dados, é preciso determinar qual característica/atributo será avaliada, o que denominamos na Estatística como variável. Logo, o termo variável é a atribuição dos valores correspon- dentes aos dados observados e sua respectiva representação do fenômeno estudado no mundo real, isto é, a natureza dos dados, a grandeza. Sendo assim, ao se identificar a variável analisada, deve-se compreender a natureza ou o tipo dessa variável, como os dados foram obtidos, sua unidade de medida, a distribuição da variável e qual é o objetivo, a informação, que pretende se obter com essa variável. Todas essas perguntas devem ser elucidadas na leitura de uma questão de Estatística, pois, com isso, obtém-se um panorama geral do contexto apresentado na questão e facilita absurdamente a sua resolução. Introdução à estatística 10 A L F A C O N Os dados extraídos são uma variável que pode assumir diversos valores de acordo com fenômeno em estudo. É impor- tante ressaltar que os dados em questão não são necessariamente numéricos, uma vez que podem dizer a respeito de atributos qualitativos observados na população. Portanto, quanto à natureza/tipo das variáveis, elas podem ser quali- tativas (nominais ou ordinais) ou quantitativas (discretas ou contínuas). Segue a ilustração: • Variáveis Qualitativas As variáveis de natureza qualitativa são representadas por dados que não tem informação numérica e não é possível efetuar cálculos matemáticos com os dados propriamente ditos. Dessa forma, os dados extraídos correspondem a cate- gorias, classes definidas, ou qualidades. Podem também ser denominadas por variáveis categóricas. Esta se subdivide em duas outras classificações: nominais e ordinais. ͫ Variáveis Qualitativas Nominais: São compostas por dados que representam qualidade, mas que não possuem nenhuma ordem ou hierarquia entre eles, apenas identificam as categoriais distintas. Exemplos: gênero (masculino e feminino), cor (azul, preto, amarelo etc.), país (Brasil, África do Sul, Japão etc.). Veja que não existe nenhuma ordenação ou relação hierárquica entre os valores que a variável qualitativa nominal pode assumir. ͫ Variáveis Qualitativas Ordinais: Em contrapartida, as variáveis ordinais são aquelas representadas por dados categóricos que possuem uma determi- nada ordenação ou hierarquia entre os valores que a variável pode assumir. Exemplos: classe de renda (baixa, média, alta), experiência profissional (novato, intermediário, veterano), grau de escolaridade (fundamental, médio, graduação, mestrado, doutorado). Nesse contexto, é possível estabelecer uma ordem em cada categoria como baixa, média e alta, ou como em novato, intermediário e veterano. • Variáveis Quantitativas As variáveis de natureza quantitativa são representadas por dados que possuem informação numérica e neles podem ser efetuados cálculos matemáticos. Dessa forma, os dados são basicamente representados por valores numéricos atribuídos, contabilizados ou mensurados. Estavariável se subdivide em duas classificações: discretas e contínuas. Introdução à estatística 11 A L F A C O N ͫ Variáveis Quantitativas Discretas São aquelas representadas por valores numéricos inteiros e definidos, não possuem um intervalo entre um valor e outro (não possuem valores decimais). Geralmente, essas variáveis correspondem a atribuição numérica dos eventos de um fenômeno específico (exemplo: atribuição de fracasso ou sucesso de uma operação {0,1}, atribuição de números para cada face de um dado {1, 2, 3, 4, 5 e 6} etc.), ou então representam a contagem de algum fenômeno (exemplo: número de filhos por família, registros de roubos por dia, ocorrências de homicídios por cidades, etc.). Convém observar que não é coerente quantificar valores não inteiros (decimais), afinal, não existe metade de um filho, ou meio homicídio, para esses fenômenos os resultados são taxativos: ou ocorrem ou não ocorrem. ͫ Variáveis Quantitativas Contínuas Contudo, as variáveis contínuas são aquelas representadas por valores numéricos que podem ser inteiros e decimais. Existe um intervalo infinito entre um valor e outro. Essas variáveis estão associadas a fenômenos que no mundo real são mensurados (medidos) por algum instrumento que o homem criou junto a uma convenção que o homem estabeleceu. Exemplos: peso, altura, tempo, temperatura, velocidade etc. Veja que existe um intervalo infinito entre 20 kg e 30 kg, por exemplo, que pode ser 21 kg; 20,5 kg; 20,01 kg; 20,0001 kg e assim infinitamente representado. O Quadro a seguir resume toda a classificação de variáveis e fornece exemplos: 4. Exemplos 1� A Polícia Federal fez um registro do valor diário (em R$ mil) apreendido de contrabando na região de fronteira do estado do Paraná - Brasil. O exemplo 1 apresenta uma situação em que a Polícia Federal (PF) tem o objetivo de estudar o fenômeno da ocorrência do crime de contrabando na região de fronteira do estado do Paraná – Brasil. Desse modo, a popu- lação de estudo é composta por todos os crimes de contrabando cometidos nessa região, e cada elemento avaliado foi um evento da ocorrência de contrabando. Entretanto, sabe-se que é muito difícil para a PF controlar e quantificar todos os contrabandos que ocorrem na fronteira do Paraná. Dessa forma, a PF trabalha com amostra de todos os registros de contrabando que foram detidos e apreendidos pelos policiais e, com isso, fazem uma estimativa sobre todo o contrabando na região de fronteira do estado do Paraná. Para quantificar esse fenômeno, Introdução à estatística 12 A L F A C O N foi mensurado o valor, em R$ mil, apreendidos de contrabando por dia. Então, a grandeza medida foi o dinheiro correspondente à mercadoria apreendida diariamente, a unidade de medida foi R$ mil/dia, e o tipo da variável é quantitativa contínua. 2� Uma pesquisa realizada com passageiros estrangeiros que se encontravam em determinado aeroporto durante um grande evento esportivo no país teve como finalidade investigar a sensação de segurança nos voos internacionais. Foram entrevistados 1.000 passageiros, do total de 1 milhão que foi registrado nas companhias aéreas, quanto à sensação de segurança dos voos, respondendo praticamente se sentiu segurança ou não nos voos. O exemplo 2 aborda uma pesquisa com intuito de avaliar a sensação de segurança dos passageiros em voos internacionais. A população de estudo é composta por todo o 1 milhão de passageiros registrados nas companhias aéreas. Cada elemento que compõe a população é um indivíduo que foi passageiro desses voos. No entanto, foram avaliados apenas mil passageiros, uma amostra do todo. A característica avaliada foi a sensação de segurança, quantificada a partir de um questionário em que foi perguntado “sim” ou “não” quanto à sensação de segurança. Desse modo, os valores que essa variável pode assumir são {sim, não}, isto é, uma variável qualitativa nominal. 3� Um pesquisador estudou a relação entre a ocorrência de criminalidade e a quantidade de desocupação da população economicamente ativa em municípios da região do sudeste do país. No exemplo 3, temos uma análise mais voltada para a relação entre variáveis analisadas em uma população. Os municípios avaliados correspondem aos elementos da população e provavelmente serão avaliados apenas por uma amostra desse todo. As duas variáveis serão analisadas conjuntamente para compreender a relação entre elas. Em adição, podemos observar que ambas as variáveis correspondem a uma contagem, ou de crimes registrados, ou de casos de desocupação da população. Dessa forma, temos o estudo de duas variáveis quantitativas discretas. Em síntese, o quadro abaixo apresenta o resumo das principais informações que compõem o objeto de estudo de cada exemplo. Conforme o contexto apresentado em cada questão de Estatística, é muito importante, na primeira leitura, ter esses conceitos bem determinados. Introdução à estatística 1. Conceito 2. Ramos da estatística 2.1 Estatística descritiva 2.2 Estatística inferencial 3. Objeto de estudo 3.1 Elementos avaliados: população 3.2 Característica avaliada: variável 4. Exemplos