Prévia do material em texto
Estaística Educacional Ensino Básico Ensino à Distância Universidade Pedagógica Rua Comandante Augusto Cardoso nº135 Error! Use the Home tab to apply Guide Title to the text that you want to appear here.: 1 ( Page 126 ) Lastupdated/Issuedon02 Setembro 2014 Direitos de autor (copyright) Este módulo não pode ser reproduzido para fins comerciais. Caso haja necessidade de reproduçãodeverá ser mantida a referência à Universidade Pedagógica e aos seus Autores Universidade Pedagógica Rua Comandante Augusto Cardoso, nº 135 Telefone: 21-320860/2 Telefone: 21 – 306720 Fax: +258 21-322113 Agradecimentos À COMMONWEALTH of LEARNING (COL) pela disponibilização do Template usado na produção dos Módulos. Ao Instituto Nacional de Educação a Distância (INED) pela orientação e apoio prestados. Ao Magnífico Reitor, Directores de Faculdade e Chefes de Departamento pelo apoio prestado em todo o processo. Gostaria de agradecer a colaboração dos seguintes indivíduos e instituições na elaboração deste manual: Ficha Técnica Autor: Macie, Jonatane Matias & Manhique, Célia Mateus Desenho instrucional: Revisão Linguística: Maquetização: Ilustração: Contacto: 846185571 Índice Visão geral 8 Bem-vindo ao Módulo de Estatística 8 Objectivos do curso 8 Quem deveria estudar este módulo 9 Como está estruturado este módulo 9 Ícones de actividade 10 Habilidades de estudo 12 Precisa de apoio? 12 Tarefas (avaliação e auto-avaliação) 12 Avaliação 13 Unidade 1 14 Estatística descritiva 14 Introdução 14 1.1 Introdução à Estatistica 15 1.1.1Objecto da estatística 15 1.1.2 Um pouco de História 17 1.1.3 Importância da Estatística 18 O estudo 19 1.1.4 Termos e conceitos básicos de estatística 20 1.1.5 Razões para a utilização de uma amostra 21 1.1.6 Cuidados a ter na formação de uma Amostra 21 Exercícios para auto avaliação 22 1.1.7 Amostragem 24 1.1.8 Tipos de amostragem 24 1.1.9 Estatística descritiva e Estatística Indutiva 26 1.1.10 Caracteres ou variáveis estatísticas 29 Sumário 30 Exercícios de auto avaliação 31 Soluções 36 1.2 Distribuição de Frequências e Gráficos 37 Introdução 37 1.2.1 Tabela de Frequências 38 1.2.2 Gráficos de Distribuição de Frequências 42 Sumário 45 1.3 Medidas de localizaçao 46 Introdução 46 1.3.1 Média Aritmética () 47 1.3.2 MEDIANA (Me) 49 1.3.3 MODA, NORMA OU MODO (MO) 51 1.3.4 CONSIDERACÕES GERAIS SOBRE A MÉDIA, A MODA E A MEDIANA. 54 Licao No 8 58 1.3.5 Medidas separatrizes ( quartis, decis e Percentis) 58 Sumário 63 Exercicios de Auto-avaliação 64 1.4 Medidas de Dispersao 68 Introdução 68 Licao No 9 68 1.4.1 Amplitude Total (At) 68 1.4.2 Desvio- Médio (Dm) 69 1.4.3 Variância 70 1.4.4 Desvio- Padrão 70 1.4.6 Relações Empíricas Entre as Medidas de Dispersão 73 1.5 DISTRIBUIÇÕES BIDIMENSIONAIS 75 Introdução 75 Terminologia 76 Neste capítulo, você deverá prestar muita atenção aos seguintes conceitos: 76 Diagrama de dispersão 76 Covariância 76 Coeficiente de correlação linear; 76 Coeficiente de determinação 76 Recta de regressão linear. 76 Licao No 10 76 1.5.2 COVARIÂNCIA 78 1.5.3 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON 79 1.5.4 REGRESSÃO LINEAR SIMPLES 80 Sumário 81 Exercicios 82 Exercicios de auto avaliaçao 83 Unidade 2 88 Teoria Elementar de Probabilidades e Distribuições 88 Introdução 88 Licao No 1 89 2.1 Teoria Elementar de Probabilidades 89 2.1.1 Origem das Probabilidades 89 2.1.2.Termos e Conceitos Probabilisticos 89 2.1.3 Definição Clássica de Probabilidade 91 A primeira definição que se conhece de probabilidade foi enunciada por Pierre Simon Laplace( 1749-1827) 91 Lição No 2 92 2.1.4 Noções Básicas de Análise Combinatória 92 (Factorial, Permutações, Arranjos e Combinações) 92 Exercicios para auto avaliaçao 96 Licão No 3 97 2.1.4 Teoremas Básicos de Probabilidades 98 Sumário 102 Exercicios de Auto-Avaliação 104 Soluções 107 2.2 Distribuição de probabilidade 108 Introdução 108 Lição No 4 109 2.2.1 Introdução à distribuição normal de probabilidade 109 Uso da tabela de distribuição normal de probabilidade 110 Exercicios de Auto-Avaliação 111 Soluçoes 111 Lição No 5 112 2.2.2 Distribuição Qui- quadrado 112 2.2.3 Distribuição t- Student 113 Exercicios de Auto-Avaliação 114 Unidade 3 115 Estatística inferencial 115 Introdução 115 Lição No 1 116 3.1 Distribuição amostral e Intervalo de confiança para a média de uma população 116 3.1.1 Distribuição Amostral 116 3.2.1. Intervalo de confiança para a média de uma população 117 3.1.2 Intervalo de confiança para proporções 118 3.1.3. Intervalo de confiança para a variância de uma população 119 Lição No 2 121 3.1.3 Intervalo de confiança para duas médias populacionais 121 Exercícios de Auto-Avaliação 124 Soluções 126 Lição No 2 127 3.2 Teoria de decisão estatística, testes de hipóteses e significância 127 3.2.1. Teste de Hipóteses para a Média de Populações normais com variâncias conhecidas 128 4. Bibliografia 131 Apêndices 132 Disciplina: Estatística Educacinal 137 Visão geral Bem-vindo ao Módulo de Estatística Caro estudante, para poder seguir o estudo da Estatística espera-se que você tenha uma preparação adequada em Matemática Básica. Isso implica um conhecimento básico de expressões numéricas e equações. Mesmo supondo preenchidos estes pré – requisitos, é frequentemente reconhecida a necessidade de se rever um pouco do material preparatório, no início de uma lição. Teremos que omitir a maioria dos detalhes, em particular os que envolvem demonstrações matemáticas. Objectivos do curso Quando terminar o estudo do Módulo de Estatística educacional, você será capaz de: Objectivos · Aplicar e desenvolver técnicas de recolher, organizar, apresentar e interpretar Estatísticas Educacionais; · Aplicar métodos quantitativos na elaboração de um projecto de pesquisa; · Organizar uma base de dados utilizando pacotes informáticos Excel ou SPSS; · Gerir uma base de dados utilizando pacotes informáticos Excel ou o SPSS no processamento e análise de dados; · Estimar e analisar Indicadores de eficácia interna do sistema de educação Moçambicano; · Elaborar relatórios fazendo um uso apropriado da informação estatística. Quem deveria estudar este módulo Este Módulo destina-se à formação de professores em exercício e outros interessados que possuem a 12ª Classe ou equivalente e inscritos no Curso à Distância, fornecido pela Universidade Pedagógica. Como está estruturado este módulo Todos os módulos dos cursos produzidos pela Universidade Pedagógica encontram-se estruturados da seguinte maneira: Páginas introdutórias Um índice completo. Uma visão geral detalhada do curso / módulo, resumindo os aspectos-chave que você precisa de conhecer para completar o estudo. Recomendamos vivamente que leia esta secção com atenção antes de começar o seu estudo. Conteúdo do módulo O curso está estruturado em unidades. Cada unidade e seus capítulos incluirão uma introdução, objectivos, conteúdos incluindo actividades de aprendizagem, um sumário da unidade e uma ou mais actividades para auto-avaliação. O Módulo de Estatística compreende três unidades, nomeadamente: (1) Estatística descritiva; (2) Noções de probabilidade e Distribuições; (3) Estimação por intervalos e Teste de hipóteses. Outros recursos Para quem esteja interessado em aprender mais, apresentamos uma lista de recursos adicionais para você explore-os. Estes recursos podem incluir livros, artigos ou sites na internet. Tarefas de avaliação e/ou Auto - avaliação Tarefas de avaliação para este módulo encontram-se no final de cada lição . Sempre que necessário, dão-se folhas individuais para desenvolver as tarefas, assim como instruções para as completar. Estes elementos encontram-se no final do modulo. Comentários e sugestões Esta é a sua oportunidade para nos dar sugestões e fazer comentários sobre a estrutura e o conteúdo do módulo. Os seus comentários serão úteis para nos ajudar a avaliar e melhorar este modulo. Ícones de actividade Ao longo deste manual irá encontraruma série de ícones nas margens das folhas. Estes icones servem para identificar diferentes partes do processo de aprendizagem. Podem indicar uma parcela específica de texto, uma nova actividade ou tarefa, uma mudança de actividade, etc. Acerca dos ícones Os ícones usados neste manual são símbolos africanos, conhecidos por adrinka. Estes símbolos têm origem no povo Ashante de África Ocidental, datam do século 17 e ainda se usam hoje em dia. Os ícones incluídos neste manual são... (ícones a ser enviados - para efeitos de testagem deste modelo, reproduziram-se os ícones adrinka, mas foi-lhes dada uma sombra amarela para os distinguir dos originais). Pode ver o conjunto completo de ícones deste manual já a seguir, cada um com uma descrição do seu significado e da forma como nós interpretámos esse significado para representar as várias actividades ao longo deste curso / módulo. Comprometimento/ perseverança Actividade Resistência, perseverança Auto-avaliação “Qualidade do trabalho” (excelência/ autenticidade) Avaliação / Teste “Aprender através da experiência” Exemplo / Estudo de caso Paz/harmonia Debate Unidade/relações humanas Actividade de grupo Vigilância / preocupação Tome Nota! “Eu mudo ou transformo a minha vida” Objectivos “[Ajuda-me] deixa-me ajudar-te” Leitura “Pronto a enfrentar as vicissitudes da vida” (fortitude / preparação) Reflexão “Nó da sabedoria” Terminologia Apoio / encorajamento Dica Habilidades de estudo Caro estudante! Para frequentar com sucesso este módulo terá que buscar através de uma leitura cuidadosa das fontes de consulta a maior parte da informação ligada ao assunto abordado. Para o efeito, no fim de cada unidade apresenta-se uma sugestão de livros para leitura complementar. Antes de resolver qualquer tarefa ou problema, o estudante deve certificar se de ter compreendido a questão colocada; É importante questionar se as informações colhidas na literatura são relevantes para a abordagem do assunto ou resolução de problemas; Sempre que possível, deve fazer uma sistematização das ideias apresentadas no texto. Desejamos - lhe muitos sucessos! Precisa de apoio? Dúvidas e problemas são comuns ao longo de qualquer estudo. Em caso de dúvida numa matéria tente consultar os manuais sugeridos no fim da lição e disponíveis nos centros de ensino a distância (EAD) mais próximos. Se tiver dúvidas na resolução de algum exercício, procure estudar os exemplos semelhantes apresentados no manual. Se a dúvida persistir, consulte a orientação que aparece no fim dos exercícios. Se a dúvida persistir, veja a resolução do exercício. Sempre que julgar pertinente, pode consultar o tutor que está à sua disposição no centro de EAD mais próximo. Não se esqueça de consultar também colegas da escola que tenham compreendido ou feito a cadeira de Estatística, vizinhos e até estudantes de universidades que vivam na sua zona e tenham ou estejam a fazer cadeiras relacionadas com Estatística. Tarefas (avaliação e auto-avaliação) Ao longo deste módulo irá encontrar várias tarefas que acompanham o seu estudo. Tente sempre solucioná-las. Consulte a resolução para confrontar o seu método e a solução apresentada. O estudante deve promover o hábito de pesquisa e a capacidade de selecção de fontes de informação, tanto na internet como em livros. Consulte manuais disponíveis e referenciados no fim de cada lição para obter mais informações acerca do conteúdo que esteja a estudar. Se usar livros de outros autores ou parte deles na elaboração de algum trabalho deverá citá-los e indicar estes livros na bibliografia. Não se esqueça que usar um conteúdo, livro ou parte do livro em algum trabalho, sem referenciá-lo é plágio e pode ser penalizado por isso. As citações e referências são uma forma de reconhecimento e respeito pelo pensamento de outros. Estamos cientes de que o estimado estudante não gostaria de ver uma ideia sua ser usada sem que fosse referenciado, não é? Na medida de possível, procurar alargar competências relacionadas com o conhecimento científico, as quais exigem um desenvolvimento de competências, como auto-controle da sua aprendizagem. As tarefas colocadas nas actividades de avaliação e de auto-avaliação deverão ser realizadas num caderno à parte ou em folha de formato Avaliação O Módulo de Estatística terá dois testes e um exame final que deverá ser feito no Centro de Recursos mais próximo, ou em local a ser indicado pela administração do curso. O calendário das avaliações será também apresentado oportunamente. A avaliação visa não só informar-nos sobre o seu desempenho nas lições,mas também estimular-lhe a rever alguns aspectos e a seguir em frente. Durante o estudo deste módulo o estudante será avaliado com base na realização de actividades e tarefas de auto-avaliação previstas em cada Unidade. 10 Unidade 1 Estatística descritiva Introdução O objectivo fundamental da estatística é o de caracterizar (ou inferir sobre) uma população conhecendo apenas uma parte dela. Neste caso, a verdadeira arte está no observador que tem de ser capaz de ver o que está encoberto só com base na quilo que consegue observar. Para tal reunimos um conjunto de conceitos de estatística e de métodos de análise considerados fundamentais para analisar dados estatístico. Nesta Unidade, você deverá fazer: o estudo do Objecto de Estatística, concentrando a atenção nas Fases do método estatístico; um pouco do Historial e importância da Estatística a diversos níveis; alguns conceitos e termos usados em Estatística como é o caso da População e amostra. Ainda nesta Unidade, vai estudar as técnicas de amostragem, tipos de variáveis e distinguir a Estatística descritiva da Inferencial. Vai poder ainda resumir os dados estatísticos em tabelas e gráficos e, calcular certos parâmetros estatísticos que lhe permitirão descrever certos fenómenos. Para poder seguir esta unidade sem maiores dificuldades, espera-se que você tenha uma preparação adequada em Matemática básica. Isso implica um conhecimento básico de expressões numéricas e equações. Ao completar este capitulo, você será capaz de: Objectivos · Identificar o objecto de estudo de Estatística · Dar alguns exemplos de utilização de estatística no seu dia-a-dia · Identificar população e amostra num estudo estatístico; · Explicar as razões da utilização da amostra num estudo estatístico · Indicar os cuidados a ter na utilização de uma amostra · Explicar os diferentes tipos de amostragens · Estabelecer a diferença entre Estatística Descritiva e Inferencial · Identificar e classificar variáveis num estudo estatístico; · Representar dados estatísticos em tabelas e gráficos; · Calcular certos parâmetros estatístico; · Analizar e descrever fenómeno estatístico. Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · População; amostra e tamanho de amostra; · Dados estatísticos; unidade estatística; · Variáveis qualitativas; quantitativas e escalas de medição; · Estatística descritiva e inferencial. Lição No 1 1.1 Introdução à Estatistica 1.1.1Objecto da estatística De uma forma sintética, pode -se dizer que a Estatística é um conjunto de técnicas apropriadas para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos. E tem por objectivo a análise e avaliação numérica de observações. Os computadores e calculadoras são meios excelentes para trabalhar com Estatística. Assim, a Estatística é mais um método do que uma teoria, pois o seu objectivo fundamental é descrever fenómenos e não tanto explicá-los. O método estatístico na medida em que utiliza a linguagem de números, é um método quantitativo. Num estudo estatístico, normalmente segue-se um conjunto de passos que designamos por fases do método estatístico para facilitar o estudo estatístico. Fases do Método estatístico: a) Definição do problema - a primeira fase consiste na definição e formulação do problema a ser estudado. O investigador deve ainda analisar outros estudos feitos sobre o mesmo tema.b) Planificação - definido o problema, é preciso determinar um processo para o resolver e em especial, como obter informações sobre a variável em estudo. É nesta fase que se decide pela observação de toda população ou de uma amostra e a calendarização das actividades a realizar. c) Recolha de dados - os dados podem ser recolhidos através de: · Questionário; · Entrevista; · Observação; · Experimentação; · Pesquisa bibliográfica, etc. d) Organização ou classificação de dados - consiste em “resumir” os dados através da sua contagem e agrupamento. Deste modo, obtém-se um conjunto de números que possibilita distinguir o comportamento do atributo estatístico. e) Apresentação dos dados - há duas formas de apresentação que não se excluem mutuamente: · Apresentação por tabelas; · Apresentação por gráficos. Estas formas de apresentar dados, permitem sintetizar grandes quantidades de dados, tornando mais fácil a compreensão do carácter em estudo e permitindo uma futura análise. f) Análise e interpretação dos dados - é a mais importante e delicada do estudo estatístico, pois é nesta fase que se tiram conclusões que ajudam o investigador a resolver o problema. Nesta fase, ainda é possível, por vezes, “arriscar” alguma generalização, a qual envolverá sempre algum grau de incerteza. Ao estudo estatístico interessam os fenómenos não deterministas cujos resultados envolvem alguma incerteza (inflação, resultados de uma eleição, …). Os fenómenos deterministas ou causais (queda de um móvel, a resistência a rotura de um material, …), para os quais existe uma lei matemática que os define, não serão naturalmente estudados em Estatística. 1.1.2 Um pouco de História A origem de Estatística remota a tempos muito antigos da nossa história e começou por tratar de assuntos de Estado. A palavra Estatística tem origem na palavra em latim status, traduzida como o estudo do Estado e significava, originalmente, uma colecção de informação de interesse para o estado sobre população e economia. Essas informações eram colectadas objectivando o resumo de informações indispensáveis para os governantes conhecerem suas nações e para a construção de programas de governo Há indícios de que por volta do ano 3000 a.c. já se faziam censos na Babilónia, na China e no Egipto com o propósito de cobrar impostos e para fins militares. O livro quarto do Antigo Testamento refere que Moisés foi instruído pelo profeta a fazer um levantamento dos homens de Israel que estivessem aptos a guerrear. Na época do Imperador César Augusto foi ordenada a realização de um censo em todo o Império romano no primeiro ano da nossa era (na região entre Douro e Guadiana). Apesar da sua origem remota, é apenas no séc. XVII que a Estatística começa a ser considerada uma disciplina autónoma. Para esta autonomia, muito contribuiu a acção do alemão Herman Conring(1606-1681) ao introduzir o seu estudo na universidade de Helmstadt, no que foi continuado por Godofred Achenwall (1719-1772) e por Schlozer(1735-1809). No Séc. XVII, surge também a escola inglesa. John Graunt(1620-1674) e William Petty (1623-1687) dois dos seus mais destacados representantes, preocuparam-se com o estudo numérico dos fenómenos sociais e políticos numa primeira tentativa de determinarem leis quantitativas capazes de exemplificarem tais fenómenos. A Graunt se deve a primeira investigação estatística sobre a mortalidade, como consta de uma memória que apresentou á Real Sociedade de Londres, em 1661. Nesse estudo, Graunt concluiu que nasciam mais crianças do sexo masculino do que do sexo feminino, que as mulheres tendiam a viver mais tempo do que os homens e que o número de mortes (excepto durante as epidemias) se mantinha sensivelmente constante de ano para ano. Na Alemanha, o Pastor Sussmilch (1707-1767) conduziu um estudo sobre Demografia, que colocou como o precursor da Estatística enquanto meio indutivo de investigação. O passo decisivo para a fundamentação teórica da inferência estatística encontra se associado ao desenvolvimento do cálculo das probabilidades. 1.1.3 Importância da Estatística Nos nossos dias, a Estatística assume uma importância decisiva a diversos níveis. A importância da Estatística pode ser vista através da sua utilização ao nível do Estado, de Organizações Sociais e profissionais, do Cidadão comum e ao nível científico. Ao nível do Estado, hoje em dia quase todos as decisões importantes que se tomam são acompanhadas de estudos estatísticos e o mesmo se pode dizer relativamente á justificação da adequação ou não das políticas seguidas por diferentes governos. O grau de importância atribuído a Estatística, neste caso, é tão grande que praticamente todos os países possuem organismos oficiais destinados a realização de estudos estatísticos - Instituto Nacional de Estatística (INE). No que respeita as organizações sociais e Profissionais, tem se vindo a assistir a um aumento do uso da Estatística. Relativamente as Organizações Sociais, empresas, sindicatos, organizações de assistência social, etc. Todas elas conduzem a sua acção recorrendo mais ou menos a Estatística. Por exemplo, uma empresa quando lança um novo produto indaga pessoas acerca desse produto com o fim de determinar índices de potenciais compradores. No que concerne aos grupos profissionais, são também cada vez maiores as exigências na utilização de Estatística. Muitas vezes tal utilização acompanha diversas fases do seu trabalho, que vão desde a planificação passando pela execução e terminando na análise dos resultados. Destaca-se, ao nível das organizações, o aparecimento recente e o grande incremento de empresas e profissões ligadas a publicidade e técnicas de marketing, nas quais a Estatística desempenha um papel central. Ao nível do Cidadão comum, a importância da Estatística resulta imediatamente das implicações das decisões tomadas, quer pelo Estado quer pelas diferentes organizações sociais e profissionais. É sabido que as decisões políticas tomadas pelo Governo, as estratégias de desenvolvimento e de gestão das empresas e as posições dos sindicatos, p.ex., afectam a generalidade do cidadão comum. A necessidade de formação estatística para todos no sentido de promover uma participação esclarecida e crítica justifica-se, pois, voluntariamente ou involuntariamente, por vezes, os resultados estatísticos favorecem certos grupos sociais em prejuízo de outros. A este respeito recorde-se que com base no mesmo estudo, os membros do Governo e os dirigentes sindicais podem sustentar opiniões díspares acerca do desemprego. E não se pense que tais disparidades resultam sempre de um uso distorcido da Estatística, pois essas discrepâncias podem resultar de consideração de certos aspectos em detrimento de outros de acordo com o interesse dos interlocutores. O Cidadão comum é bombardeado também com informação relacionada com a cultura e com o desporto, cuja a compreensão exige, igualmente, conhecimento de estatística. No caso de futebol é frequente a televisão apresentar uma síntese relativa a certos aspectos do jogo durante o intervalo e no fim do jogo. A Estatística é também responsável pelo desenvolvimento científico em geral. Para além da sua aplicabilidade nas Ciências Naturais, na Medicina, na Agronomia e na Economia, a Estatística constitui um suporte de cientificidade para as ciências humanas e sociais. É assim que ciências como a Sociologia, a Psicologia, a História e a Pedagogia têm beneficiado de consideráveis desenvolvimentos e de aumento de credibilidade pública com a utilização de meios estatísticos. Exercícios 1. Descreve o objecto de estudo de estatística; 2. Dê pelo menos dois exemplos de utilização de estatística no seu dia-a-dia; 3. Que procedimentos devem ser observados num estudo estatístico? O estudo Lição No 2 1.1.4 Termos e conceitos básicos de estatística População e Amostra Num censo ou recenseamento são observados todos elementos da população relativamente aos diferentes atributos que estão a ser objecto de estudo estatístico. Ex. Para conhecermosos gostos dos alunos de uma escola acerca dos sabores de yougurtes através de um censo, teríamos de interrogar todos alunos da escola. Como exemplos de censos que se efectuam na generalidade dos países, temos: o recenseamento militar, o recenseamento eleitoral e o recenseamento geral da população. Estes recenseamentos têm por finalidade última facultar um melhor conhecimento das pessoas e das suas condições de vida, de forma a permitir as entidades governamentais tomar medidas adequadas para o desenvolvimento do país. Quando por várias razoes, a realização de um censo surge como uma impossibilidade, então a sondagem assume-se como uma alternativa. Numa sondagem, o estudo estatístico baseia-se numa parte da população, isto é, numa amostra que deve ser representativa dessa população. Ex. Recorrendo a empresas especializadas, os partidos políticos encomendam sondagens para estimar o número de votantes e/ou para avaliar o impacto público das suas posições; as empresas promovem sondagens para prever o número de potenciais compradores dos seus produtos e os investigadores efectuam sondagens para avaliar o impacto social das suas descobertas, etc. Quando se faz uma sondagem acerca da audiência de um programa televisivo, não se pergunta a toda população se gosta ou não do programa, mas sim interroga-se uma parte da população, ou seja, uma amostra. Quando se analisa a qualidade dos fósforos produzidos por uma fábrica, não se experimenta todos os fósforos (população), mas sim uma parte dos fósforos (amostra). População ou Universo Estatístico é uma colecção de seres com qualquer característica comum. Amostra é um subconjunto finito da população. A cada elemento da população chama-se Unidade Estatística ou individuo. A população pode ser finita ou infinita. Ex. População finita – o número de funcionários de uma empresa. População infinita – os pontos de uma recta, os resultados obtidos (coroa ou cara) em sucessivos lançamentos de uma moeda. A maior parte de pesquisas científicas recorre a estudos de uma amostra. 1.1.5 Razões para a utilização de uma amostra A utilização de uma amostra e não da população num estudo estatístico embora nos conduza a conclusões seguras, deve-se pelo menos, a uma das seguintes razoes: · A população ser infinita; · Economia de dinheiro; · Economia de tempo; · Comodidade; · Inutilização dos elementos observados. (a dona Amélia partiu todos os ovos para verificar a sua qualidade, o que acontece aos ovos.) O sucesso de um estudo estatístico baseado no estudo de uma amostra depende da escolha desta. Uma amostra mal escolhida conduz a conclusões erradas. 1.1.6 Cuidados a ter na formação de uma Amostra Dum modo geral, devemos ter os seguintes cuidados na formação da amostra: Imparcialidade - todos os elementos devem ter a mesma oportunidade de fazer parte da amostra; Representatividade – deve conter em proporção tudo o que a população possui, qualitativa e quantitativamente; Tamanho – deve ser suficientemente larga de modo que as características da amostra se aproximem, tanto quanto possível, das características da população. Exercícios para auto avaliação 1. Relativamente a uma recolha estatística diga o que entende por: a) População b) Unidade estatística c)Amostra 2. Fez-se um inquérito dirigido a todos operários de uma fábrica. Dos diferentes sectores seleccionaram-se 50 operários. Neste estudo: a) qual é a população b) qual é a amostra? 3. Dê dois exemplos de estudos estatísticos onde seja necessário utilizar uma amostra. 4. Dê um exemplo de amostra mal escolhida. E justifica 5. Porque em maior parte de pesquisas científicas usa se a amostra e não a população? 6. Leia a seguinte notícia: «É surpreendente. Apenas 5% do tempo de trabalho diário de um vendedor é passado a…. Vender ou negociar». Esta a conclusão que chegou Robert Kinnaird de uma consultora de Glasgow, na sequência de um inquérito junto de 1000 vendedores de quatro países europeus. Fortuna, Maio 95 Neste estudo referido na notícia usou-se um censo ou uma sondagem? Justifique. 7.Indique a população e a unidade estatística em que o carácter em estudo era: a) O curso preferido pelos estudantes da turma; b) A nacionalidade dos Políticos que visitaram Moçambique em 1986; c) O tempo gasto pelos 5 melhores ciclistas Moçambicanos na volta a Moçambicano em 2007. Soluções 2.a) Operários de uma fábrica; b) 50 Operários seleccionados 3.Exemplos: i.) Análise de sangue de um ser humano ii) Estudo do tipo do solo. 4. Exemplo: Selecção de rendimento de 5 melhores alunos de uma turma de 60 para avaliar o aproveitamento da mesma. Justificação: Não se observa a representatividade; isto é, não estão contempladas outras categorias de alunos(fracos e médios) além disso trata se de uma amostra não significativa. E os resultados a obter se são incorrectos. 5. Razões: A população ser infinita; Economia de dinheiro; Economia de tempo; Comodidade; Evitar inutilizar os elementos observados; etc. 6. Sondagem. Pesquisa feita somente a 1000 vendedores amostra de 4 países. 7. a) Estudantes da turma; cada estudante representa a unidade estatística; b) Políticos que visitaram Moçambique em 1986; cada politico que visitou Moçambique em 1986; c) Ciclistas Moçambicanos; cada ciclista. Lição No 3 1.1.7 Amostragem Existem técnicas científicas para a selecção correcta de amostra. A amostragem é o processo pelo qual recolhemos dados. Isto dá-nos apenas uma imagem da população em estudo. No entanto, independentemente da correcção dos processos usados, para recolher a amostra, há sempre a considerar o chamado erro de amostragem. Devemos sempre esperar algumas diferenças entre a amostra e a população. Por outro lado, por exemplo, o erro pode residir não só na amostragem, mas também nos próprios dados. Erros não amostrais acontecem quando os valores recolhidos não pertencem aos valores possíveis da entidade (exemplo: registado o valor 32 para uma nota, quando deveria ter sido 23) ou quando apenas uma pequena proporção da população é recolhida. 1.1.8 Tipos de amostragem De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória. O método de amostragem não aleatório consiste em seleccionarmos entidades através de escolha pessoal. As amostras não aleatórias incluem: 1) As de opinião quando as entidades são escolhidas porque compõem uma amostra representativa (os habitantes de duas freguesias podem ser usados como representativos dos eleitores de uma zona mais ampla do país, por exemplo); 2) As de conveniência quando escolhemos as entidades apenas estas estarem mais próximas de nós (escolhemos os alunos de uma turma quando pretendemos obter a opinião de todos os alunos de uma escola); 3) As de quota quando os elementos que compõem a amostra são de determinadas características (se soubermos que os consumidores de um determinado produto são 60% do sexo feminino, podemos dizer a um inquiridor que esteja à porta de um supermercado para entrevistar 60 pessoas do sexo feminino e 40 do sexo masculino, cabendo-lhe a decisão de escolher quem entrevista). Porque dependem de escolha pessoal, as amostras não aleatórias podem efectivamente não ser representativas de uma população, sendo difícil o cálculo do erro amostral. Para ultrapassarmos este problema, as amostras aleatórias deixam a escolha ao acaso, tendo em princípio cada elemento da população a mesma probabilidade de ser escolhido. Há quatro tipos de amostragens aleatórias. A primeira delas é a chamada amostra aleatória simples de tamanho n onde não só cada elemento da população tem as mesmas hipóteses de ser escolhido, como também qualquer conjunto de tamanho n pode ser escolhido. Ex. Pretende-se uma amostra de 20 alunos de uma escola, atribui-se um número a cada um dos alunos da escola e, seguidamente, escolhe-se ao acaso 20 desses números. O segundo tipo de amostragem é a amostragem estratificada. Neste tipo de amostragem, as entidades são agrupadas em estratos segundo características físicas ou materiais. Para assegurarque todos os estratos da população estudantil afectados por determinado diploma sejam considerados, escolhem-se, por exemplo, uma amostra aleatória de estudantes de cada um dos tipos de ensino: básico, secundário e superior. Uma única amostra aleatória simples não poderia garantir esta representação de estudantes dos três tipos de ensino. Ex. Na selecção de 30 alunos de uma escola, considerando cada ano de escolaridade como estrato, escolher-se-ia em cada um desses anos um determinado número de alunos por um dos processos anteriores. O número de alunos a escolher em cada ano, seja, em cada estrato deve ser proporcional ao número dos alunos desse ano. Se a escola, com 600 alunos, 150 são da 10ªclasse, 100 são da 11ª classe e 50 são da 12ªclasse poder-se-ia para amostra · 15 Alunos da 10ªclasse · 10 Alunos da 11ªclasse · 5 Alunos da 12ª classe O que significa que em cada estrato tem se 10% de alunos Um terceiro tipo de amostragem é a chamada amostragem por cachos. Aqui, as entidades são classificadas em grupos ou cachos e é seleccionada uma amostra aleatória de cachos. Um censo (de toda a população) é então conduzido dentro dos cachos seleccionados. Por fim, a amostra sistemática, os elementos da amostra, são escolhidos a partir de uma regra estabelecida. Ex. Para seleccionar uma amostra de 30 alunos de uma escola com 600 alunos, depois de numerados todos, pode-se escolher um aluno de 20 em 20 a partir do primeiro aluno seleccionado e escolhido ao acaso de entre o primeiro grupo de 20 alunos. Supondo que o número 3 foi seleccionado, tem-se para a amostra: 3, 23, 43, 63, ……, 563, 583. 1.1.9 Estatística descritiva e Estatística Indutiva Estatística descritiva ou dedutiva tem por finalidade descrever certas propriedades relativas a um conjunto de dados. Ela trata da recolha, ordenação, classificação e análise de um conjunto de dados obtidos em observações, Depois de efectuadas observações ficamos na posse de um conjunto caótico de dados, o que dificulta a obtenção de conclusões. É perante esta «desordem» dos dados que a Estatística descritiva revela a importância e interesse das suas técnicas, ao permitir classificar esses dados e deles fornecendo características sumárias. Constroem-se tabelas e gráficos que simplificam a complexidade de dados e calculam-se parâmetros estatísticos que ajudam a compreender e descrever a situação em estudo. Os métodos descritivos enquanto meios que permitem ordenar a «desordem» e sintetizar a diversidade das informações contidas nos dados, podem explicar-se quer a população quer a amostra. Estatística Indutiva ou Inferencial – procura inferir propriedades do universo estatístico a partir de propriedades verificadas na amostra. Ela generaliza para uma população, estabelecendo previsões a partir dos resultados na Estatística Descritiva e apoia-se no cálculo das probabilidades que permite quantificar o erro, compreendendo que a inferência é tanto mais provável quanto menor for o erro que acompanha. Pode utilizar-se a Estatística indutiva só no estudo da amostra. ExercíciosExercícios de Auto-Avaliação 1. Supondo que ia fazer um estudo sobre cada um dos temas indicados, diga, justificando, em quais deles utilizaria uma amostra: a) Controlo de qualidade da educação oferecida pelas escolas privadas moçambicanas; b) Aproveitamento dos alunos da turma 10ª A de uma Escola; c) Análise do mercado para lançamento de uma nova pasta de dentes; d) Estado sanitário dos ovos existentes num armazém; e) Tipo de borboletas existentes num País. 2.Explique a diferença entre Estatística descritiva e estatística inferencial. 3. Considerar a sequência do seguinte estudo: a) Define-se uma amostra dos elementos de população; b) Descrevem-se as variáveis para o estudo; c) Toma-se nota, para cada variável, do valor correspondente a cada elemento da amostra; d) Utilizam-se diversos métodos científicos e analisam-se os dados, obtendo-se diversas estatísticas; e) Com os dados obtidos na amostra prevê-se o comportamento da população com ajuda do cálculo das probabilidades. Qual dos passos referidos está dentro da Inferência Estatística? 4.Um promotor de vendas quer saber a opinião de mulheres empregadas sobre uma nova política do governo que prevê escolaridade obrigatória até 7ª classe. Ela tem uma lista de todas as mulheres que pagam quotas a um dos sindicatos. Ela envia um questionário a 100 destas mulheres escolhidas aleatoriamente. Destas, 68 preenchem e devolvem o questionário. a) Qual é, neste caso, a população e amostra? b) Acha que a amostra é representativa? Justifique. 5.Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, as 18h30min. Dois dias mais tarde, uma firma de pesquisa de mercados realizou um levantamento telefónico para obter informações sobre os índices de respostas (percentagem de espectadores que responderam vendo o comercial) e impressões sobre o comercial. a) Qual é a população desse estudo b) Qual é a amostra para esse estudo c) Porque se usaria uma amostra nessa situação? Soluções 1. a) , c), d) e e). 3.e) 4. a) Mulheres empregadas. Amostra 100 mulheres empregadas. b) A amostra não é representativa pois, não envolveu mulheres de todos sindicatos. 5. a) População: novo comercial. b) Amostra: o comercial mostrado em um programa de notícias locais; c) Comodidade Lição No 4 1.1.10 Caracteres ou variáveis estatísticas Se a população de um estudo estatístico fosse constituída pelos alunos de uma escola, cada aluno seria uma unidade estatística. Cada aluno tem muitas Características ou caracteres: a cor dos olhos, a altura, o número de irmãos, a profissão dos pais, sexo, a distância de casa a escola, a última nota de história, etc. Os caracteres podem ser qualitativos (nominais e ordinais) ou quantitativos (discretos e contínuos). Caracteres qualitativos são aqueles que não se podem medir. Estão relacionados com uma qualidade e apresentam-se em modalidades. Caracteres qualitativos Modalidades A cor dos olhos Azul, verde, castanho, … O curso preferido Jornalismo, direito, … A profissão dos pais Professor, médico, pedreiro, …. Caracteres quantitativos – são aqueles que se podem medir. A apresentam-se com diferentes intensidades ou valores. Caracteres quantitativos Valores O peso de um limão 10g, 15g, 50g, …. Altura de uma pessoa 136cm, 179cm, … O custo da renda de casa 2.500Mt, 7.000Mt, … Ao resultado da observação de um carácter qualitativo ou quantitativo chama-se dado estatístico. Ex. O Alfredo tem olhos castanhos; o Alfredo mede 1,86cm de altura. Os estudos estatísticos incidem essencialmente em variáveis quantitativas. As variáveis estatísticas quantitativas subdividem-se em duas categorias: Discretas e contínuas. i. Variáveis Discretas – são as que só podem tomar um número finito ou uma infinidade numerável de valores. Ex. Número de irmãos de um aluno da turma, mesmo antes de fazermos a observação, sabe que vamos encontrar dados que em termos geométricos, correspondem a pontos isolados. ___. ________. ________. ________. _..... 0 1 2 3 ii. Variáveis Contínuas – são as que podem tomar qualquer valor de um intervalo. __._____________. ___ 1,70 1,90 Ex. Peso dos recém nascidos durante um mês, numa maternidade, mesmo antes de fazermos uma observação, sabemos que, teoricamente, podemos encontrar uns dados estatísticos que, em termos geométricos, seriam representados na recta real por qualquer ponto de um intervalo. Sumário População ou Universo Estatístico é uma colecção de seres com qualquer característica comum. Amostra é um subconjunto finito da população. A cada elemento da população chama-se Unidade Estatística ou individuo. A população pode ser finita ou infinita. Razões para a utilização de uma amostra A utilização de uma amostra e não da populaçãonum estudo estatístico embora nos conduza a conclusões seguras, deve-se pelo menos, a uma das seguintes razoes: a população ser infinita; economia de dinheiro; economia de tempo; comodidade; inutilização dos elementos observados. Na selecção da amostra deve se observar os seguintes cuidados: imparcialidade, representatividade e tamanho. De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória. A estatística esta subdividida em duas partes: a descritiva e a inferencial. O diagrama abaixo indica os tipos de variáveis. ( Nominais Ordinais Qualitativas ou Categóricas Quantitativas Contínuas Discretas variáveis ) Ex. Sexo ex. nível de instrução ex. alturas ex. n° de filhos Exercícios de auto avaliação 1.Considere o seguinte texto: Num congresso sobre «direitos da criança» apresentaram comunicações 5 Pediatras, 3 Psicólogos, 4 Educadores, 2 Assistentes Sociais e 2 Sociólogos. Da análise do Texto, infere-se que foi feito um estudo estatístico. Para esse estudo indique: a) A população b) Unidade estatística c) O carácter estatístico. Classifique-o. 2.Tende-se fazer um estudo sobre o número de filhos dos professores de Matemática de uma cidade. Para isso, efectuou-se um inquérito ao qual responderam 30 professores de Matemática, os resultados obtidos foram: ____________________________________ 5 4 3 0 0 2 2 2 1 1 1 0 3 0 2 2 0 3 4 6 1 1 0 2 3 1 2 0 0 1 ____________________________________ Indique: a) A população em estudo b) A amostra escolhida c) A unidade estatística d) A variável em estudo e classifique-a. 3.Mediram se os comprimentos de cinco mesas rectangulares e obtiveram se os seguintes dados: 1,3cm; 1,2cm; 1,25cm; 1,02cm; 1,4cm. Neste conjunto de observações, indique: a) População; b) A unidade estatística; c) A variável estatística e classifique-a; d) O que representam em linguagem estatística, os números dados? 4.Um levantamento arguiu 2010 adultos. «Você está satisfeito com a situação da educação das nossas crianças nas escolas hoje?» As categorias das respostas eram insatisfeitas, satisfeitas e indeciso. a)Qual foi tamanho da amostra para esta pesquisa? b) Os dados colectados eram quantitativos ou qualitativos? c) Para um resumo dos dados para esta questão, faria mais sentido usar as médias ou percentagens? d) Dos que responderam, 60% disseram que estavam insatisfeitos com a situação da educação. Quantos indivíduos forneceram esta resposta? 5. Uma agência classifica a ocupação dos trabalhadores como profissional liberal, funcionário e operário. A variável é a ocupação do trabalhador. Esta é uma variável qualitativa ou quantitativa? 6. Declare se cada uma das variáveis é quantitativa (discreta, contínua) ou qualitativa (nominal, ordinal). a) Idade b)Género c) Classe social d) Marca de automóvel e) Número de pessoas favoráveis a pena de morte f) Vendas anuais g) Ganhos por acção h) Método de pagamento (a vista, com cheque, com cartão de crédito). 7. Uma funcionária tem um salário de 140 mil meticais mas é informada de que terá uma redução de 10% no pagamento em virtude do declínio dos lucros da companhia. É informada também de que no ano seguinte terá um aumento de 10%. A situação não se afigura tão má porque a redução de 10% parece ser compensada pelo aumento de 10%. a) Determine a renda anual após o corte de 10%. b)Com base no resultado obtido em a), determine a renda anual após o aumento de 10%. c) O corte de 10% seguido do aumento de 10% restitui a funcionária o salário original de 140mil meticais? 8. Num teste de Matemática as classificações positivas e negativas distribuem-se pelos rapazes e raparigas de acordo com os valores da seguinte tabela: Rapazes Raparigas Total Positivas 15 21 36 Negativas 5 4 9 Total 20 25 45 Determine a percentagem de: a. Raparigas b. Raparigas com classificação positiva; c. Rapazes com classificação positiva, no conjunto dos rapazes. 9.Um inquérito realizado para um supermercado classificou seus clientes segundo a frequência com que o visitam e segundo a frequência com que compram produtos de limpeza. Frequência de visita Frequência de compra de produtos de limpeza Sempre Algumas vezes Nunca Frequente 12 48 19 Não frequente 7 6 8 a) Quantos indivíduos visitam frequentemente o super mercado? b) Quantos indivíduos visitam frequentemente o super mercado e compram produtos de limpeza? c) Qual é a percentagem de indivíduos que não visitam o supermercado frequentemente e compram produtos de limpeza? Soluções 1. a) crianças; b) cada criança; c) direito das crianças. Variável qualitativa nominal; 2. a) professores de Matemática; b) 30 professores inquiridos; c) cada professor; d) número de filhos de professores de Matemática. Variável quantitativa discreta. 3. a) Mesas rectangulares; b) Cada mesa; c) Comprimento de cada mesa. Variável quantitativa contínua; d) Dados estatísticos. 4. a) 2010 adultos; b) qualitativos; c) Percentagens; d) 1206 adultos. 5. Qualitativa; 6. A) Quantitativa contínua; b) qualitativa nominal; c) qualitativa ordinal; d) qualitativa nominal; e) quantitativa discreta; f) quantitativa discreta; g) quantitativa contínua; h) qualitativa nominal. 7. a)1512000 b) 1663200 c)Não. 8. a) 55.6% b) 46.7% c)75%. 9. a) 79 b) 60 c) 13% 1.2 Distribuição de Frequências e Gráficos Introdução Neste capítulo, você vai tratar das fases do método estatístico é neste capitulo onde você vai começar a actividade de recolha, organização, apresentação (uso de tabelas e gráficos), análise e interpretação do fenómeno estatístico observado, é, aqui onde vai construir um banco de dados processando-os usando pacotes estatísticos Excel ou Spss. Este capitulo tem 4 lições, estando previsto para cada uma delas um tempo de estudo de 2,5 horas. Este número de horas é um indicativo para lhe ajudar a gerir melhor o seu tempo; é considerado suficiente para você conseguir atingir os objectivos definidos no início de cada lição. Ao completar esta unidade, você será capaz de: Objectivos · Recolher dados num estudo estatístico; · Organizar dados estatísticos; · Apresentar dados estatísticos numa tabela e num gráfico de distribuição de frequências usando o pacote estatístico Excel ou Spss; · Analisar e interpretar os dados descrevendo-os e tirar conclusões; · Elaborar um relatório preliminar sobre o fenómeno estatístico observado. Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · Tabela de distribuição de frequências · Gráficos de barra, histograma, polígono de frequências, sectograma; · Frequências: absolutas, relativas, absoluta acumulada e relativa acumulada Licao No 5 1.2.1 Tabela de Frequências Vamos dar em seguida, particular atenção `a organização e apresentação dos dados, nomeadamente `a elaboração de tabelas e gráficos Para organizar e representar dados, usam-se tabelas e gráficos. Tabela de Frequências para dados simples(não agrupados em classes) Suponhamos que numa turma da 10ª classe pretendíamos fazer um estudo estatístico sobre as idades(em anos) dos alunos. E neste caso registamos: 16, 13, 15, 16, 14, 13, 14, 15, 15, 14, 15, 17, 14, 15, 15, 15, 14, 16, 15, 14, 14, 15, 17. A variável estatística idade (em anos), é discreta e toma os valores 13, 14, 15, 16 e 17. Tabela 1: Distribuição das idades da turma Idade (em anos) Xi contagem Frequência fi 13 // 2 14 //// // 7 15 //// //// 9 16 /// 3 17 // 2 Total - 23 A tabela acima representa a frequência absoluta ou efectivo (fi) de um valor X da variável, pois indica o número de vezes que esse valor foi observado. Sabemos da tabela que 7 alunos da turma têm 14 anos, 3 alunos têm 16 anos, etc. A partir da frequência absoluta (fi), podemos calcular outras frequências: Frequência relativa (fri) de um valor X da variável, é o quociente entrea frequência absoluta do valor X da variável e o número total de observações. ou em percentagem (i=1,2,3,…..,k) Frequência absoluta acumulada (faci) ou (Fi) do valor X, é a soma das frequências absolutas de todos valores anteriores a X com frequência absoluta de X. Frequência relativa acumulada (facri) ou (Fri ) do valor X, é a soma das frequências relativas de todos valores anteriores a X com frequência relativa de X. Tabela2: Distribuição das frequências das idades da turma Idade (em anos) Xi Freq.Absoluta Freq.relativa Freq.Absol. acumulada. Freq.Relat.Acumul. 13 2 2/23=0.09 ou 9% 2 0.09 ou 9% 14 7 7/23=0.30 ou 30% 9 0.39 ou 39% 15 9 9/23=0.39 ou 39% 18 0.78 ou 78% 16 3 3/23=0.13 ou 13% 21 0.91 ou 91% 17 2 2/23=0.09 ou 9% 23 1 ou 100% n=23 Nesta tabela, encontram-se respostas para as seguintes questões: 1. qual é o número de alunos com idade inferior ou igual a 14 anos? Resp.- há 9 alunos com 14 anos ou menos; 2. qual é a percentagem de alunos com 15 anos? Resp - há 39% de alunos com 15 anos; 3. quantos alunos tem 17 anos? Resp - há 2 alunos com 17 anos; 4. qual é a percentagem de alunos com idade inferior a 16 anos? Resp -78% dos alunos têm menos de 16 anos; 5. qual é a percentagem de alunos com mais de 15 anos? Resp - 22% (13%+9%) dos alunos da turma têm mais de 15 anos; 6. qual é o número total dos alunos da turma? Resp - o número total dos alunos da turma é 23. Tabela de Frequências para dados agrupados ou tabulados em classes Se no lugar de estudarmos a variável idade dos alunos, fossemos estudar a variável altura dos alunos e tivéssemos: 1,62 1,71 1,50 1,62 1,69 1,59 1,48 1,52 1,64 1,57 1,49 1,66 1,73 1,53 1,61 1,63 1,56 1,55 1,57 1,64 1,60 1,51 1,68 ___________________________________________________________________ Trata-se agora de uma variável contínua. E o estudo das variáveis contínuas assenta-se na organização dos dados em classes. Também pode-se usar o agrupamento de dados em classes de variáveis discretas se tivermos tantos valores diferentes para variável X. Não existe nenhuma fórmula universalmente aceite para determinar o número de classes a considerar. A tabela de Truman L. Kelley que estabelece o número de classes (k) em função do número total de observações (n) pode constituir uma ajuda. n 5 10 25 50 100 200 500 1000 k 2 4 6 8 10 12 15 15 No caso das alturas podemos considerar 6 classes, pois n=23. Todas as classes devem ter a mesma amplitude e para isso calcula-se: 1º Amplitude total =limite superior(Ls)-limite inferior(Li)=1,73-1,48=0,25. 2º Pode, então, considerar – se 0,05 como amplitude de cada classe e 1,45 como limite inferior da primeira classe . Obs: Se considerássemos a amplitude de 0,04 e 1,48 (menor valor observado) como limite inferior da primeira classe verificava-se que o valor 1,73 não se incluía em qualquer classe Deste modo, a definição da amplitude das classes e do limite inferior da primeira classes devem ser estabelecidos por forma que cada valor da variável estatística pertença exactamente a uma classe. Uma outra maneira de determinar o número de classes é a regra sugerida por Sturgos. K=1+3,3logn e ainda, , sendo n, o número de observações. Tabela 3: Distribuição das alturas dos alunos Alturas(em m) contagem fi [1,45; 1,50[ // 2 [1,50; 1,55[ //// 4 [1,55; 1,60[ //// 5 [1,60; 1,65[ //// // 7 [1,65; 1,70[ /// 3 [1,70; 1,75[ // 2 Total ---- n= 23 Tabela 4: Distribuição de frequências das alturas dos alunos Alturas(em m) Freq.Absoluta Freq.relativa Freq.Absol.acum. Freq.Relat.Acumul. [1,45; 1,50[ 2 2/23=0.09 ou 9% 23 1 ou 100% [1,50; 1,55[ 4 4/23=0.17 ou 17% 21 0.91 ou 91% [1,55; 1,60[ 5 5/23=0.22 ou 22% 17 0.74 ou 74% [1,60; 1,65[ 7 7/23=0.30 ou 30% 12 0.52 ou 52% [1,65; 1,70[ 3 3/23=0.13 ou 13% 5 0.22 ou 22% [1,70; 1,75[ 2 2/23=0.09 ou 9% 2 0.09 ou 9% n= 23 Nesta tabela encontram-se as respostas para as seguintes questões: 1 qual é o número de alunos com alturas maiores ou iguais a 1,65m? Resp.- há 5 alunos com altura de 1,65m ou mais. 2. qual é a percentagem dos alunos maiores ou iguais a 1,55m? Resp.- - 74% dos alunos têm alturas iguais a 1,55 ou mais; 3. quantos alunos têm alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m? Resp.- -há 4 alunos com alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m; 4. qual é a percentagem do alunos que têm uma altura de 1,60m ou compreendida entre 1,60m e 1,65m? Resp.- - 30% dos alunos têm altura de 1,60m ou compreendida entre 1,60m e 1,65m. Licao No 6 1.2.2 Gráficos de Distribuição de Frequências Os gráficos constituem uma outra forma de representar dados. Comparativamente as tabelas, os gráficos são mais atractivos e facilitam a apreensão da mensagem. Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas situações. Neste estudo referir-se-ão: gráficos de barras, histograma, polígono de frequências e gráfico circular. Gráficos de Barras Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados). Estes gráficos são empregues muita das vezes para estabelecer comparações. No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. A partir dos dados da tabela de frequências das idades dos alunos da 10ª classe, vamos construir o gráfico de barras. Histograma ou diagrama em colunas Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas(horizontal) representam-se as classes e no eixo das ordenadas(vertical) as frequências. Polígono de Frequências Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da classe e sua respectiva frequência absoluta simples correspondente (no histograma). Gráficos Circulares (sectograma) Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência correspondente. O gráfico circular costuma-se utilizar quando o número de categorias para a variável é pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer comparações entre diferentes valores do atributo em estudo. A amplitude de cada sector é determinada pela frequência relativa. Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos. Cor dos olhos Efectivos Azul Verde Cinzenta castanha 10 5 19 20 Vamos fazer uma tabela que nos permite calcular a percentagem e o ângulo correspondente a cada classificação. Cor dos olhos Efectivos (fi) Percentagem Ângulos (amplitude em graus) Azul `10 10/54=0,185… ou 18,5% 0,185x360o=66,66…=67º Verde 5 5/54=0,093 …ou 9,30% 0,093x360o = 33,33=33º Cinzenta 19 19/54=0,352… ou 35,2% 0,352x360o=126,66...=127º … castanha 20 20/54=0,370 …ou 37,0% 0,370x =1360o=133,33º …=133º n=54 Total=360º Distribuição da cor dos olhos de 54 pessoas Sumário Para organizar e representar dados, usam-se tabelas e gráficos. Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas situações. Podemos destacar os gráficos de barras, histograma, pictograma, polígono de frequências, sectograma ou polígono circular, etc… Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados). Estes gráficos são empregues muita das vezes para estabelecer comparações. No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. Os histogramas usam se para dados agrupados em classes. Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência correspondente. O gráfico circular costuma-se utilizar quando o número de categoriaspara a variável é pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer comparações entre diferentes valores do atributo em estudo. A amplitude de cada sector é determinada pela frequência relativa. Exercícios 1. Considera a seguinte distribuição de frequências, relativas as comissões ganhas no último mês pelos vendedores de uma dada empresa: Comissões (em centenas de contos) [0;2[ [2;4[ [4;6[ [6;8[ [8;10[ [10;12[ [12;14[ No de trabalhadores 2 3 7 16 7 3 2 Construa o histograma, o polígono de frequências e polígono de frequências acumuladas. 2.Inquéritos realizados em 20 residências de diversas universidades de um determinado país trevelaram os seguintes valores para o número de estudantes de gestão por residência: No de estudantes 0-10 10-20 20-30 30-40 No de Residências 2 4 9 5 a) Encontre as frequências absoluta, relativa, absoluta acumulada e relativa acumulada; b) Construa o histograma; 3. Os vencimentos mensais, em mil meticais, dos 40 funcionáriosde uma empresa são os seguintes: 18 18 20 22 21 18 19 20 23 18 19 20 21 18 17 19 20 18 22 19 18 24 20 18 19 18 22 21 20 19 17 18 21 18 18 19 18 18 18 18 a) Indique a população, a variável e a unidade estatística desta distribuição; b) Elabore um quadro de distribuição de frequências; c) Construa um gráfico de barras que defina esta distribuição; d) Elabore um relatório de 2 linhas sobre esta distribuição 1.3 Medidas de localizaçao Introdução No capítulo anterior discutimos sobre a organização e apresentação de dados. Neste capítulo, você vai aprender alguns parâmetros que representam os fenómenos pelos seus valores médios, ou seja, valores em torno dos quais tendem a concentrar os dados. Esses parâmetros irão lhe auxiliar na fase de análise e descrição do fenómeno estatístico, é o caso da média aritmética, moda, mediana e separatrizes. Ao completar esta unidade, você será capaz de: Objectivos · Determinar a média, moda, mediana, quartís,decís e percentís ; · Interpretar as medidas de localização Terminologia Neste capítulo, você deverá prestar muita atenção aos seguintes conceitos: · Média aritmética · Moda; · Mediana e · Separatrizes. Licao No 7 1.3.1 Média Aritmética () Emprega-se a média quando desejamos obter uma medida de posição de maior estabilidade e quando houver necessidade de tratamento algébrico ulterior. Chama-se média aritmética ou média de um conjunto de números x1, x2, x3, …,xn e representa-se por e definido por: · Para dados simples 1º ) Ex. As alturas de 5 árvores são: 2,3,2,4,5 m. Calcular a média das alturas das árvores. · Para dados classificados se x1, x2, x3, …,xm ocorrem f1,f 2,…, fn vzeses respectivamente. Exemplo: consideremos a variável idade (em anos) dos alunos da 10ª classe cuja a distribuição é dada pela tabela: Xi(idade) 13 14 15 16 17 Fi 2 7 9 3 2 idade média é 14,83. · Para dados ponderados As vezes, associam se os números x1, x2, x3, …,xka certos factores de ponderação ou pesos w1,w2,…,wk que dependem do significado ou importância atribuída aos números. Neste caso: Exemplo: Um aluno obteve no primeiro bimestre em Estatística, respectivamente, 6, 7 e prova final 8 e os pesos das provas são respectivamente¨3,2 e 5. Achar a média final do 1º bimestre. Média aritmética ponderada Como as frequências são números indicadores da intensidade de cada valor, elas funcionam como factores de ponderação. · Para dados agrupados em classe =; ou Pmi=li+hc/2 onde, Pmi é o ponto médio de cada classe também chamado marca de classe é igual a semi-soma dos extremos da classe. Li –limite superior da classe li- limite inferior da classe e hc- amplitude da classe. Ex.Consideremos a variável altura(em metros) dos alunos de uma turma da 10ª classe. Alturas(em m) fi Xi fiXi [1,45; 1,50[ 2 1,475 2,95 [1,50; 1,55[ 4 1,525 6,10 [1,55; 1,60[ 5 1,575 7,875 [1,60; 1,65[ 7 1,625 11,375 [1,65; 1,70[ 3 1,675 5,025 [1,70; 1,75[ 2 1,725 3,45 n= 23 36,775 Pi= ,etc. = Para além da média aritmética, existem outros tipos de média como: média harmónica, média geométrica e média quadrática. 1.3.2 MEDIANA (Me) Mediana é um valor central de um rol, isto é, o valor que divide um conjunto de dados ordenados (crescente ou decrescente) em duas partes iguais. E representa-se por: Me ou Md ou . Sejam x1,x2,x3,…,xn, n dados estatísticos ordenados, se: · n é ímpar, o valor da variável que ocupa a posição central(mediana) é Me=Xk, com - posição do elemento mediana. · n é par, ; e Exemplo: Para dados simples Consideremos dois conjuntos de elementos: A={2,7,13,5,9,15,22} e B={7,16,2,10, 5,9} Determinemos a mediana de cada conjunto. Para o conjunto A: 1º ordenar os dados: A={2, 5, 7, 9, 13, 15, 22} 2º como n é impar, =, X4=Me=9 Para o conjunto B: 1º ordenar os dados: ={2, 5, 7,9, 10, 16} 2º neste caso, n é par, e k2=k1+1=3+1=4 assim, x3=7 e x4=9 Dados em tabelas não agrupados 1- se n é ímpar, Consideremos a tabela das idades dos alunos da duma turma da 10ª classe Idade(em anos) Xi Frequência fi Fi 13 2 2 14 7 9 15 9 18 16 3 21 17 2 23 n=23 , o número 12 indica a posição do elemento mediana e procura-se na Fi. E nesta posição encontramos a idade 15. Porque de 10 a 18 encontramos uma sequência de 15 2- se n é par Consideremos os dados da seguinte tabela: xi Fi Fi 33 6 6 45 11 17 87 17 34 88 9 43 91 5 48 N=48 e k2=k1+1=24+1=25. como se pode ver na tabela, de 18 a 34 encontramos uma sequência de 87 isto significa que na posição 24 e 25 temos o mesmo valor ou seja X24=X25=87 assim, coincidentemente, . Dados em tabelas agrupados em classe Para calcular a mediana em dados agrupados em classes usa-se a expressão onde lMe-limite inferior da classe mediana; - elemento mediano, n, pode ser par ou ímpar. ; fme- frequência absoluta da classe mediana h- amplitude da classe mediana, Fi ant-frequência absoluta acumulada a anterior a classe mediana. Ex. Consideremos a tabela-4 das alturas dos alunos da 10ª classe Alturas(em m) fi Fi [1,45; 1,50[ 2 23 [1,50; 1,55[ 4 21 [1,55; 1,60[ 5 17 [1,60; 1,65[ 7 12 [1,65; 1,70[ 3 5 [1,70; 1,75[ 2 2 n= 23 =23/2 =11,5, é o elemento mediano que indica a posição da classe mediana, e observando na tabela a coluna de Fi podemos ver que de 6 a 12 temos uma sequência da classe [1,60;1,65[. Logo na posição 11,5 temos classe mediana [1,60; 1,65[; lMe.=1,60, fMe-=7, h=0,05, Fi ant=5 1.3.3 MODA, NORMA OU MODO (MO) Chama-se moda de um conjunto de n dados, x1, x2, x3, …., xn, de uma variável estatística, ao dado que ocorre com maior frequência e representa se por Mo. Karl Pearson foi quem a introduziu em Estatística pela primeira vez no sec.XIX. No caso de idades, a moda é 15 anos. Para um conjunto de dados, pode existir mais do que uma ou até nem existir moda. · se num conjunto de dados existir uma moda, diz-se unimodal · se o conjunto de dados tiver duas modas, ele diz se bimodal · se o conjunto de dados tiver mais que duas modas, ele diz se multimodal ou plurimodal · se o conjunto de dados não tiver modas, ele diz se amodal. Ex. 4,1,3,5,7,4,3,1,5,7. Para dados agrupados em classes, utilizamos diversos processos na sua obtenção. Mas o primeiro passo é identificar a classe modal. Moda bruta É o processo mais elementar, basta tomar o ponto médio da classe modal. Processo de Czuber Leva em consideração as frequências anteriores e posteriores `a classe modal. ou seja: Onde: Moc- moda (processo de czuber); 1=fmax-fant ( diferença entre a frequência modal e a imediatamente anterior); 2=fmax-fpost (diferença entre a frequência modal e a imediatamente posterior); h- amplitude de classe; xMo- limite inferior da classe modal. Utilizando o processo gráfico,basta para isso, identificar a frequência absoluta da classe modal e as frequências absolutas simples anterior e posterior das duas classes adjacentes e seus respectivos limites inferior e superior. 0 xMoMo LMo classe Ex. Calcular a moda pelo processo Czuber, usando os dados da tabela das alturas dos alunos da 10ª classe. Dados: fmax=7; fant=5; fpost=3, xMo =1,60m , h=0,05m Numero de alunos ( 7 ) ( 6 ) ( 5 ) ( 4 ) ( 3 ) ( 2 ) ( 1 ) ( 1,45 ) ( 1,50 ) ( 1,55 ) ( 1,60 ) ( 1,65 ) ( 1,70 ) ( 1,75 ) Altura(m) Mo=1,62m Processo de King É considerada a influência sobre a classe modal das frequências das classes anterior e posterior. onde Mok- moda (processo de King); fpost- frequência absoluta simples posterior; fant- frequência absoluta simples anterior. Graficamente post. 0 xMo Mo LMo classe ant. Ex.: De acordo com os daos da tabela as alturas temos: fant=5; fpost=3, lMo =1,60m , h=0,05m Distribuição das alturas dos alunos da 10ª classe Número de alunos ( 1,45 1,50 1,55 1,60 1,70 1,75 ) ( 7 ) ( 6 ) ( 5 ) ( 4 ) fantt ( 3 ) ( 2 ) ( 1 ) ( 1,65 ) Altura(m) Fpost Mo=1,62m Processo de Pearson Este processo pressupõe que a distribuição seja aproximadamente simétrica, na qual a média aritmética e a mediana são levados em consideração. Obs. Nem sempre coincidem os valores da moda usando os diferentes processos. Nos dados agrupados em classe a moda é um valor provável dentro da classe modal comportando portanto uma certa margem de erro. 1.3.4 CONSIDERACÕES GERAIS SOBRE A MÉDIA, A MODA E A MEDIANA. A média é a medida de localização mais utilizada, embora em certos casos, a utilização da mediana ou da moda seja preferível. · A média é muito sensível a valores extremos; isto é, quando alteramos drasticamente de um dos dados a média varia consideravelmente. a)50 85 60 65 60 65 60 80 60 =65 b) 50 85 60 65 60 65 195 80 60 =80 · A mediana é preferível à média quando se está interessado em conhecer o ponto médio da distribuição, aquele valor que divide um rol de dados em duas partes iguais. · A moda revela a sua importância perante o estudo de caracteres qualitativos, já que tanto a média como a mediana são medidas aplicáveis apenas a caracteres quantitativos. A importância das medidas consideradas está dependente do tipo de variável estatística, da distribuição dos dados e do objectivo que se tem em vista. Das três medidas acima referidas, a mais importante é a média seguida da médiana e finalmente a moda. Na maioria dos estudos, o conhecimento das 3 medidas proporciona uma melhor descrição do fenómeno ou acontecimento. Vejamos resumidamente que relação existe entre estas três medidas quando temos representação através de um polígono de frequências. Curva Simétrica Curva Assimétrica Curva Assimétrica Positiva Negativa Me=Mo >Me>Mo <Me<Mo Em termos gráficos a curva simétrica apresenta as duas caudas com a mesma configuração. Neste caso, a distribuição diz-se normal e a média, mediana e a moda coincidem. Exemplo: Consideremos o problema dos vencimentos ( em milhares de meticais) dos empregados da empresa X. verifique se a distribuição é simétrica ou assimétrica: 500 700 600 600 1500 1700 2600 700 600 2000 600 ________________________________________________ Resolução: vencimentos Fi Fi 500 1 1 600 4 5 700 2 7 1500 1 8 1700 1 9 2000 1 10 2600 1 11 N=11 1º Tabela de frequências: 2º Média 3º Moda Mo=600 4º Mediana N é ímpar, assim, Me=X6=700 5º >Me>Mo, a distribuição é assimétrica positiva. Também se pode dizer que há muitos trabalhadores que recebem a baixo da média. Exercicios 1. As classificações obtidas, no 1º teste deste ano pelos 150 alunos do 2º ano de Ensino Básico de na disciplina de Estatística distribuem se da seguinte forma: Classificações: 7 8 9 10 11 12 13 14 15 16 17 No de alunos: 5 11 14 19 . 20 30 18 9 12 8 4 a) Indique a população e a variável estatística em estudo; b) Calcule a frequência relativa da classificação 8. c) Indique a percentagem de alunos que tiveram nota inferior a 10; d) Determine a nota média, a nota modal e a nota mediana. 2. . O chefe de estacão dos Caminhos de Ferro de uma dada localidade registou o atraso dos comboios, durante uma semana na seguinte tabela: Determine: A média, a moda e a mediana de atrasos. No. de minutos de atraso 0-5 5-10 10-15 15-20 20-25 25-30 No de combois 6 5 7 4 2 4 Licao No 8 1.3.5 Medidas separatrizes ( quartis, decis e Percentis) Os quartis são os valores que dividem um rol de dados em quatro partes iguais. X1 Q1 Q2=Me Q3 xn Q1(1ºquartil): é o valor que divide a sequência em duas partes de tal modo que, pelo menos, ¼ ou 25% das observações sejam inferiores ou iguais a esse valor e ¾ ou 75% das observações sejam superiores ou iguais a esse valor; Q2(2ºquartil): é o valor que divide a sequência em duas partes iguais de tal modo que , pelo menos, ½ ou 50%das observações sejam inferiores ou iguais a esse valor e 1/2 ou 50% das observações sejam superiores ou iguais a esse valor; o Q2 coincide com a mediana. Q3(3ºquartil):é o valor que divide a sequência em duas partes de tal modo que, pelo menos, ¾ ou 75% das observações sejam inferiores ou iguais a esse valor e ¼ ou 25% das observações sejam superiores ou iguais a esse valor; Os quartis proporcionam-nos informações acerca da distribuição interna dos dados. Cálculo de quartis Calcula-se qualquer dos quartis de forma idêntica ao cálculo da mediana, substituindo-se na fórmula desta, apenas a posição em que se encontra o elemento desejado. · Dados não agrupados em classe A posição do elemento quartil no conjunto ordenado é identificado pela expressão, , (i= 1,2 e 3); n é nº de observações. Ex1: dada a tabela seguinte calcular Q1, Q2 e Q3. ( Resolução: Q1-? Q1 1º) Q2 Q1 está entre x 5 e x 6 mas x 5 =x 6 =1, logo Q1=1 Q3 ou seja: Q1=x 5 +(x 6 -x 5 ).0,75=1+(1-1).0,25=1+0=1 2º) Q2-? ) xi Fi Fi 0 1 1 1 5 6 2 7 13 3 6 19 4 2 21 5 1 22 6 1 23 N=23 Q2 está entre x11 e x12mas logo Q2=2 ou seja: Q3? Q3 está entre e mas x17=x18=3 logo Q3=3 ou seja: Q3=x17+(x18-x17).0,75=3+(3-3).0,75=3+0=3 Ex2:Determinar a faixa salarial(distância do 1º ao 3º quartil) de 6 funcionários de certa empresa que ocupam o mesmo cargo. Salários em Mt: 5.500, 5.780, 6.120, 6.150, 6.620, 7.120. 1º) mas x1=5.500 e x2= 5.780 Q1=x1+(x2-x1).0,5 = 5.500+(5.780-5.500).0,5=5.640 Mt 2º) , x4= 6.150 e x5= 6.620. Q3= x4+(x5-x4).0,5 =6.150+(6.620-6.150).0,5=6.385 Mt Portanto a faixa salarial dos seis funcionários é de (5.640 a 6.385)Mt. · Para dados agrupados em classe A posição do elemento quartil no conjunto ordenado é identificado pela expressão, , i= 1,2 e 3; n é nº de observações. E li- limite inferior da classe de Qi; fclasse- frequência da classe do Qi. ( Resolução: Q1 1º) ; ; Q2 2º) , h=2, =27 e f Q1 =16 Q3 )Ex. Consideremos a tabela das notas dos alunos de 4 turmas da 8ªclasse. Calculemos Q1, Q2 e Q3. Notas fi Fi [0;2[ 27 27 [2;4[ 16 43 [4;6[ 34 77 [6;8[ 17 94 [8;10[ 16 110 N=110 Interpretação a) para Q1=2,06significa que em nosso exemplo, 25% dos alunos obtiveram nota 2,06 ou menos; b) para Q2=4,7 significa que 50% dos alunos obtiveram notas 4,7 ou menos; c) para Q3=6,65 significa que 75% dos alunos obtiveram notas 6,65 ou menos. Diagrama de Extremos e Quartis (Box-Plot ou Caixa de Bigod) Quando uma distribuição é marcadamente assimétrica, tem interesse organizar um diagrama de extremos e quartis. Uma vez calculados os quartis e considerando os valores extremos; isto é, o valor máximo e mínimo de uma variável estatística, podemos construir o diagrama de extremos e quartis, vejamos um exemplo: Calcular Q1, Me e Q3 d conjunto de notas de cada uma das disciplinas: Matemática: 2 5 8 8 8 9 11 11 12 13 14 Geografia: 4 7 89 11 14 15 16 16 17 18 História: 5 9 10 10 1112 12 12 13 14 14 Q1 Me=Q2 Q3 Para construir diagrama de extremos e quartis, começamos por desenhar uma linha vertical onde assinalamos os valores da variável. Primeiro, marcamos na linha, os valres extremos máximo e mínimo e, em seguida, assinalámos Q1, Me e Q3. construimos a «caixa» ou seja «Box-Plot» correspndente a intervalo de extremos Q1 e Q3. Os diagramas de extremos e quartis permitem uma visualização da distribuição das notas nas três disciplinas, pondo em distaque: 1- diferença na amplitude total( na História há menor diferença na amplitude total); 2- diferença na Mediana ( o valor central mais elevado diz respeito à disciplina de Geografa); 3- diferença nos intervalos interquartis(Q3, Q1 dentro de cada «caixa»estão pelo menos 50% das classificações respectivas; 4- na disciplina de História( a «caixa» é mais pequena ) existe uma maior concentração de 50% das notas em torno da mediana; 5- nas disciplinas de Geografia e História há uma grande concentração de valores acima da mediana; 6- na disciplina de Matemática há uma maior dispersão das notas inferiores ou iguais a Q1 do que das notas superiores ou iguais a Q3. Notas ( 18 16 14 12 10 8 6 4 2 0 0 0 Matemática Geografia História ) Decil (Di) Divide a distribuição em dez partes iguais em um conjunto ordenado de valores. Assim podemos ter: D1, D2, D3,....., D9. Para dados agrupados em classe Façamos, onde i=(1,2,3,..., 9), asim: Exemplo: Com os dados da tabela anterior, de notas dos alunos das 4 turmas da 8ªclasse, determinar D2, D5 e D7. As posisões dos elementos desejados são: ªposição, ªposição ª posição ; ; Interpretação · Para D2=1,63 significa, em nosso exemplo que 20% dos alunos obtiveram notas 1,63 ou menos; · Para D5=4,70 significa que 50% dos alunos obtiveram notas 4,7 ou menos; · Para D7=6,00 significa que 70% dos alunos obtiveram notas 6,0 ou menos. Centil ou Percentil (Ci) Divide a distribuição em cem partes iguais em um conjunto ordenado de valores. Assim podemos ter: C1, C2, C3,....., C99. Para dados agrupados em classe Façamos, onde i=(1,2,3,..., 99), asim: Exemplo: Ainda com base na tabela do exercicio anterior, determinar C25, C50 e C75 e fazer a respectiva interpretação. ªposição; ªposição; ªposição ; ; Interpretação · Para C25=2,06 significa, em nosso exemplo que 25% dos alunos obtiveram notas 2,06 ou menos; · Para C50=4,70 significa que 50% dos alunos obtiveram notas 4,7 ou menos; · Para C75=6,65 significa que 75% dos alunos obtiveram notas 6,65 ou menos. Obs:Calcula-se qualquer dos quartis, decil e centil de forma idêntica ao cálculo da mediana, substituindo-se na fórmula desta, apenas a posição em que se encontra o elemento desejado Exercício Um professor de Português obteve para o mesmo teste os seguintes resultados, em duas turmas (o teste foi cotado de 0 a 20). Turma -1: __________________________________ 10 13 16 17 18 12 12 13 14 14 15 16 16 17 17 17 18 17 18 ---------------------------------------------------- Turma-2: ____________________________________ 3 18 5 7 9 12 13 12 10 8 8 12 10 6 9 11 17 12 13 ------------------------------------------------------ a) escreve as classificações, por ordem crescente, para cada uma das turmas. b) Determine a mediana, o 1º quartil e o 3º quartil para cada uma das turmas. c) Indique a amplitude total e a amplitude interquartis da turma -1. d) Elabore os respectivos diagramas de extremos e quartis e interprete-os, referindo: · A posição relativa a mediana; · A distriuição das notas no intervalo interquartis. Sumário Emprega-se a média quando desejamos obter uma medida de posição de maior estabilidade e quando houver necessidade de tratamento algébrico ulterior. Para além da média aritmética, existem outros tipos de média como: média harmónica, média geométrica e média quadrática. Mediana é um valor central de um rol, isto é, o valor que divide um conjunto de dados ordenados (crescente ou decrescente) em duas partes iguais. E representa-se por: Me ou Md ou . Chama-se moda de um conjunto de n dados, x1, x2, x3, …., xn, de uma variável estatística, ao dado que ocorre com maior frequência e representa se por Mo. Karl Pearson foi quem a introduziu em Estatística pela primeira vez no sec.XIX. Para dados agrupados em classes, utilizamos diversos processos na sua obtenção. Mas o primeiro passo é identificar a classe modal. Moda bruta é o processo mais elementar, basta tomar o ponto médio da classe modal. Processo de Czuber, leva em consideração as frequências anteriores e posteriores `a classe modal. Processo de King é considerada a influência sobre a classe modal das frequências das classes anterior e posterior Processo de Pearson, este processo pressupõe que a distribuição seja aproximadamente simétrica, na qual a média aritmética e a mediana são levados em consideração. Obs. Nem sempre coincidem os valores da moda usando os diferentes processos. Nos dados agrupados em classe a moda é um valor provável dentro da classe modal comportando portanto uma certa margem de erro. A média é a medida de localização mais utilizada, embora em certos casos, a utilização da mediana ou da moda seja preferível. A importância das medidas consideradas está dependente do tipo de variável estatística, da distribuição dos dados e do objectivo que se tem em vista Na maioria dos estudos, o conhecimento das 3 medidas proporciona uma melhor descrição do fenómeno ou acontecimento. Os Quartis são os valores que dividem um rol de dados em quatro partes iguais Q1,Q2 e Q3. Os quartis proporcionam-nos informações acerca da distribuição interna dos dados. Os Decis, dividem a distribuição em dez partes iguais em um conjunto ordenado de valores. Assim podemos ter: D1, D2, D3,....., D9. Centil ou Percentil (Ci), dividem a distribuição em cem partes iguais em um conjunto ordenado de valores. Assim podemos ter: C1, C2, C3,....., C99. Exercicios de Auto-avaliação 1. Na figuraque está representado um histograma que mostra a pontuação obtida num exame escrito. Terão de prestar o exame oral os alunos que obtiveram pontuação inferior a 70. ( No. de Estudantes ) ( Resultados de um exame ) ( 2 ) ( 6 ) ( 4 )no 10 20 30 40 50 60 70 80 90 pontuacão a) quantos alunos dispensaram do exame oral? b) qual a percentagem de alunos que obtiveram pontuação inferior a 50? 1. Construa umgráfico circular indicando a percentagem relativa a cada sector de acordo com os dados da tabela que indica tipo de transporte utilizado por 90 pessoas, quando se deslocam para o trabalho: Meio de transporte No. de pessoas Carro 32 Autocarro 38 Comboio 12 Motorizada 6 2. Os empregados do ministério do Turismo estão num sistema de horário flexível: eles podem começar seu dia de trabalho às 7h, 7:30h, 8h, 8:30h ou 9h. Os seguintes dadosapresentam uma amostra de horário de início escolhido pelos empregados: 700h 8:30h 9:00h 8:00h 7:30h 7:30h 8:30h 8:30h 7:30h 7:00h 8:30h 8:30h 8:00h 7:30h 8:30h 7:00h 9:00h 8:30h 8:00h 8:00h Sintetize os dados construindo: a) Distribuição de frequência; b) Gráfico de barras; c) O que os sumários revelam sobre as preferências dos empregados quanto ao sistema de horário flexível? 3. uma amostra de estudantes, que completaram um curso em estatísticas de negócios durante a primavera de 1998, forneceu as seguintes respostas sobre o que teriam achado do curso. Para auxiliar o processamento dos resultados via computador foi usada uma escala numérica em que 1=fraco, 2=regular, 3=bom, 4= óptica, 5=excelente. 4 4 5 1 5 3 4 5 2 4 5 5 2 4 3 4 5 5 3 5 2 4 3 4 5 4 3 5 3 3 5 4 2 5 4 2 4 4 5 3 4 3 4 4 4 5 5 4 1 4 4 3 5 3 3 3 4 a) comente porque estes dados são qualitativos; b) apresenta uma tabela de frequências e um gráfico de barras c) com base a alínea anterior comente a avaliação global do curso feito pelos estudantes. 4. Num teste de automobilismo de distância e de consumo de gasolina, 13 automoveis foram atestados por 300km em estrada, nas mesmas condições de direcção na cidade e no campo. Os seguintes dados foram registados para o desempenho milhas por galão. Cidade: 16,2 16,7 15,9 14,4 13,2 15,3 16,8 16,0 16,1 15,3 15,2 15,3 16,2 Campo: 19,4 20,6 18u,3 18,6 19,2 17,4 17,2 18,6 19,0 21,1 19,4 18,5 18,7 Use a média, mediana e moda para fazer um relatório sobre a diferença no desempenho para a condução na cidade e no campo. 5. O gráfico circular ao lado, representa a distribuição, por ramos de actividade, de 936 empregados de uma empresa. Empregados por ramo de actividade a) Em que ramo de actividade há mais empregados? b)Construa com os dados do gráfico uma tabela de efectivos e frequências relativas. c)Qual é a percentagem de empregados na parte dos transportes? d)Construa um gráfico de barras que indique as percentagens de empregados em cada um dos ramos de actividade. 6. Os gráficos seguintes mostram a mesma informação. No entanto, eles apresentam uma imagem diferente. Um deles foi apresentado pela administração e outro pelo delegado sindical de uma empresa numa reunião de renovação do contrato salarial. Vendas 1º semetre 2007 ( Grafico B ) a) Mencione qual dos gráficos teria apresentado o delegado sindical para pedir aumento. Justifique. b) Qual foi a estratégia usada para dar a mesma informação de uma forma aparentemente diferente? 7. Cinco números tem média 6. se juntarmos um sexto numero ao conjunto, a média passa a ser 7. qual foi o número que se adicionou? 8. Numa turma há 12 rapazes e 13 raparigas. A média dos pesos dos rapases é 65kg e a das raparigas é 61kg. Determine o peso médio dos alunos da turma. 9. Numa associação desportiva, a altura média dos seus 200 atletas é de 1,65m. as atletas femeninas são 110 e têm altura média igual a 1,60m. determine a altura média dos homens. 10. A média das idades de um grupo de seis alunos da 10ª classe é 16 anos e 5 meses. A este grupo juntou-se mais um aluno e a média passou para 16anos e 7 meses. Determine a idade do novo aluno. 11.A partir das classificações obtidas na disciplina de inglês pelos alunos de uma turma de 7º ano, calcularam-se as frequências relativas das diferentes classificações e obtiveram-se os seguintes valores da tabela: Classificação(nível) 1 2 3 4 5 fri 0,05 0,20 0,45 0,20 0,10 a) calcula com aproximação às unidades, a classificação média dos alunos da turma na disciplina de inglês; b) determina a moda e a mediana das classificações. 12. O chefe de estacão dos Caminhos de Ferro de uma dada localidade registou o atraso dos comboios, durante uma semana na seguinte tabela: Determine: A média, a moda e a mediana de atrasos. No. de minutos de atraso 0-5 5-10 10-15 15-20 20-25 25-30 No de combois 6 5 7 4 2 4 1.4 Medidas de Dispersao Introdução No capítulo das Medidas de Dispersão, vai tratar de estudar o fenómeno da variabilidade em dados estatísticos, você vai perceber até que ponto o resultado estatístico é seguro com o cálculo de amplitude de distribuição, desvio - médio, variância, desvio-padrão e coeficientes de variação. Estes parâmetros também vão auxiliar na fase de análise e descrição do fenómeno estatístico. Ao completar este capitulo , você será capaz de: Objectivos · Calcular a amplitude, desvio-médio, variância, desvio-padrão e coeficientes de variação; · Analisar e interpretar medidas de dispersão descrevendo-os e tirar conclusões; · Elaborar um relatório preliminar sobre o fenómeno estatístico observado. Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · Tabela de cálculos auxiliares · Amplitude total, desvio-médio, variância, desvio-padrão e coeficientes de variação Licao No 9 1.4.1 Amplitude Total (At) A amplitude total é a diferença entre o maior e o menor valor de um rol de dados. Se os dados estão agrupados em classe, podemos utilizar dois processos na sua obtenção: a) a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira, b) também pode-se calcular através da diferença entre o ponto médio da última classe e o ponto médio da primeira classe. Obs:Para os dois processos o resultado terá uma pequena diferênça. At=Li-li Ex: 0, 6, 8, 4, -1, 10. At=10-(-1)= 10+1=11 Tanto a amplitude dos dados como os valores extremos, não constituem por si só medidas estatísticas seguras para avaliar a dispersão dos dados, por duas razões principais: 1. são insensíveis a qualquer variação dos valores intermédios, visto que não levam em consideração as flutações apresentadas em relação aos valores internos da distribuição. 2. a presença de uma única observação muito alta ou muito baixa, tem uma grande influência sobre os seus valores. Exemplo: 70 75 80 85 90 95 100 70 75 80 85 90 95 100 70 75 80 8590 95 100 As distribuições têm a mesma amplitude e são diferentes. ( Menor dispersão Maior dispersão ) 1.4.2 Desvio- Médio (Dm) É a média dos valores absolutos dos desvios dos dados, a partir da média. · Para dados não agrupados · Para dados agrupados e ponderados N.B. quanto maior for o desvio- médio, maior é o afastamento dos valores observados em relação à média ou seja, maior é a dispersão dos dados. Ex. Seja x=, calcular Dm. 1.4.3 Variância Os matemáticos procuram uma fórmula que nos permite avaliar a dispersão relativamente à média sem que aparecesse o símbolo do valor absoluto; isto é, uma fórmula em que o aparecimento de números negativos foi resolvido com «o elevar ao expoente 2»; isto é: (xi-)2. A variância de um conjunto de dados x1, x2, ...., xn, representa se por ou S2 , quando se refere a população e amostra respectivamente. E calcula-se: Para dados não agrupados População: ; Amostra: Para dados agrupados e ponderados População:; Amostra: 1.4.4 Desvio- Padrão É a raiz quadrada positiva da variância e representa-se por ou S, para população e amostra respectivamente. Para dados não agrupados População: Amostra: Para dados ponderados e agrupados em classe População: Amostra: O desvio- padrão é a medida de dispersão mais usada. Para grande valor (n>30) não há praticamente diferença entre as duas definições de e S2. quando necessária melhor estimativa use sempre S2 para variância e S para o desvio -Padrão. 1.4.5 Interpretação do Desvio - Padrão Quanto maior for o desvio- padrão, maior será a dispersão dos valores relativamente à média. Combinando o conhecimento da média e do desvio- padrão, podemos em muitas situações caracterizar a localização e a dispersão dos valores. Quando a distribuição é normal (simétrica), isto é, , temos as seguintes estimativas: 68,3% das observações em 95,5% dasobservações em 99,7% das observações em Na prática a maioria das distribuições apresentam este comportamento.assim, por exemplo, se numa distribuição encontramos média 30 e o desvio padrão 4, podemos esperar que cerca de: · 2/3 dos valores estejam entre 26 e 34 · 95% dos valores estejam entre 22 e 38 · 99% dos valores estejam entre 18 e 42. Ex1: A tabela junta mostra as classificações obtidas por 100 alunos numa prova de Matemática: Classificações 2 5 8 10 11 12 13 14 16 18 Efectivos 3 8 10 30 13 16 8 7 3 2 Calcular: a) a média das classificaões; b) o desvio padrão c) a percentagem de alunos cuja classificação está entre o intervalo Resolução: a) 1º construimos tabela de xi, fi, fi.xi, e fi.xi2: xi fi Fi.xi Fi.xi2 2 3 6 12 5 8 40 200 8 10 80 640 10 30 300 3000 11 13 143 1573 12 16 192 2304 13 8 104 1352 14 7 98 1372 16 3 48 768 18 2 36 648 onde assim:, b) mas assim, o desvio padrão é: c) portanto, o intervalo referido é:]4,45; 16,49[, só as classificações de 2 e 18 estão fora deste intervalo. Logo, 3+2=5 alunos têm classificações que não pertencem ao intervalo. Como tinhamos 100alunos, temos que 95% dos alunos têm classificação dentro do intervalo.Trata se duma distribuição próxima da normal se formos a comparar com os resultados já estabelecidos. Ex2: um jardineiro mediu em centímetros, 50 plantas no dia em que as plantou. Os dados estão registados na tabela a baixo. Calcule a percentagem de plantas cujas alturas pertencem ao intervalo classe Ponto médio da classe( Xi) fi [3,5; 9,5] 6,5 5 [9,5; 11,5] 10,5 25 [11,5; 14,5] 13 11 [14,5; 18,5] 16,5 9 Resolução: Calculemos: , ; ; , Calculemos o número de plantas cujas alturas estão entre os valores: 11,73-2,818=8,912=8,91 11,73+2,818=14,548=14,55 Assim temos: ]8,91; 14,55[ estarão neste intervalo todas as plantas das classes [9,5; 11,5[ e [11,5; 14,5[ e algumas plantas das clases [3,5; 9,5[ e [14,5; 18,5[. · Calculemos o numero de plantas da classe[3,5; 9,5[ que pertencem a ]8,91; 14,55[ 8,91[3,5; 9,5[ e a amplitude deste intervalo=9,5-3,5=6 e o número de plantas desta classe =5, assim o valor aproximado calcula-se: · Calculamos o número de plantas da classe [14,5; 18,5[que pertencem ao intervalo ]8,91; 14,55[. 14,55[14,5; 18,5[ e a amplitude deste intervalo 18,5-14,5=4 e, o número de plantas desta classe=9. Assim o valor aproximado de plantas · Conclusao: 0,49+25+11+0,11=36,6 O número total de plantas cujas alturas pertencem ao intervalo pedido =36,6 em percentagem, temos: 1.4.6 Relações Empíricas Entre as Medidas de Dispersão Para as distribuições moderadamente desviadas, há fórmulas empíricas: Desvio- médio(Dm)=4/5(desvio padrão); Amplitude semi-inter-quartilica=2/3(desvio- padrão). Essas expressões resultam de ter sido determinado para as distribuições normais, que o Desvio médio eAmplitude semi-inter-quartilica são iguais respectivamente, a 0,7979 e 0,6745 vezes o desvio- padrão. 1.4.7 Dispersão absoluta e relativa. Coeficiente de Variação A variação ou dispersção real, determinada a partir do desvio-padrão, ou qualquer outra medida de dispersão, é denominada dispersão absoluta. Dispersão relativa Se a dispersão absoluta é o desvio-padrão e a média é a aritmética , a dispersão relativa é denominada coeficiente de variação de Pearson (CVp) ou de dispersão, dado por: ou É mais utilizado quando desejamos comparar diversas grandezas com unidades de medidas que podem ser iguais ou diferentes. Ou ainda quando apresentam médias diferentes, embora suas unidades de medidas sejam iguais. Exemplo: Suponha que determinado que determinado fornecedor A, de parafusos tenha enviado ao Departamento de compras de uma empresa uma amostra de 2000 parafusos, com medidas de seu comprimento em mm variando entre 101 e 113mm.O Departamento de compras efectuou uma análise em suas médias e calculou seu respectivo desvio-padrão, encontrando as seguintes especificações: · Comprimento médio do parafuso: 107,9mm · Desvio-padrão do comprimento do parafuso: 2,72mm Admitindo-se um fornecedor B, que apresentou um lote deste mesmo parafuso com o mesmo número de peças, com média e desvio-padrão S=1,08mm, qual é o lote que você escolheria se fosse o comprador? Resolução: Fornecedor A: Fornecedor B: Resp: iria escolher o lote do fornecedor B que apresenta menor dispersão relativa do que o lote do fornecedor A. Conforme seus valores, podemos ter as seguintes classificações de coeficiente de vaiação: · baixa dispersão · média dispersão · alta dispersão 1.4.8 Variável reduzida, Escores reduzidos A variável que mede o desvio em relação à média, em unidades de desvio-padrão, é denominada variável reduzida e é a quantidade abstrata ( i.e., independe das unidades usadas). Se os desvios em relação à média forem dadas em unidades de desvio-padrão, diz-se que estão expressos em unidades reduzidas ou esores reduzidos. A variável reduzida ou escore Z(tipificação), permite comparar rendimentos de populações ou indivíduos. p.ex salário de dois indivíduos. Maior escore Zimplica melhor rendimento. Ex.1: em um exame final de Estatística, o grau médio de ium grupo de 150 estudantes foi 78 e o desvio- padrão 8,0. Em Álgebra , entretanto, o grau médio final do grupo foi 73 e o desvio-pardrão 7,6. Um estudante obteve os graus 73 em Estatística e 71 em Álgebra. a) Em que matéria foi maior: i. a dispersão absoluta; ii. a dispersão relativa b) Em qual dos exames foi mais elevada a sua posição relativa (rendimento)? Resp: a) i. Estatística; ii. Álgebra; b) Álgebra 1.5 DISTRIBUIÇÕES BIDIMENSIONAIS Introdução No capitulo sobre Correlações e regressão simples ( distribuições bidimensionais), você vai poder compreender como relacionar duas variáveis e validar o resultado num estudo estatístico. Vai saber como representar esta relação graficamente (recta de regressão) e como interpretar. Ainda vai poder calcular (estabelecer) a intensidade da relação entre duas variáveis com base na covariância, coeficiente da correlação e coeficiente de determinação. Ao completar esta unidade, você será capaz de: Objectivos · Determinar a relação entre duas variáveis estatísticas através de cálculo de certas grandezas e graficamente; · Estimar a equação de regressão linear. · Calcular e interpretar o coeficiente de determinação. Terminologia Neste capítulo, você deverá prestar muita atenção aos seguintes conceitos: · Diagrama de dispersão · Covariância · Coeficiente de correlação linear; · Coeficiente de determinação · Recta de regressão linear. Licao No 10 No estudo da Estatística até agora desenvolvido observamos um conjunto e atribuímos a cada observação um número (ou modalidade).Distribuições deste tipo que envolvem observações de uma única variável chamam-se unidimensionais. Se ao fazermos uma observação atribuirmos a cada elemento um par ordenado de valores , temos uma variável estatística bidimensional. No estudo de uma distribuição bidimensional, procura-se saber se existe alguma relação entre as duas variáveis. Exemplo: pergunta-se a cada aluno de uma turma: a)A nota de Matemática obtida na 9ªclasse e a nota do 1º teste de Geografia. b) A temperatura média anual e latitude das capitais dos países da CE. c) O seu peso em Kg e altura em centímetros. Não procuraremos relacionar as variáveis como sexo e a nota de Matemática, pois, à partida, não existirá qualquer dependência estatística. Quando afirmamos que duas coisas estão relacionadas, podemos querer dizer que existe entre elas uma conexão bem definida e invariável ou, diferentemente , que a ligação é mais indefinida e algo variável. Por exemplo a área de um quadrado e o comprimento do seu lado estão relacionados. A relação que os liga é bem definida, invariável e pode traduzir-se pela expressão matemática:, em que A, representa a área e , o lado. A relação entre área e o lado do quadrado também chamada relação funcional, permite determinar, com a precissão desejada, a área do quadrado a partir do comprimento do seu lado ou o comprimento do seu lado a partir da sua área. Já no caso de um estudo entre as idades dos cônjuges na data de casamento, a idade do marido não pode ser determinada com ixactidão a partir da idade da mulher. O que pode dizer-se é que, em média, quanto mais velho for o homem mais velha será também a mulher. Trata-se agora, de uma relação menos precisa, mais vaga e sujeita a variações, pois, em alguns casos, o marido pode ser mais novo ou ter a mesma idade da mulher. São estas as relações com interesse para o estudo estatístico e que se designam por relações estatísticas. Assim, perante dois fenómenos quaisquer, podemos afirmar que ou estão ligados através duma relaão funcional ou de uma relação estatística, ou não estão ligados através de qualquer relação. Deste modo, podemos dizer quea relação estatística exprime o meio-termo, no grau de conexão entre variáveis, entre a relação funcional e a ausência de relação. Relação funcional - Relação estatística - Ausência de relação No caso de ausência de qualquer relação entre dois fenómenos, esses fenómenos dizem-se independentes. 1.5.1 DIAGRAMA DE DISPERSÃO Um dos primeiros passos que pode ser dado na análise da relação entre duas variáveis, é a construção do diagrama de dispersão. O diagrama de dispersão é um gráfico de pontos. Ele permite ver se existe alguma relação entre as variáveis, identificando a equa,ão que a descreve adequadamente. A relação entre as variáveis pode ser positiva ( a um aumento dos valores de uma variável, corresponde também um aumento nos valores da outra variável) ou negativa (a um aumento dos valores de uma variável, corresponde a uma diminuição dos valores da outra). O diagrama de dispersão apresenta vantagens consideráveis ao permitir identificar de imediato certos atributos da relação entre variáveis. Todavia, este tipo de gráfico apresenta, em algumas circunstâncias, certos inconvenientes. Quando há observações que se repetem, o diagrama de dispersão não realça a frequência com que aparecem tais observações e, tudo se passa em termos gráficos, como se não houvesse repetições, pois, a representação gráfica de qualquer deles localiza-se no mesmo ponto. Constrói-se o diagrama de dispersão, fazendo corresponder através de pontos o valor de ao valor correspodente de . Os valores correspondentes de e podem ser apresentados em tabelas de frequências, simples ou de dupla entrada. Considere que o gerente de uma loja está interessado em analisar a relação entre o número de anúncios mostrados durante o fim de semana na televisão local e as vendas na loja durante a semana seguinte. Para isso, ele recolhe os seguintes dados: Número de anúncios 2 5 1 3 4 1 5 3 4 2 Volume de vendas (US$) 50 57 41 54 54 38 63 48 59 46 Diagrama de dispersão para a relação número de anúncios e volume de vendas O gráfico mostra uma tendência crescente, a relação entre as duas variáveis é positiva. Para confirmar este facto, calculemoas a covariância, medida descritiva de associação linear entre as variáveis. 1.5.2 COVARIÂNCIA O valor da covariância permite saber se a relação entre as variáveis é positiva ou negativa. Se o valor da covariância for positivo, a relação é positiva, se a covariância for negativo, a rela,cão é negativa. A covariância representa-se por e calcula-se: Portanto, é necessária uma tabela de cálculos para simplificar os passos de resolução. Para o caso do gerente tem-se: 1 2 50 -1 -1 1 2 5 57 2 6 12 3 1 41 -2 -10 20 4 3 54 0 3 0 5 4 54 1 3 3 6 1 38 -2 -13 26 7 5 63 2 12 24 8 3 48 0 -3 0 9 4 59 1 8 8 10 2 46 -1 -5 5 Soma = 30 510 99 N=10 , este resultado mostra que existe uma relação positiva entre o número de anúncios e o volume de vendas, pois,o valor da covariância é positiva. 1.5.3 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON O coeficiente de correlação linear é uma medida descritiva que avalia o tipo e a intensidade (magnitude) de uma relação.Representa-se por letra . A sua expressão matemática é: O coeficiente de correlação varia entre -1 a +1. Valores próximos dos extremos indicam uma associação forte entre as variáveis. Alguns autores convencionam que: Associação muito baixa; Associação baixa; Associação moderada; Associação forte Associação muito forte Se for igual a -1 ou +1 diz-se que a relação é perfeita. Em relação ao problema do gerente, podemos calcularo coeficiente de correlação linear para avaliar o tipo e a intensidade (magnitude) da relação entre o número de anúncios e o volume de vendas. -1 -1 1 1 1 2 6 12 4 36 -2 -10 20 4 100 0 3 0 0 9 1 3 3 1 9 -2 -13 26 4 169 2 12 24 4 144 0 -3 0 0 9 1 8 8 1 64 -1 -5 5 1 25 99 20 566 1.5.4 REGRESSÃO LINEAR SIMPLES A observação cuidada da nuvem de pontos do diagrama de dispersão permite-nos identificar leis matemáticas-tipo caracterizadoras da tendência da relação estatística. A recta de ajustamento aos pontos da nuvem chama-se recta de regressão. Trataremos apenas da sua construção gráfica de modo que a soma dos desvios dos pontos da nuvem em relação aos correspondentes da recta seja o menor possível. O conhecimento dos valores médios de x e y, pode ajudar a construir a recta com menor erro. A principal vantagem da recta de regressão é, permitir determinar uma estimativa do valor de uma das variáveis conhecido o valor da outra variável. Em relação à preocupação do gerente da loja, a pergunta que agora se pode colocar em relação à questão do número de comerciais e o volume de vendas é a seguinte: de que maneira poderão comportar-se as vendas, se durante o final de semana passar 6 vezes o anúncio? Há neste caso, que encontrar uma relação que possa estimar o volume de vendas com base no número de comerciais mostrados no final de semana. Esta técnica chama-se análise da regressão. Como o diagrama de dispersão em relação aos dados mostra uma relação aproximadamente linear entre as variáveis, pode-se estimar numa recta para prever o comportamento de vendas (y) quando o número de anúncios (x), varia. A equação da recta é dada por C. O modelo de regressão simples expressa-se como . Onde “” é a variável residual que descreve os efeitos de y não explicados por x. Como se pode notar, entre os pontos do diagrama podem ser traçadas várias rectas . a recta traçada pelo método dos mínimos quadrados é aquela cujas distâncias entre a recta estimada e os valores observados são mínimos; mais exactamente, fornece valores de a e b que minimizam a soma dos quadrados dos desvios entre os valores observados e os estimados da variável dependente, isto é, procura-se a e b tal que minimizam a soma é o valor estimado. Usando este método, os valores de a e b são: Usando as fórmulas acima, determine os coeficientes a e b e componha a equação de regressão, substituindo os valores encontrados na equação . Neste caso terá Assim, para 6 comerciais: COEFICIENTE DE DETERMINAÇÃO O coeficiente de determinação fala do poder explicativo do modelo, istoé, até que ponto a variação da variável dependente y é explicada pela variação da variável independente x. hoje em dia discute-se muito a regressão múltipla, em que se constróium modelo linear, com mais de uma variável independente. O coeficiente de determinação calcula-se: Por exemplo, o coeficiente de determinação nos permite responder a questão: qual é a eficácia com que a equação aproxima os dados? Para o caso do gerente: O que significa que apenas 86% da variação das vendas é explicada pela variação do número de anúncios. Os resgtantes 14%, podem ser explicados por outras variáveis ligadas às vendas, como por exemplo a renda. Sumário No estudo deuma distribuição bidimensional, procura-se saber se existe alguma relação entre as duas variáveis A relação entre as variáveis pode ser positiva ( a um aumento dos valores de uma variável, corresponde também um aumento nos valores da outra variável) ou negativa (a um aumento dos valores de uma variável, corresponde a uma diminuição dos valores da outra). O valor da covariância permite saber se a relação entre as variáveis é positiva ou negativa. Se o valor da covariância for positivo, a relação é positiva, se a covariância for negativo, a rela,cão é negativa. O coeficiente de correlação linear é uma medida descritiva que avalia o tipo e a intensidade (magnitude) de uma relação. O coeficiente de correlação varia entre -1 a +1. Valores próximos dos extremos indicam uma associação forte entre as variáveis. A recta de ajustamento aos pontos da nuvem chama-se recta de regressão. O modelo de regressão simples expressa-se como . Onde “” é a variável residual que descreve os efeitos de y não explicados por x. A principal vantagem da recta de regressão é, permitir determinar uma estimativa do valor de uma das variáveis conhecido o valor da outra variável. O coeficiente de determinação fala do poder explicativo do modelo, istoé, até que ponto a variação da variável dependente y é explicada pela variação da variável independente x. Exercicios 1.Que tipo de correlação espera encontrar entre: a) Nota de Física e nota de Matemática; b) Nota de Estatísticae altura do estudante; c) Nível económico da mulher e taxa de divórcio; d) Nível de consumo e asalário; e) Altura e peso; f) Preço do produto e nível de consumo do mesmo. 2.Mediu-se a altura de uma amostra de 5 meninos ( em polegadas) na idades de 6 an0s e novamente na idade de 20 anos. A tabela seguinte mostra os resultados obtidos: Altura na idade de 6 anos 40 43 40 40 42 Altura na idade de 20 anos 68 74 70 68 70 Determine o coeficiente de correlação entre as duas categorias de alturas. 3.uma companhia estabeleceu diferentes preços para 8 regiões diferentes. A tabela abaixo mostra o número de aparelhos vendidos em unidades e o preço correspondente em centenas de dólares. Vendas 420 380 350 400 450 380 450 420 preço 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0 a)Estime a equação de regressão linear das vendas pelo preço. b)Qual o efeito que se espera nas vendas quando o preço sobe 100,0? Exercicios de auto avaliaçao 1. A tabela junta apresenta uma distribuições das classificações dos alunos de duas turmas de História do 2ºano. a) Qual o significado de e ? b) Calcule a média, mediana, a moda e os quartis; c) Calcule a variância e o desvio padrão d) Construa um diagrama de extremos e quartis e interprete-o. e) Qual é a percentagem de alunos com classificação igual ou inferior a 9? f) Qualé a percentagem de alunos com classificação superior a 10. Classificções 6 7 8 9 10 11 12 13 14 15 16 Efectivos 3 9 6 12 13 5 4 3 2 1 8 2. uma mesma prova de Estatistica foi aplicada em quatro turmas diferentes obtendo-se as seguintes notas: Turma A: 9 5 8 8 7 6 6 7 5,5 7,5 4,5 8 4,5 4,5 4 7 7 4,5 4,5. Turma B: 5,5 6 2 5,5 6,5 6 5 9 5,5 5 7 8 3 4,5 3,5 6,5 3 6,5. Turma C: 8 7 6,5 7,5 6,5 7 9,5 5 4,5 9 8,5 4,5 4,5 4 4,5 4,5 4,5. Turma D: 2,5 4 4,5 5 6 7,5 7 5,5 9 9 8 6,5 4,5 7 6,5 7 7,5 Calcule: a) nota média de cada turma; b) desvio-padrão das notas; c) coeficiente de variação(Pearson) baseando no item C, qual turma apresentou melhor desempenho? 3. sabendo-se que o ponto médio da primeira classe (x1) é 46,5 e o ponto médio da quinta classe (x5) é 82,5 e, sabendo se ainda que as freuências absoluta da primeira à última classe são respectivamente, 9; 5; 15; 7; 2; determine: a) Amplitude total b) Amplitude dos 50% centrais para essa distribuição c) Desvio médio d) Desvio-padrão e) Coeficiente de variação de Pearson. 4. usaram-se duas balanças diferentes para efectuar 5 pesagens de uma mesma pessoa, tendo se obtido os resultados seguintes em kg: Balança A: 71,82 71,86 71,89 71,85 71,84 Balança B: 71,85 71,86 71,84 71,85 71,83 a) calcule a média e o desvio-padrão para cada um dos grupos de dados; b) escolha, justificando, das duas balanças aquela que é mais fiável. 5. No final do primeiro período, a Rosa e o André tiveram as classificações indicadas ao lado. a) verifique que a médiadas classificações da Rosa é igual à média das classificações do André. b) determine para as classificações da Rosa e do André, a amplitude e o desvio-padrão. c) justifique que, de entre as medidas de dispersão calculadas na alínea anterior, o desvio- padrão é a que melhor caracteriza a dispersão das classificações. Rosa: 16 10 11 13 13 11 15 15 13 André:12 10 16 1410 12 14 16 13 6. A tabela seguinte mostra os resultados de um estudo sobre os acidentes rodoviários numa dada localidade e o período do dia a que ocorreram. Horas ( determine a média e a classe modal . Localize, graficamente,os quartis. De entre as medidas calculadas, quais teriam sido escolhidas para divulgacão num programa de prevencão rodoviária? )Percentagem de acidentes 0-3 5,1% 3-6 5,7% 6-9 11,2% 9-12 9,7% 12-15 16,2% 15-18 20,6% 18-21 22,2% 21-24 9,3% 7. . para a seguinte distribuição mostre que 5% dos valores estão fora do intervalo . Faça um comentário acerca da situação. Xi fi 1 1 2 0 3 77 4 0 5 3 8. Realizaram-se entrevistas a 600 pessoas sobre o interesse de um programa televisivo, utilizando uma escala de 0 a 100. a média obtida foi de 31 e o desvio-padrão de 5,4. sabendo que a distribuição é unimodal e ligeiramente assimétrica, calcule, aproximadamente, quantos dos 600 entrevistados atribuiram ao programa pontuaão entre 25,6 e 36,4. 9. Num período, um professor deu dois testes a uma turma. No primeiro teste a média foi de 14 e o desvio-padrão de 3. no segundo teste, a média foi de 13 e o desvio parão de 1. O Pedro obteve 16 no primeiro teste e 15 no segundo. Justifique que a nota do Pedro no segundo teste, relativamente à turma , é superior à nota obtida no primeiro.(faça referência ao intervalo ). 10. Uma cadeia de 10 lojas comparou as vendas nos períodos natalicios dos anos 97 e 98, tendo concluido que as vendas subiram em qualquer das lojas; as percentagens de subida foramas seguintes( cada % refere-se a uma loja): 10,2 3,1 5,9 7,0 3,7 2,9 6,8 7,3 8,2 4,3. a) calcule a percentagem média de crescimento das vendas. b) calcule a mediana e os quartis Q1 e Q3. c) calcule e interprete o percentil 80. Calcule a variância, o desvio médio e o desvio-padrão. 11. um psicólogo aplicou um teste de inteligência a 60 alunos de uma escola secundária e agrupou os resultados em classes como mostra a tabela: Q1 93-98 98-103 103-108 108-113 113-118 118-123 123-128 128-133 Número de alunos 2 5 12 17 14 6 3 1 a) faca o poligono de frequências; b) determine a classe modal, a média e o desvio-padrão. c) determine a mediana, moda, Q1, Q3, P20 e P90. 12. .Numa fabrica fez-se um teste a 150 lâmpadas e registou-se a seguinte informação: Número de lâmpadas 5 10 42 75 18 “Duração de vida “ em horas [0, 300[ [300, 600[ [600, 900[ [900, 1200[ [1200, 1500[ a)utilize um histograma e um poligono de frequências para representar esta informação. b) construa uma tabela de frequências acumuladas; c) qual é a percentagem de lâmpadas com “ duração de vida” inferior a 900horas? d) determine a duração média de vida desta amostra de lâmpadas. e) determine a moda, a mediana e os quartis desta distribuição; f) calcule o desvio-padrão. 13. um comerciante de temperos está curioso sobre a grande variação nas vendas de loja para loja e acha que o volume das vendas está associado ao espaço nas prateleiras dedicados a sua linha de produto em cada ponto de venda. Dez lojas foram seleccionadas ao acaso em todo país e, duas variáveisforam medidas: (x) total de espaço em frente ( comprimento x altura em cm2) dedicados a sua linha de produtos e (y) total das vendas dos produtos em meticais no último mês. X 340 230 405 325 280 195 265 300 350 310 y 71 65 83 74 67 56 57 78 84 65 Construa um diagram de dispersão e determine o coeficiente de correlação. 14. De acordo com algumas teorias, o consumo de quantidades moderadas de vinho tinto reduzirá o perigo de ataques cardíacos. Num estudo em que se envolveu 19 países desenvolvidos, em 1989, obteve-se a seguinte recta de regressão: . Y- taxa de mortalidade por ataque cardíaco; é o número de habitantes mortos por 100 000 habitantes; x- número de litros de vinho consumidos por habitante. a) trace a recta de regressão; b) estime a taxa de mortalidade por ataque cardíaco num país em que se consome em média 5 litros. c) se o consumo sobe um litro, o que acontece com a taxa de mortalidade? 15. os dados que se seguem indicam a relação existente entre x, que representa a densidade específica duma amostra de madeira, e y, que representa a pressão máxima que a referida amostra pode suportar. Xi 0,41 0,46 0,44 0,47 0,42 0,39 0,41 0,44 0,43 0,44 yi 1850 2620 2340 2690 2160 1760 2500 2750 2730 3120 a)trace o gráfico referente aos dados; b)Estime os coeficientes de regressão; c)Preveja a pressão que uma amostra que uma amostra de madeira suporta quando a sua densidade específica é 0,43. Unidade 2 Teoria Elementar de Probabilidades e Distribuições Introdução Na unidade anterior, afirmou-se que o objectivo fundamental da estatística, é o de caracterizar uma população, conhecendo-se apenas parte dela, actividade impossível sem que o resultado esteja associado a uma incerteza. Nesta unidade, você vai fazer um estudo sobre o método que dará a medida do grau de incerteza, ferramenta básica para a inferência estatística. Ao completar esta unidade, você será capaz de: Objectivos · Definir o conceito probabilidade; · Descrever os tipos de evento; · Definir classicamente a probabilidade de ocorrência de um evento; · Descrever os teoremas básicos da teoria de probabilidade; · Caracterizar a distribuição de densidade de probabilidade de uma variável aleatória. · Diferenciar as distribuições: normal, qui- quadrado e t- Student; Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · Probabilidade; · Espaço amostral; · Evento; · Teorema de probabilidade total; · Teorema Bayes. · Distribuição normal, student e qui-quadrado; · Experimentos aleatórios Licao No 1 2.1 Teoria Elementar de Probabilidades 2.1.1 Origem das Probabilidades Historicamente, a teoria de Probabilidades como ramo de Matemática que estuda as leis que regem os fenómenos aleatórios, isto é, aqueles fenómenos cujos resultados variam de modo imprevisível de experiência para experiência, surgiu por volta do sec.XVII, baseada principalmente nos jogos de azar, muito em voga n a época, como a roleta e as cartas. Graças aos trabalhos dos cientistas franceses Fermat(1601-1665),Pascal(1623-1662) e Huygens(1629-1695). Depois do seu surgimento, a teoria das probabilidades desenvolveu-se rapidamente através dos trabalhos de Jacques Bernoulli(1654-1705), Moivre(1667-1754) e do reverendo Thomas Bayes (1702-1761). 2.1.2.Termos e Conceitos Probabilisticos A contecimentos Aleatórios e Acontecimentos Deterministas Consideremos duas experiências seguintes: 1ª) “a tirar uma pedra ao mar”. Ja sabemos qual é o resultado mesmo antes de a efectuarmos. A pedra vai para o fundo. 2ª) ´´lançar uma moeda para cima``. Não podemos afirmar se sai cara ou coroa. A 1ª experiência chama-se determinista ou causal. Pois, experiências deterministas ou causais caracterizam-sepor produzirem o mesmo resultado, desde que sejam repetidas sob as mesmas condições. A 2ª experiência chama-se aleatória ou casual. As experiências aleatórias ou casuais caracterizam-se pela impossibilidade de prever o resultado que se obtém, ainda que as experiências sejam realizadas nas mesmas condições. Os fenómenos aleatórios constituem o objecto de estudo das probabilidades. Espaço Amostral. Eventos Chama-se espaço amostral, ao conjunto formado por todos resultados possíveis de uma experiência aleatória. E representa-se por S, U ou Ω. Ex.1: Na experiência de lançamento de uma moeda, os resultados possíveis são:S= , Ex.2: lançar simultaneamente duas moedas e observar as faces que ficam voltadas para cima. Temos:S= Ex.3: lança-se um dado honesto e observa-se a face voltada para cima: Eventoé qualquer subconjunto do espaço amostral S. Tipos de Eventos 1. Evento Elementar – se o resultado de uma experiência consta de um só elemento do espaço amostral. 2. Evento Composto- se o resultado de uma experiência consta de dopis ou mais elementos do espaço amostral. 3. Evento Impossível- se o resultado de uma experiência não tem qualquer elemento do espaço amostral. Ex. Sair 8 no lançamento de um dado honesto, é impossível porque só vai até ao nº6 e não mais. 4. Evento Certo-se o resultado de uma experiência consta de todos os elementos do espaço amostral. Podemos combinar eventos para formar novos eventos, usando as diversas operações sobre conjuntos: 5. Evento Complementar - é evento que ocorre se A não ocorre. Ex. Lança-se duas moedas simultaneamente e observa-se as faces voltadas para cima e , duas cara Todos os outros eventos de S, que não fazem parte de A, são denominados de eventos complementares de A. Assim, e AU mas 6. Eventos Mutuamente Exclusivos ou Disjuntos ou Incompatíveis – se a sua verificação simultânea for um evento impossível ou seja , neste caso, os eventos A e B não podem ocorrer simultaneamente. Ex. No lançamento de um dado honesto; , seja e A e B são mutuamente exclusivos, pois, .Além disso, NB: se , dizemos que estes são mutuamente exclusivos e exaustívos. 7. Eventos Independentes- quando a ocorrência de um não afecta a probabilidade de ocorrência de outros. Caso contrário, diz-se Eventos dependentes. Ex. Se no lançamento de duas moedas simultaneamente tivermos os resultados da experiência são totalmente independentes de uma moeda para outra. 8. Eventos Condicionados-quando associamos dois ou mais eventos a um experimento aleatório qualquer dizemos que eles são condicionados ou vinculados desde que o aparecimento de um evento A qualquer dependa do aparecimento de outro evento B do mesmo experimento. Ex. Seja o experimento que consiste na retirada de duas cartas vermelhas de um baralho comum de 52 cartas. Ora, na 1ª retirada temos 26 cartas vermelhas em um total de 52 cartas. Quando retiramos a 2ª carta admitindo-se que ela seja vermelha, temos somente 25 cartas em um total de 51 cartas, visto que na 1ª retirada a carta não foi recolocada novamente no baralho. A ocorrência da 2ª carta está vinculada ou condicionada no aparecimento da 1ª carta. Neste caso, estamos diante de um evento condicional. 9. Evento Soma- é o evento que ocorre se , e somente se, A ocorre ou B ocorre (ou ambos); isto é: Ex. e , 10. Evento Produto- evento que ocorre se, e somente se, A ocorre e B ocorre; isto é: Ex. e , 2.1.3 Definição Clássica de Probabilidade A primeira definição que se conhece de probabilidade foi enunciada por Pierre Simon Laplace( 1749-1827) Historicamente a probabilidade P de um evento A era definida como se segue: Se n(A)=nº de casos favoráveis ao evento A e n(S)=nº total dos casos possíveis(S), desde que igualmente provável(equiprovável), então, a probabilidade(sucesso) da ocorrência de um experimento A, é igual ao quociente entre o nº de casos favoráveis ao evento e o nº de casos possiveis (S). Ou seja: Lei de Laplace Ex1. Lancemos um dado honesto e observemos o nº em cima. a) qual é a probabilidade de sair o nº 3? b) qual é a probabilidade de sair um nº par? Resolução: a) só há um caso favorável de sair o nº 3 dos 6 possíveis,isto é: e porisso a probabilidade de sair 3 é ou seja 16,7%. Note que os restantes nºs têm a mesma chance de ocorrer, o que significa que têm a mesma probabilidade. b) um nº par pode ocorrer de 3 maneiras (casos favoráveis) de 6 maneiras igualmente prováveis. Assim, ou seja 50%. Ex2. Uma bola é retirada ao acaso de uma urna que contém 6 vermelhas, 4 brancas e 5 azuis. Qual é a probabilidade dela ser vermelha? . ou 40%. Lição No 2 2.1.4 Noções Básicas de Análise Combinatória (Factorial, Permutações, Arranjos e Combinações) 1.Notação Factorial O produto dos inteiros positivos de 1 a n, inclusive, (ou seja de n a 1), é indicado por n! (lê-se n factorial): n!=n(n-1)(n-2)......3.2.1 NB: 1!=1 e 0!=1 Ex.1: 3!=3.2.1=6 5!=5.4.3.2.1=120 Ex.2: Ex.3:Simplificar: a) b) 2.Permutações Qualquer agrupamento de um conjunto de n objectos numa dada ordem é denominado uma permutação dos objectos(tomados todos de uma vez).Potrtanto o número de permutações que se pode ter num conjunto de n objectos, é :Pn=n! Ex. Consideremos o conjunto das letras a,b,c e d. Então, bdca, dcba e acdb são permutações das 4 letras(tomadas todas de uma só vez).Mas com as 4 letras podemos formar 4! Permutações.isto é, P4=4!=4.3.2.1=24 permutações. Permutações Circulares: o número de maneias dedispor n objectos distintos em torno de um circulo é 3. Permutações Com Repetição Teorema:o número de permutações de n objectos, dos quais n1 são iguais entre si, n2 outros são iguais entre si, ..., nr outros são iguais entre si, é: Esta expressão também fornece o número de divisões possíveis de n objectos distintos em r grupos distintos de tamanhos respectivamenten1, n2,n3,….,nr (n1+ n2+n3+….+nr=n) Ex1: Quantas palavras de 7 letras podem ser formadas usando as letras da palavra BENZENO? Queremos encontrar o número de permutações de 7 objectos, dos quais 2 são iguais entre si (os dois E) e 2 outros são iguais entre si (os dois N). Pelo teorema anterior, existem tais palavras. 3.Arranjos Todo o agrupamento de quaisquer destes objectos numa dada ordem é denominado um r-arranjo ou um arranjo dos n objectos tomados r de cada vez (ou tomados r a r). O número de arranjos de n objectos, tomados r a r, é indicado por A(n,r), nAr, An,r ou Arn. e calcula-se: Ex1:Consideremos o conjunto das letras a,b,c e d. Então, · bad, adb, cbd e bca são arranjos das 4 letras tomadas 3 a 3. · ad, cb,da e bd são arranjos das 4 letras tomadas 2 a 2. Mas em A(4,3)=arranjos das 4 letras tomadas 3 a 3. A(4,2)arranjos das 4 letras tomadas 2 a 2 Ex2: De quantas maneiras diferentes uma organização contendo 26 membros pode eleger um presidente, um secretário e um tesoureiro ( supondo que nenhuma pessoa seja eleita mais de um cargo)? O presidente pode ser escolhido de 26 modos diferentes; a seguir, o secretário pode ser eleito de 25 modos diferentes, uma vez que a pessoa escolhida para presidente não pode ser eleita para cargo de secretário; em seguida o tesoureiro pode ser escolhido de 24 modos diferentes. Assim pelo principio de contagem, existem 26.25.24=15 600 maneiras diferentes de a organização eleger seus funcionários. Usando a fórmula de arranjos teremos: Ex3: determiar sabendo que: Sabemos que e isto significa que: =42 =42, usando a fórmula resolvente das equações quadráticas ou o teorema de Viet, temos n1=9 e n2=-4 mas sabemos ainda que ou seja, , significa que a resposta é, n=9. 4.Combinações Consideremos uma coleção qualquer de n objectos. Uma combinação desses n objectos, tomados r a r, é uma selecção qualquer de r dos objectos em que a ordem não interessa. Em outras palavras, uma r-combinação de um conjunto de n objectos é qualquer subconjunto com r elementos. Ex. As combinações das letras a,b,c,d tomadas 3 a 3 são: abc, abd, acd, bcd. Observemos que as combinações seguintes são iguais: abc, acb, bac, cab, cba, isto é, cada uma delas indica o mesmo conjunto abc. O número de combinações de n objectos tomados r a r, é indicado por C(n,r); nCr; Cn,r ; ou ;(n e é chamado um coeficiente binomial. Estes números podem ser arrumados em uma disposição triangular, o famoso triângulo de Pascal. Nota:1. O número de modos de escolher p objectos entre n objectos distintos dados, podendo repetir a escolha, é . Esse é o chamado número de combinações completas (ou com repetição). Esta fórmula é usada também p.ex. se, se pretende conhecer o número de maneiras de distribuir p moedas idênticas a n crianças. 2.O número de maneiras de distribuir p moedas idênticas a n crianças de forma que cada criança receba pelo menos uma moeda é Ex.1: Numa organização de 26 membros precisa-se de 3 membros para participar num debate sobre a homoxesualidade. Quantas comissões diferentes podem ser formadas? C(26,3)=comissões diferentes podem ser formadas de 3 membros. Ex2: um fazendeiro compra 3 vacas, 2 porcos e 4 galinhas de um homem que possui 6 vacas, 5 porcos e 8 galinhas. Quantas escolhas tem o fazendeiro? R: O fazendeiro tem: escolhas Ex2: Duas cartas são retiradas ao acaso, de um baralho comum de 52 cartas. Calcular a probabilidae P de que: a) ambas sejam de espadas; b) uma seja de espada e outra de copas. Resolução: a) existem maneiras de se tirar 2 das 52 cartas. E existem maneiras de se retirar 2 das 13 cartas de espadas, logo: b) como existem 13 cartas de espadas e 13 de copas, existem 13.13= 169 maneiras de se retirar uma carta de espadas e uma de copas; portanto, . Exercicios para auto avaliaçao 1-Simplificar: a) b) c) d) e) f) g) h) i) 2.Calcule: a) b) c) 3. Indique justificando o valor lógico de : a) b) 4. Mostre que: a) b) 5. Determine o valor natural n para o qual: a) b) c) d) e) f) Problemas: 1. De quantas maneiras diferentes se podem sentar 5 pessoas num banco de 3 lugares? 2.Um grupo de cinco amigos decide ir ao cinema. Neste grupo temos o João e a Maria. De quantas maneiras se podem sentar os cinco se: a) o João e a Maria decidem ficar lado a lado; b) o João não quer ficar junto com a Maria. Soluções 1.a) b) n c) d) e) n+1 f) g) h) i) 2.a) 126 b) 5/3 c)48 3. a) V b) F 5. a) 9 b) 5 c)5 d) 6 e) ( Não existe em N) f) 10 Problemas: 1. 60 2. a) 48 b) 72 Licão No 3 2.1.4 Teoremas Básicos de Probabilidades 1º) para btodo o evento A, a probabilidade da sua ocorrência será sempre um valor compreendido entre zero e um, ambos limites incluidos ou seja: . P(A) será igual a zero quando for um evento impossível. Ex1. A probabilidade de ocorrência de uma face voltada para cima mostrar o valor 9 no lançamento de um dado honesto é impossível. P(A) será igual a um quando for um evento certo. Ex2. Se A é um evento certo, então logo, A=S, assim, . 2º) se é um evento complementar de A, então ou . Ex3. Uma bola é retirada ao acaso de uma urna que contém 6 vermelhas, 4 brancas e 5 azuis. Qual é a probabilidade dela não ser vermelha? Resolução: Seja A evento que consiste na retirada de uma bola vermelha. ou 40%. E , o evento de não ser bola vermelha, então: ou 60%. 3º) se AUB representa a ocorrência de A ou de B ou de ambas, então: Esta regra pode ser alargada para a reunião de três acontecimentos: Em particular, para eventos mutuamente exclusivos, porque Se são n eventos mutuamente exclusivos, que tem probabilidades , respectivamente, a probabilidade de ocorrência de todos eventos é: Ex. Considerando o exercício anterior, determinar a probabilidade da bola retirada ser vermelha ou branca. Resolução: P(A)- probabilidade de ser vermelha P(B)- probabilidade de ser branca Porque são eventos mutuamente exclusivos . Ex2. se A é evento ´´ extracção de um às de um baralho`` e B evento ´´extracção de uma carta de espada``, então qual é a probabilidade de extracção de um às ou de uma carta de espadas ou de ambas? Resolução:A e B não são eventos mutuamente exclusivos visto que pode ser extraido o às de espada. Assim: Obs. ( há 4 às de 52 cartas) (há 13 espadas de 52 cartas) ( nos 4 às 1 é de espadas) 4º)Probabilidade Condicional. Eventos Independentes e Dependentes Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido, é definida por ou Se a ocorrência ou não de A não afectar a probabilidade da ocorrência de B, então e diz se que A e B são Eventos independentes, no caso contrário, eles são e ventos dependentes. Se se representar por AB a ocorrência de ´´ambos eventos A e B``, as vezes denominando evento composto, então: . Em particular para eventos independentes temos . Para três eventos A,B e C tem-se: eventos independentes. Em geral, se A1,A2,...,An são n eventos independentes que têm respectivamente, as probabilidades: p1,p2,...,pn, então a probabilidade de ocorrência simultânea de A1,A2,...,An é: P= P1.P2.P3....Pn Ex1: seja A e B os eventos ´´cara na 5ª jogada`` e ´´cara na 6ª jogada`` de uma moeda , respectivamente. Qual é a probabilidade de ocorrer cara em ambas jogadas? Resolução: A e B são eventos independentes , de modo que a probabilidade de ocorrer cara em ambas jogadas, 5ª e 6ª, é, admitindo-se que a moeda é (honesta). Ex2: suponha que uma urna contém 3 bolas brancas e 2 bolas pretas. Seja A o evento´´a 1ª bola retirada é preta`` e B o evento ´´a 2ª bola retirada é preta``, não sendo as bolas recolocadas depois de retiradas. Qual é a probabilidade de ambas bolas retiradas serem pretas? Resolução: é a probabilidade da 1ª bola retirada ser preta enquanto: é a probabilidade da 2ª bola retirada ser preta depois de retirada a 1ª dessa cor. Então a probabilidade de ambas as bolas retiradas serem pretas é: Ex.3: consideremos o lançamento de um par de dados honestos. Se a soma é 6, determinar a probabilidade de que um dos dados tenha produzido um 2. Resolução: Seja, e B={um 2 aparece em pelo menos um dos dados} Determinemos . Ora , A consiste em 5 elementos e dois deles,(2,4) e (4,2), pertencem a B: . Então, Por outro lado, como B consiste em onze elementos e S consiste em 36 elementos, Ex.4: um lote contém 12 peças das quais 4 são defeituosas. Três peças são retiradas ao acaso do lote, uma após a outra. Determinar a pobabilidade P de que todas as três peças sejam não-defeituosas. Resolução : A probabilidade de que a 1ª peça seja não defeituosa é uma vez que 8 das 12 peças são não defeituosas. Se a 1ª peça é não defeituosa, então a probabilidade de que a peça seguinte seja não defeituosa é pois somente 7 das 11 peças restantes são não defeituosas. Se as duas 1ªs peças são não defeituosas, então a probabilidade de que a última peça seja não defeituosa é , uma vez que apenas 6 das 10 peças restantes são não defeituosas. Assim, pelo teorema da multiplicação, Ex.5: considere um grupo constituido de 7 homens e três mulheres. Tendo se scolhido ao acaso três pessoas, achar a probabilidade destas serem todas do sexo masculino. Resolução: Seja A o facto de ser homem a 1ª pessoa escolhida, B a 2ª pessoa e C, a 3ª. A probabilidade do 1º acontecimento é . A probabilidade do 2º acontecimento, à condição de ter ocorrido o 1º, isto é, a probabilidade de B relativa a A é . A probabilidade do 3º acontecimento à condição de terem ocorrido os dois primeiros, isto é, a probabilidade de C relativa a AB é . Pelo teorema do produto, a probabilidade de serem do sexo masculino as três pessoas escolhidas é . 5º ) Fórmula de probabilidade Total Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade positiva.Então, para qualquerevento A, 6º ) Fórmula de Bayes (1763) Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade positiva. Se A é um evento com , então, para todo Esta fórmula é uma consequência imediata da definição de probabilidade condicional e do teorema das probabilidades totais. A fórmula de Bayes tem a seguinte interpretação. Seja A um acontecimento que se realiza se e só se um dos acontecimentos mutuamente exclusivos, Bi (i=1,2,…), se realiza. Os Bitomam o nome de << causa>>. A fórmula de Bayes dá então a probabilidade de que o acontecimento A que ocorreu seja o resultado da causa Bj. a probabilidade P(Bj) toma o nome de “probabilidade” à priori da <<causa>> Bj, P(Bj/A) é a probabilidade à posteriori, isto é, a probabilidade de Bj calculada após a informação de que A se realizou. Ex. O gerente de um restaurante classifica os seus clientes em três categorias. Bem vestidos 50%, Moderadamente vestidos40% e Mal vestidos 10%. 70% dos Bem vestidos, 50% dos Moderadamente vestidos e 30% dos Mal vestidos pedem um vinho ao entrar no restaurante. a)Qual é a probabilidade de um cliente escolhido aleatoriamente peça um vinho; b) se se pedir um vinho, qual é a probabilidade de que o cliente que o pede esteja bem vestido? Resolução: Dados: P(BEV)= 0,5; P(MOV)=0,4; P(MAV)= 0,1;P(V/BEV)= 0,7; P(V/MOV)= 0,5 P(V/MAV)=0,3; a)P(V)=? P(V)= P(BEV)*P(V/BEV)+P(MOV)*P(V/MOV)+P(MAV)*P(V/MAV)= = 0,5*0,7+0,4*0,5+0,1*0,3= 0,35+0,2+0,03= 0,58 b)P(BEV/V)=? Sumário A primeira definição que se conhece de probabilidade foi enunciada por Pierre Simon Laplace( 1749-1827) Historicamente a probabilidade P de um evento A era definida como se segue: Se n(A)=nº de casos favoráveis ao evento A e n(S)=nº total dos casos possíveis(S), desde que igualmente provável(equiprovável), então, a probabilidade(sucesso) da ocorrência de um experimento A, é igual ao quociente entre o nº de casos favoráveis ao evento e o nº de casos possiveis (S). Ou seja: Lei de Laplace Teoremas Básicos de Probabilidades 1º) para btodo o evento A, a probabilidade da sua ocorrência será sempre um valor compreendido entre zero e um, ambos limites incluidos ou seja: . 2o) é um evento complementar de A, então ou 3º) se AUB representa a ocorrência de A ou de B ou de ambas, então: Em particular, para eventos mutuamente exclusivos, porque Se são n eventos mutuamente exclusivos, que tem probabilidades , respectivamente, a probabilidade de ocorrência de todos eventos é: 4º)Probabilidade Condicional. Eventos Independentes e Dependentes Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido, é definida por ou Se a ocorrência ou não de A não afectar a probabilidade da ocorrência de B, então e diz se que A e B são Eventos independentes, no caso contrário, eles são e ventos dependentes. Se se representar por AB a ocorrência de ´´ambos eventos A e B``, as vezes denominando evento composto, então: . Em particular para eventos independentes temos . Em geral, se A1,A2,...,An são n eventos independentes que têm respectivamente, as probabilidades: p1,p2,...,pn, então a probabilidade de ocorrência simultânea de A1,A2,...,An é: P= P1.P2.P3....Pn. 5º ) Fórmula de probabilidade Total Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade positiva.Então, para qualquerevento A, 6º ) Fórmula de Bayes (1763) Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade positiva. Se A é um evento com , então, para todo Esta fórmula é uma consequência imediata da definição de probabilidade condicional e do teorema das probabilidades totais. Exercicios de Auto-Avaliação 1. O nº de de pessoas e o tipo de tarefa a desempenhar em determinada comissão pode ser ou não diferenciada. Num Centro de Saúde e para determinar turno do dia, achou se conveniente considerar grupos de 5 pessoas , escolhidas entre 4 administrativos, 10 enfermeiros e 7 médicos. Quantos grupos podem ser formados se se considerar apenas um administrativo e os restantes elementos serem: a) escolhidos entre enfermeiros e médicos; b) dois enfermeiros e dois médicos; c) pelo menos dois enfermeiros. 2. Num congresso participam 60 congressistas, 50 falam inglês e 40 falam francês. a) indique, justificando, o nº de congressistas que falam simultaneamente as duas linguas;b) determine a probabilidade de dois congressistas, escolhidos ao acaso, não se entenderem; 3. um teste de Biologia é constituido por 12 questóes. De quantas maneiras um aluno pode resolver o teste se tiver de responder a 8 perguntas: a) sem restrição; b) se tiver de responder obrigatoriamente às 5 primeiras perguntas; c) se tiver de responder pelo menos três das seis primeiras perguntas; d) se as últimas 4 questões do teste forem de desenvolvimento e tiver de escolher obrigatoriamente duas. 4. Uma operação cirúrgica exige a formação de uma equipa, em que cada elemento tem a sua função específica. Suponha-se que para determinado tipo de intervenção cirúrgica se dispõe de: 2 cirurgiões, 3 anestesistas, 5 enfermeiros e 4 técnicos. Se são necessários 2 cirurgiões, 1 anestesista, 2 enfermeiros e 1 técnico: a) indique quantas equipas podem ser formadas? b) Se por dia são realizadas no máximo 4 operações, ao fim de quantos dias volta a estar a 1ª equipa em exercício? 5. uma olaria faz a entrega de uma encomenda de 30 peças, 5 das quais com imperfeições. A aceitação da encomenda, por parte do comprador, leva à verificação da mesma. O comprador retira ao acaso, 10 peças. Qual é a probabilidade de: a) não encontrar nenhuma peça defeituosa? b) Encontrar uma peça defeituosa? c) Enontrar duas peças defeituosas? d) Aceitar a encomenda com 4 peças defeituosas? 6. Considere a palavra BARCO a) quantas sequências podemos formar com três letras distintas da palavra dada? Quantas dessas sequências começam por R? b) Quantas sequências podemos formar com todas as letras dadas? Quantas dessas sequências têm as consoantes todas juntas? 7. Quantas palavras de igual nº de letras podem ser formadas usando as letras das palavras: a) lhes b) isso c) radar d) abacate 8. De 100 estudantes, 30 estão estudando Matemática, 20 estão estudando Música e 10 estão estudando matemática como música. Se um estudante é selecionado ao acaso, achar a probabilidade P de que ele esteja estudando Matemática ou Música. 9. Os finalistas de uma escola fizeram uma rifa, emitindo para tal, 1000 bilhetes. Desses bilhetes, um permitia ganhar 10 000 Mt , 5 permitiam ganhar 1000Mt, 10 permitiam ganhar 100Mt e os restantes não permitiam ganhar nada. Determinar a probabilidade de uma pessoa detentora de um único bilhete ganhar pelo menos 100Mt. 10. um atirador atinge o alvo, em cada uma das três zonas, com as seguintes probabilidades: a zona I com P1=0,15; a zona II com P2=0,3 e a zona III com P=0,2. determinar a probabilidade do atirador falhar o tiro. 11. De dois acontecimentos A e B, resultantes de uma mesma experiência aleatória, sabe-se que: ; e a) determine e b) averigue se os acontecimentos A e B são incompatíveis e contrários. 12. Sejam A e B dois eventos associados a um experimento. Seja , e . Pergunta-se: a) para que valor de t, A e B são mutuamente exclusivos? b) Para que valor de t A e B são independentes? 13. Se 40 famílias com 3 filhos vivem numa cidade, quantas delas será de esperar que tenham: a) 3 rapazes b) 1 rapaz e 2 raparigas c) Pelo menos um rapaz. 14. No universo S, acerca do acontecimento A e B, sabe-se que: a) escreva uma relação entre e b) calcular e , se . 15. uma urna contém 6 bolas brancas e 4 pretas; outra contém 7 brancas e 5 pretas. Se for retirada uma bola de cada urna, determinar a probabilidade de: a) ambas serem brancas b) ambas serem pretas c) uma ser branca e a outra ser preta. 16. Em certa região de Brasil ocorreram 5 anos de seca em um período de 43anos. Qual é a probabilidade de continuar a mesma situação nos próximos 2 anos? 17. Dois amgos foram a caça. Sabe se que um deles tem 45% de probabilidade de acertar em qualquer caça, enquanto que o outro tem 60. qual é a probabilidade de em cada tiro disparado: a) ambos acertarem na mesma caça? b) nenhum acertar na mesma caça? c) a caça ser atingida? d) apenas um acertar a caça? 18. Três máquinas, A,B,C, fabricam um mesmo produto nas seguintes proporções. A produção da máquina A é duas veses a produção da máquina B e as máquinas B e C têm proporções iguais. Sabe-se ainda que 5% do produto fabricado em A, 7% fabricado em B e 10% de C são defeituosos. Este produto é armazenado em determinado almoxarifado, na proporção de produção de cada máquina. Retirou-se um produto deste almoxarifado e verificou-se que era defeituoso. Qual a probabilidade de este produto ter sido produzido: a) pela máquina A? b) pela máquina B? c)pela máquina c? 19. Num estudo sobre “novos hábitos”dos alunos observa-se que 15% achou normal “usar” o telemóvel na aula, enquanto outros 20% pensam que é na aula a melhor altura para pôr a conversa em dia. Por outro lado, 90% destes últimos nunca tem dúvidas sobre a matéria leccionada, enquanto 20% dos que “usam”telemóvel na aula e 30% dos restantes (“os bem comportados”), apresentam ocasionalmente dúvidas. a) Foi posta uma dúvida sobre a matéria. Calcule a probabilidade de ser um dos alunos que “usa” o telemóvel. b) Pode afirmar-se que mais de 80% dos alunos não apresentam dúvidas na aula? Soluções 1. a) 9 520 b) 3 780 c) 7980 2. a) 30 b) 2.82% 3.a) 495 b)20 c) 480 d) 168 4.a) 120 b) no mínimo ao fim de 30dias. 5. a) b) c) d) 6. a) 60 ; 12 b) 120; 36 7. a) 24 b) 12 c) 30 d) 840 8. R: 9. 0,016. 10. 0,35 11.a) 0.6 e 0.3 b) Incompativeis e contrários pois, 12. a) t=0,2 b) t=0,5 13. a) 5 b)15 c) 35 14. a) b) 0,8 e 0,05 15. a) 7/20 b) 1/6 c) 29/60. 16. 1,35% 17. a) 27% b)22% c)78% d) 51% 18. a) 37,04% b) 25,92% c) 37,04% 19. a) 0,1225 b) Não 2.2 Distribuição de probabilidade Introdução Nesta unidade, você deverá fazer: o estudo da probabilidade associada aos acontecimentos possíveis numa experiencia aleatória que obedece a um regra, isto é, a forma de distribuição mais frequente nos processos educacionais, industriais, etc, para características mensuráveis. Ao completar esta unidade, você será capaz de: Objectivos · Indicar as características da distribuição normal, t- student e qui- quadrado; · Indicar as características da distribuição normal padrão; · Consultar a probabilidade numa tabela de distribuição normal, de t-student e qui- quadrodo; · Caracterizar a distribuição de densidade de probabilidade de uma variável aleatória. · Diferenciar as distribuições: normal, qui- quadrado e t- Student; · Descrever as condições de a aproximação das distribuições: normal, qui- quadrado e t- Student; Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · Distribuição de probabilidade; · Simetria; · Graus de liberdade; · Variável padronizada. Lição No 4 2.2.1 Introdução à distribuição normal de probabilidade Uma variável aleatória contínua X segue uma distribuição normal (ou Gaussiana) caracterizada pela média e variância , e representa-se por , se sua função densidade de probabilidade é dada por: A função de densidade de probabilidade tem o gráfico representado na figura 2.1. Figura 2.1: Gráfico da função de densidade de probabilidade da distribuição normal Propriedades Se , então: · Média ou esperança matemática é o parâmetro μ . · A variância da distribuição normal é o parâmetro . · A lei normal é simétrica em relação a média, isto é, para qualquer , a probabilidade a esquerda da média é igual a probabilidade a direita da média. Se , então , segue uma distribuição normal padrão e representa-se por . Figura 2.2: Gráfico da função de densidade de probabilidade da distribuição normal-padrão Uso da tabela de distribuição normal de probabilidade Como não era possível criar-se uma tabela com qualquer média e qualquer desvio padrão, introduziu – se uma grandeza padronizada que segue uma distribuição normal padrão com média 0 e desvio padrão 1. A tabela que consta em apêndice dá-nos a probabilidadede Z<Zi. Exemplo 1: Para determinar , indo a tabela, observamos na linha 0,4 e coluna 0,05. No cruzamento encontra-se o valor da probabilidade, logo,, que é a probabilidade procurada. Exemplo 2: Exemplo 3: , neste caso, como pretende-se a probabilidade de Z >zi, e a tabela dá nos apenas valores a esquerda, da totalidade que é 1, temos de tirar a área a esquerda e assim obteremos a área a direita. Exemplo 4: Suponha que as notas dos estudantes duma turma numa certa escola sigam a distribuição normal, com uma média de 10 valores e uma variância de 4. Qual é a probabilidade das notas excederem 13 valores? Resolução : Seja X as notas. A probabilidade requerida pode ser representada por P(X>13). Como , então, Z = (X-10)/2. Note que X>13 corresponde a Z>1,5. Assim, da Tabela, P(X>13) = P(Z>1.5) = 1 –P(Z≤1.5) = 1 –0.93319 = 0.06681 Exercicios de Auto-Avaliação 1. Seja Z uma N(0, 1). Determinar as seguintes probabilidades: a) P(Z < 2,33) b) P(Z > -1,54) c) P(-2 < Z ≤ 2) d) P(1 ≤ Z ≤2) 2. Seja X uma VAC com distribuição N(10, 2). Determinar: a) P(X < 10) b) P(X > 11,50) c) P(6,08 ≤ Z ≤ 13,92) 3. Suponha que X tenha uma distribuição N(2; 0,16). Empregando a tábua dedistribuição normal, calcule as seguintes probabilidades: a) b) 4.Uma distribuição normal tem desvio padrão igual a 5 e é tal que 1,5% dos valores estão abaixo de35. Determine sua média. Soluçoes 1. a) 0,9901 b) 0,9382 c.) 0,9544 d.) 0,1359 2. a.) 0,50 b). 0,2266 c.)0,95 3. a.) 0,2266 b) 0,2902 4. 0,458 Lição No 5 2.2.2 Distribuição Qui- quadrado Consideremos um conjunto de n variáveis aleatórias , sendo que cada variável segue uma distribuição normal padrão e são mutuamente independentes, então, a variável aleatória X, que é soma das n variáveis elevadas ao quadrado, segue distribuição Qui- Quadrado com n graus de liberdade, e representa-se por : Os graus de liberdade são habitualmente usados para representar o número das variáveis adicionadas. Uma variável aleatória X tem uma distribuição Qui- Quadrado se sua função de densidade de probabilidade é dada por: Propriedades da distribuição · O gráfico da f.d.p é uma curva assimétrica positiva; · O valor esperado da distribuição: E(X) = n; · Variância: Var (X) = 2n. Tabelas O que é tabelado é a função inversa, em relação a área à direita de cada curva (uma para cada linha), isto é, dado um valor de área na cauda direita (a), a tabela retorna um valor “x” tal que Exercícios 1. Seja X uma variável aleatória com distribuiçao do Qui-quadrado.determine: a) b) c) Soluções : a). 0,1 b). 0,995 c). 0,99 2.2.3 Distribuição t- Student A distribuição t-Student é muito usada quando a variância é desconhecida, ou quando a amostra é de menor dimensão numa distribuição normal. Uma variável aleatória continua X tem distribuição t de student n> 0 graus de liberdade, e representa-se por , se a sua função de densidade de probabilidade é dada por: , onde A função de densidade de probabilidade tem o gráfico representado na figura 3.1. Figura 2.3: Gráfico da função de densidade de probabilidade da distribuição t-Student Principais características da distribuição 1 Curva simétrica em relação ao eixo x = 0 Se , então E(X) = 0 Variância Rita · O seu aspecto gráfico depende do dos graus de liberdade. A Distribuição t- Student é essencialmente uma distribuição normal (com forma aproximada de um sino) para todas as amostras de tamanho ‘n’. Propriedades da Distribuição t de Student É diferente conforme o tamanho da amostra (n) Tem forma geral simétrica, mas reflecte a maior variabilidade esperada em pequenas amostras Tem média t=0 O desvio padrão varia com o tamanho da amostra, mas é superior a 1 Quanto maior ‘n’, maior a aproximação em relação à distribuição normal. Para n>30 podemos utilizar distribuição normal com valores críticos ‘z’. Tabela da distribuição t- Student O que é tabelado é a função inversa (percentis), em relação a área à direita (unilateral) de cada curva (uma para cada linha), ou a soma das caudas (bilateral), isto é, a tabela retorna um valor “t” tal que P(T ≥ t) = α (unilateral) ou P(|T| ≥ t) = α (bilateral). As duas opções podem ser colocadas em uma mesma tabela. Pode-se ler uma área (a) de cima para baixo e se ter um valor unilateral (P(T ≥ t) = α) ou ler a área (a) de baixo para cima e se ter um valor “t” tal que P(T ≥ t) = α/2. Exercicios 1. seja x uma v.a. com distribuição t- Student, determine: a) P(T5 > 2.015) b) P(Τ8< - 2.306) c) P(Τ8>2.306) Soluções: a) 0,05 b) 0,025 c) 0,025 Exercicios de Auto-Avaliação 1.O número de pedidos de compra de certo produto que uma cia recebe por semana distribui-senormalmente, com média 125 e desvio padrão de 25. Se em uma dada semana o estoque disponível é de 150 unidades: a) Qual é a probabilidade de que todos os pedidos sejam atendidos? b) Qual deveria ser o estoque para que tivesse 99% de probabilidade de que todos os pedidos fossem atendidos? 2. Considere que o comprimento médio de determinado fio condutor é 120, com desvio padrão 0,5. Qual a percentagem de fio com comprimento superior a 121? 3.Os Serviços Municipalizados de Gás e Electricidade debitam mensalemnte aos seus clientes um consumo teórico T de energia eléctrica calculado de tal modo que a probabilidade de o consumo efectivo o exceder seja de 30,85%. Suponha um cliente cujo consumo por mês segue lei normal de média 400 kwh e desvio-padrão 40 kwh. a) Qual o consumo teórico que lhe é mensalmente debitado? b) i. Qual a distribuição do consumo efectivo durante 3 meses? ii. Qual a probabilidade de que, ao fim de 3 meses, o consumo teórico exceda o efectivo em mais de 100 kwh? Soluções 1. a) 0, 8413 b) 184 2. 2,28%. 3. a) T =420 b) i.N(1200; 4800) ii. 2. 28,1% Unidade 3 Estatística inferencial Introdução Até aqui, o trabalho realizado foi para a descrição das características de uma amostra, o que é a base da inferência estatística. Nesta unidade, você deverá fazer: o estudo sobre dos procedimentos que lhe ajudarão a partir dos resultados obtidos com base numa amostra estimar o comportamento da população com certo grau de confiança. Ao completar esta unidade, você será capaz de: Objectivos · Descrever a distribuição amostral das médias de uma população; · Construir o intervalo de confiança para a média de uma população; · Construir o intervalo de confiança para as proporções; · Construir o intervalo de confiança para a variância de uma população · Testar hipóteses; Terminologia Nesta lição, você deverá prestar muita atenção aos seguintes termos e conceitos: · Intervalo de confiança; · Nível de significância; · Distribuição amostral · Teste; · Hipótese nula; · Hipótese alternativa; · Potência de teste; · Erro; Lição No 1 3.1 Distribuição amostral e Intervalo de confiança para a média de uma população 3.1.1 Distribuição Amostral Se extrairmos n amostras de uma determinada população, para cada uma das amostras pode se calcular, por exemplo, a média, o desvio e tem-se a distribuição amostral desses parâmetros. Como a média, os desvios são variáveis aleatórias, pode se determinar as suas características. Distribuição Amostral da média A média da distribuição amostral das médias é igual à média populacional, e representamos por . · Se a população for infinita, ou se a amostragem é com reposição, então a variância da distribuição amostral das médias, denotada por é dada por: · Se a população for finita, ou se a amostragem é sem preposição, então a variância da distribuição amostral das médias é dada por: · Se a população tem ou não distribuição normal com média μ e variância , então a distribuição das médias amostrais será normalmente distribuída com média e variância dada por: . 3.2.1. Intervalo de confiança para a média de uma população Quando a variância é conhecida Se a distribuição for normal ou quando a amostra é de grande dimensão e mesmo não sendo normal, pde se dizer que segue umadistribuição aproximadamente normal. Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessário calcular a variável reduzida correspondente: onde : - é a média amonstral; - é a média populacional e - é o desvio padrão corrigido, dado por , logo, Z pode ser expressa de seguinte modo : A probabilidade de se encontrar a média da população dentro do intervalo será dada por: . O intervalo da confiança para a média da população a um grau de confiança de é dado por : Exercicios 1. Uma brigada de PT pediu ao gerente de bar onde trabalha o Jorge para colaborar numa companha de sensibilização o dever de não beber quando vai conduzir. Assim o Jorge foi encarregue de pedir aos clientes do bar para soprarem o balão ao sair. Ao fim de alguns dias, o Jorge já tinha recolhido 125 observações cuja média amostral era de 0,6 mg por litro. De acordo com as ilustrações da PT os valores de quantidade de álcool no sangue das pessoas são bem modelados por uma distribuição normal com variância 0,04. Calcule o intervalo de confiança a 95% para a verdadeira taxa de alcoolemia a saída do bar do Jorge. Resolução: Sendo a média amostral 0,6 e a variância 0,04, logo o desvio padrão será 0,02. A 95%, ,que consultando na tabela terremos . Como então, Quando a variância é desconhecida Se a distribuição for normal, então segue uma distribuição t- Student. A grandeza padronizada será: A probabilidade de se encontrar a média da população dentro do intervalo será dada por: . Quando a população é normal com variância desconhecida, o intervalo de confiança para a média da população a um grau de confiança de é: Quando a população não é normal mas a amostra é de grande dimensão com variância desconhecida, o intervalo de confiança aproximado para a média da população a um grau de confiança de é: . 3.1.2 Intervalo de confiança para proporções Normalmente, faz-se afirmações sobre a taxa de sero trivalência em Moçambique e não do número total dos infectados. Se a amostra é do tamanho n, e X o número de pessoas infectadas na amostra, podemos estimar a proporção de amostra pela equação: . Se n é suficientemente grande, pelo teorema do limite central, a distribuição amostral aproxima-se da distribuição com as seguintes características: O desvio padrão da distribuição da amostra de proporção é: , e sendo,, então, . A estatística Z é dada por: e o intervalo de confiança é dado por: Exercício Um estudante do Ensino Básico da Universidade Pedagógica afirmava que as classificações na disciplina de estatística eram em regra, superiores a 10 valores em mais de 70%dos casos. Um seu colega aparentemente céptico, resolveu obter uma amostra aleatória apropriada á situação, através da qual verificou que para cada 98 alunos que se apresentavam ao exame 73 tinham obtido classificações superiores a 10 valores. Construa, com base na informação contida nesta amostra, um intervalo de confiança de nível 95% para a percentagem de todosestudante do Ensino Básico da Universidade Pedagógica com classificação superior a 10 valores. Resolução: Como a amostra é de 98 e o número de estudantes com classificação maior a 10 é 73, . Sendo , com e a 95% ,que consultando na tabela terremos , portanto, logo, o intervalo de confiança será: 3.1.3. Intervalo de confiança para a variância de uma população Se a distribuição da população for normal, a variável fulcral para a construção do intervalo de confiança para a variância é: A probabilidade de se encontrar a variância da população dentro do intervalo será dada por: . Portanto, o intervalo de confiança para a variância da população a um grau de confiança de é: Exercício 1. Entre os 10 pavilhões mais visitados de uma exposição universal, foram seleccionados aleatoriamente três, tendo sido registados os tempos de espera para visitar os mesmos apartir das 12 horas. Seguem-se os dos obtidos relativos as 3 amostras aleatórias dos tempos de espera registados em minutos, para os 3 pavilhões: Pav 1: e . Pav 2: e . Pav 3: Admitindo a normalidade dos tempos de espera do pavilhão 1, construa o intervalo de confiança de nível 0,05, para a variância dos tempos de esperado mesmo. Resolução: Como por definição, intervalo para a variância ´dado por: , e sendo , então, Lição No 2 3.1.3 Intervalo de confiança para duas médias populacionais Quando as variâncias são conhecidas Introdução Sejam dois conjuntos, e duas amostras aleatórias independentes de dimensões e , respectivamente, retiradas de duas populações com distribuição normal ou não sendo normal mas com a amostra de grande dimensão e desvios , neste caso, a variável fulcral a utilizar na construção do intervalo de confiança é: A probabilidade de se encontrar a diferença de médias populacionais dentro do intervalo será dada por: . O intervalo da confiança para a diferença das médias populacionais a um grau de confiança de é dado por : Quando as variâncias são desconhecidas e iguais A grandeza padronizada será: Quando as variâncias são desconhecidas e diferentes A grandeza padronizada será: , onde , . Teorema do limite central Desde que a média amostral tenha sido calculada com base numa amostra de grande dimensão, a sua distribuição é aproximadamente normal. Exercício 1. Entre os 10 pavilhões mais visitados de uma exposição universal, foram seleccionados aleatoriamente três, tendo sido registados os tempos de espera para visitar os mesmos a partir das 12 horas. Seguem-se os dos obtidos relativos as 3 amostras aleatórias dos tempos de espera registados em minutos, para os 3 pavilhões: Pav 1: e . Pav 2: e . Pav 3: Construa o intervalo de confiança para a diferença entre as médias dos tempos de espera nos pavilhões 2 e 3, respectivamente. Resolução: Como as variâncias populacionais são desconhecidas e sendo para: o pavilhão 2 e para o pavilhão 3 e sendo , e então, teste de hipótese Exercícios de Auto-Avaliação Intervalo de confiança para a média 1. A duração da vida de uma peça de equipamento é tal que σ=5 horas.Foram amostradas 100 dessas peças, obtendo-se a média de 500 horas. Construa um intervalo de confiança para a verdadeira duração média da peça com um nível de 95%. 2. Entre os 10 pavilhões mais visitados de uma exposição universal, foram seleccionados aleatoriamente três, tendo sido registados os tempos de espera para visitar os mesmos a partir das 12 horas. Seguem-se os dos obtidos relativos as 3 amostras aleatórias dos tempos de espera registados em minutos, para os 3 pavilhões: Pav 1: e . Pav 2: e . Pav 3: a) Admitindo a normalidade dos tempos de espera do pavilhão 1, construa o intervalo de confiança de nível 0,05, para a média dos tempos de espera do mesmo. 3. A altura de 10000 estudantes do Ensino básico têm distribuição aproximadamente normal com média de 170 cm e desvio padrão de 5 cm. a) Qual o número esperado de estudantes com altura superior a 1,65 m? b) Qual o intervalo simétrico em torno da média, que conterá 75% das alturas dos estudantes? Intervalo de confiança para a proporçopes 4.Numa amostra de 200 indivíduos, que utilizam automóvel nas suas deslocações, casa -emprego, 50 declaram-se disponíveis para passar a utilizar o metropolitano caso este passasse a chegar á sua zona de residência. Com base nos resultados apresentados: a) Construa um intervalo de confiança a 95% para a verdadeira proporção de indivíduos nessas condições. b) Qual deve ser a dimensão da amostra a recolher para reduzir a amplitude desse intervaloa metade, mantendo o mesmo grau de confiança. Intervalo de confiança para variância 5.Suponha-se que o tempo de vida ( em horas) de componentes electrónicos produzidos segundo determinado processo de fabrico, tem distribuição normal. Obtida uma amostra casual de n=20 componentes da produção de certo dia, verificou-se a duração das mesmas, e calculou-sea média e o desvio padrão da amostra, obtendo-se:e . Determine o intervalo de confiança a 90% para o desvio padrão do tempo de vida das componentes electrónicas. 6. Com o objectivo de analisar os salários de certa empresa, seleccionou-se aleatoriamente um amostra de funcionários da mesma. Os salários correspondentes, em centenas de euros, apos tratados revelaram os resultados seguintes: e Construa o intervalo de confiança ao nível 0,95 para: a) A média dos salários; b) O desvio padrão dos salários. Soluções 1. 2. 3. a) 8413 b) ]164,25; 175,75[ 4. a) b) 800 5. 6.a) b) Lição No 2 3.2 Teoria de decisão estatística, testes de hipóteses e significância Introdução Ao tentar a fixação de decisões, é conveniente a formulação de hipóteses a cerca das populações interessadas. Essas suposições que podem ser verdadeiras ou não, chamam se hipóteses Estatísticas. Os testes de hipóteses são uma segunda vertente da inferência estatística, tendo por objectivo verificar, a partir de dados observados numa amostra, a validade de certas hipóteses relativas à população. No caso particular dos testes paramétricos a validação diz apenas respeito aos parâmetros da população. O resultado do teste corresponde inevitavelmente a uma das duas respostas possíveis para cada questão: afirmativa ou negativa. Testamos hipóteses para tomarmos uma decisão entre duas alternativas. Por essa razão, o Teste de Hipótese é um Processo de Decisão Estatística. Tipos de Hipótese Designa-se por , a hipótese nula, a hipótese estatística a ser testada, e por a hipótese alternativa. A hipótese nula contém sempre uma igualdade ( o que se assume como correcto até prova em contrário), enquanto a hipótese alternativa é dada por uma desigualdade. Os testes classificam-se em Bilaterais e unilaterais: Teste bilateral Teste unilateral direito Teste unilateral esquerdo Hipótese Hipótese Hipótese Procedimentos padrão para a realização de um Teste de Hipóteses i. Formular as hipóteses de teste (nula e alternativa); ii. Seleccionar a estatística de teste adequada; iii. Recolher os dados e calcular o valor observado para a estatística de teste; Determinado o valor de Z observado, existem dois procedimentos subsequentes: 1º Procedimento: i. Determinar a probabilidade associada à estatística de teste; ii. Comparar o valor com o nível de significância; iii. Decidir rejeitar ou não a hipótese nula. Se não rejeitar a hipótese nula e se rejeitar a hipótese nula; iv. Interpretar e concluir. 2º Procedimento: i. Escolher o nível de significância de teste; ii. Definir as regiões de aceitação (R.A) e de rejeição (R.R); iii. Comparar a estatística observada com as regiões críticas; iv. Decidir rejeitar ou não a hipótese nula. Se a estatística de teste pertencer a R.A não rejeitar a hipótese nula e rejeitar se pertencer a R.R; v. Interpretar e concluir. Erro no teste de hipótese Tal como qualquer sistema legal, o processo do teste de hipóteses não é perfeito. Existem dois tipos de erros que podem ser cometidos: Decisão é verdadeira é falsa Rejeitar Decisão incorrecta Erro do tipo I. Decisão correcta P( rejeitar / verdadeira)= Não rejeitar Decisão correcta () Decisão incorrecta Erro do tipo II. () Na prática, a pessoa que conduz o teste de hipóteses especifica a probabilidade máxima permissível de se cometer o erro de tipo I, chamado nível de significância para o teste. Ecolhas comuns para o nível de significância são 0.05 e 0.01. 3.2.1. Teste de Hipóteses para a Média de Populações normais com variâncias conhecidas A grandeza padronizada é dada por: Região de rejeição e de aceitação da hipótese nula Teste bilateral Teste unilateral direito Teste unilateral esquerdo Hipótese Hipótese Hipótese Regiões críticas Regiões críticas Regiões críticas Cálculo do valor de P Cálculo do valor de P Cálculo do valor de P Exercicios 1. Certo candidato as eleições para determinada associação académica declarou, a dada altura da campanha, que iria obter a maioria. Um elemento da sua comitiva resolveu seleccionar ao acaso 100 elementos; 47 responderam que iriam votar nesse candidato. Verifique se os dados evidenciam que o candidato tinha razão. Resolução: Como apenas se tem a proporção dos elementos que iriam votar o teste de significância ´unilateral direito á proporção. Para obter a maioria teria que ser contemplado com mais de 50% dos votos. Assim ter-se-ia um teste da forma: a um nível de significância de 5% α Como 100 é o numero dos inqueridos e 47 ´o numero dos que iriam votar, . Por definição, e , então, e que consultando na tabela terremos: . Sendo as regiões de aceitação e de rejeição, e respectivamente, como o Z pertence a região de aceitação, não rejeitar . 2.Um fabricante de lajotas de cerâmica introduz um novo material em sua fabricaçao e acredita que aumentará a resistência média, que é de 206 kg. A resistência das lajotas tem distribuição normal, com desvio padrão de 12 kg. Retira-se uma amostrade 30 lajotas, obtendo-se X’ =210 kg. Ao nível de 10%, pode o fabricante aceitarque a resistência média de suas lajotas tenha aumentado? Resoluçao: 1º As hipóteses são: 2º As regiòes críticas são: Como as regioes de aceitaçao e de rejeiçao são e , respectivamente, o Zcalc > Zα, rejeita-se H0, isto é, ao nível de 10% o fabricante pode concluirque a resistência média de suas lajotas aumentou. 3.Determinada empresa, procede á embalagem embalagem de certo produto estando especificado que a máquina deve ser reparada se for detectaque as embalagens do produto tenham em média, 500g. uma amostra aleatória de 30 embalagens seleccionadas em determinado perido de tempo revelou pesos que nos conduzem aos seguintes resultados: e . Supondo que o peso das embalagens tem distribuiçao normal, encontrar evidencia suficiente de que a máquina deve ser reparada, ao nível de significancia de 5%. Solucao: não reitar a . 4. Bibliografia CHISTINE, Dancey. Estatística sem Matemática para Psicologia. 3.ed. São Paulo, Artmed Editora, 2006. F. Jaime e T. Daniel, Exercícios de Estatística, Edi,coes Sílabos, Lda. 1ª Ed. Lisboa, Abril, 2002 F. Pedro Lopes, Estatistica Descritiva e Inferencial, Faculdade de Economia, Universidade de Coimbra, 2005; H. Andreia, N.Cláudia e P. António, Grande Maratona de Estatística no SPSS, Escolar Editora, 2011; L.Veríssimo , A. Maria Gomes e F. Pedro Lopes, Estatistica Aplicada À gestão, Vida Económica-Editorial, SA, 2012 LEVIN, J. Fox James. Estatística para Ciências Humanas. São Paulo, Prentice Hall, 2000. PESTANA Maria e GAGEIRO, João. Análise de Dados para Ciências Sociais- A complementaridade do SPSS. 3 ed. Edições Sílabo, 2000. Sonia Maria Barros Barbosa Correa. Probabilidade e Estatística. 2ª Edição. © PUCMINAS, 2003 Apêndices Tabela da distribuição Normal padrão z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 -4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002 -3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003 -3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005 -3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008 -3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011 -3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017 -3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024 -3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035 -3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050 -3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071-3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00103 0.00100 -2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139 -2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193 -2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264 -2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357 -2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480 -2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639 -2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842 -2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101 -2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426 -2.0 0.02275 0.02222 0.02169 0.02118 0.02067 0.02018 0.01970 0.01923 0.01876 0.01831 -1.9 0.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330 -1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938 -1.7 0.04456 0.04363 0.04272 0.04181 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673 -1.6 0.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551 -1.5 0.06681 0.06552 0.06425 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592 -1.4 0.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07214 0.07078 0.06944 0.06811 -1.3 0.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08691 0.08534 0.08379 0.08226 -1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09852 -1.1 0.13566 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702 -1.0 0.15865 0.15625 0.15386 0.15150 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786 -0.9 0.18406 0.18141 0.17878 0.17618 0.17361 0.17105 0.16853 0.16602 0.16354 0.16109 -0.8 0.21185 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673 -0.7 0.24196 0.23885 0.23576 0.23269 0.22965 0.22663 0.22363 0.22065 0.21769 0.21476 -0.6 0.27425 0.27093 0.26763 0.26434 0.26108 0.25784 0.25462 0.25143 0.24825 0.24509 -0.5 0.30853 0.30502 0.30153 0.29805 0.29460 0.29116 0.28774 0.28434 0.28095 0.27759 -0.4 0.34457 0.34090 0.33724 0.33359 0.32997 0.32635 0.32276 0.31917 0.31561 0.31206 -0.3 0.38209 0.37828 0.37448 0.37070 0.36692 0.36317 0.35942 0.35569 0.35197 0.34826 -0.2 0.42074 0.41683 0.41293 0.40904 0.40516 0.40129 0.39743 0.39358 0.38974 0.38590 -0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038 0.43644 0.43250 0.42857 0.42465 -0.0 0.50000 0.49601 0.49202 0.48803 0.48404 0.48006 0.47607 0.47209 0.46811 0.46414 z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 Tabela de distribuição t- Student gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408 08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,1694,587 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850 21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819 22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792 23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767 24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745 25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,726 26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707 27 0,127 0,256 0,389 0,531 0,684 0,856 1,057 1,314 1,703 2,052 2,473 2,771 3,690 28 0,127 0,256 0,389 0,530 0,683 0,856 1,056 1,313 1,701 2,048 2,467 2,763 3,674 29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659 30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646 40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551 60 0,126 0,254 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 3,460 120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373 i 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,2 Distribuição de Qui Quadrado gl/P 0,99 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001 1 ,0002 0,004 0,016 0,064 0,148 0,455 1,074 1,642 2,706 3,841 5,412 6,635 10,827 2 0,020 0,103 0,211 0,446 0,713 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13,815 3 0,115 0,352 0,584 1,005 1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16,266 4 0,297 0,711 1,064 1,649 2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18,467 5 0,554 1,145 1,610 2,343 3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,080 20,515 6 0,872 1,635 2,204 3,070 3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22,457 7 1,239 2,167 2,833 3,822 4,671 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24,322 8 1,646 2,733 3,490 4,594 5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26,125 9 2,088 3,325 4,168 5,380 6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27,877 10 2,558 3,940 4,865 6,179 7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29,588 11 3,053 4,575 5,578 6,989 8,148 10,341 12,899 14,631 17,275 19,675 22,618 24,725 31,264 12 3,571 5,226 6,304 7,807 9,034 11,340 14,011 15,812 18,549 21,026 24,054 26,217 32,909 13 4,107 5,892 7,042 8,634 9,926 12,340 15,119 16,985 19,812 22,362 25,472 27,688 34,528 14 4,660 6,571 7,790 9,467 10,821 13,339 16,222 18,151 21,064 23,685 26,873 29,141 36,123 15 5,229 7,261 8,547 10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37,697 16 5,812 7,692 9,312 11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39,252 17 6,408 8,672 10,085 12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40,790 18 7,015 9,390 10,865 12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42,312 19 7,633 10,117 11,651 13,716 15,532 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43,820 20 8,260 10,851 12,443 14,572 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45,315 i = infinito Plano Temático de Estatística para Ensino Básico Disciplina: Estatística Educacinal Introdução A disciplina de Estatística Educacional visa fornecer subsídios teóricos básicos que permitam ao estudante recolher, analisar e interpretar os dados. Ajudará ao estudante a comprovar cientificamente as suas hipóteses de investigação e a detectar erros no uso de alguns instrumentos de medição Esta disciplina será um instrumento principal para um estudante efectuar trabalhos de pesquisas auxiliando-o na apresentação de dados bem como na expressão gráfica desses mesmos dados. Código Tipo Nível Ano Semestre Créditos Horas lectivas 150 Complementar 1 º º 6 80C 70E 1. Competências Os estudantes deverão: · Aplicar e desenvolver técnicas de recolha e análise de Estatísticas Educacionais; · Aplicar métodos quantitativos na elaboração de um projecto de pesquisa; · Utilizar pacotes informáticos Excel ou o SPSS no processamento e análise de dados; · Elaborar relatórios fazendo um uso apropriado da informação estatística. 2. Objectivos gerais No fim do curso os participantes devem ser capazes de: · Recolher, organizar, sumarizar e interpretar dados referentes `a diversas varáveis através de tabelas de distribuição de frequências, representação gráfica e medidas estatísticas; · Organizar e gerir uma base de dados utilizando pacotes informáticos Excel ou SPSS; · Usar pacotes estatísticos na análise de dados · Transformar em base de dados as respostas aos questionários; · Estimar e analisar Indicadores de eficácia interna do sistema de educação Moçambicano. · Dada uma situação identificar os modelos de variáveis a analisar e identificar formas apropriadas da recolha de dados; · Fazer estimativas utilizando modelos de regressão linear; · Identificar aspectos estatísticos preponderantes na preparação e realização de projectos; · Reconhecer e interpretar curvas de distribuição normal, Student e Q · ui-quadrado; · Inferir sobre aspectos relacionados com variáveis, utilizando intervalos de confidência, testes de hipóteses e regressão linear. · Desenvolver capacidades de trabalho em equipe realizando pesquisas de opiniões que envolvam definição de amostra, elaboração de questionário, processamento de dados e elaboração do relatório sobre os resultados fazendo um uso apropriado da informação estatística. 3. Pré-requisitos Não Existem 4. Plano Temático Nr. Tema Horas de Contacto Horas de Estudo 1 Introdução e Conceitos Básicos de Estatística 6 4 2 Distribuição de frequências 6 4 3 Medidas de Localizacao 8 8 4 Medidas de Dispersao 8 7 5 Correlacao e Regressao simples 6 4 6 Teoria elementar de probabilidades 8 7 7 Distribuições · Normal · Qui-quadrado · T-student 8 8 8 Introdução a inferência e estatística Teoria elementar de amostragem 8 7 9 Teoria estatística e de estimação 6 6 10 Teoria de decisão estatística, testes de hipóteses e significância 8 8 11 Aulas de Avaliação 8 7 Sub-Total 80 70 TOTAL 150 5. Estratégias e métodos de ensino e aprendizagem · Os conceitos serãointroduzidos a partir de situações concretas do processo de investigação. Servirão de material didáctico para a aprendizagem da análise estatística base de dados do Ministério da Educação de Moçambique ou outras relacionadas com problemáticas da educação. · As aulas terão uma parte introdutória, seguida de trabalhos práticos com ênfase no processamento de dados, produção de tabelas, gráficos e elaboração de relatórios de análise de resultados. · Estimar e analisar Indicadores de eficácia interna do sistema de educação Moçambicano. · O estudo de casos e a resolução de exercícios e problemas será o aspecto fundamental da metodologia de trabalho. Para cada tópico o estudante deverá resolver problemas, identificar os procedimentos no SPSS ou Excel e fazer um relatório da interpretação do “output” apresentando as conclusões aos restantes membros do grupo. 6. Meios de ensino · Material Básico de Ensino 7. Avaliação A avaliação será regida pelas normas de avaliação em vigor na UP. Ele terá duas vertentes: a formativa e normativa. Os instrumentos a usar na avaliação serão: · Observação da participação nas aulas, apresentação de seminários e trabalhos em grupo; · Relatórios de análise de dados( estudos de casos) e testes. 8. Bibliografia CHISTINE, Dancey. Estatística sem Matemática para Psicologia. 3.ed. São Paulo, Artmed Editora, 2006. F. Jaime e T. Daniel, Exercícios de Estatística, Edi,coes Sílabos, Lda. 1ª Ed. Lisboa, Abril, 2002 F. Pedro Lopes, Estatistica Descritiva e Inferencial, Faculdade de Economia, Universidade de Coimbra, 2005; H. Andreia, N.Cláudia e P. António, Grande Maratona de Estatística no SPSS, Escolar Editora, 2011; L.Veríssimo , A. Maria Gomes e F. Pedro Lopes, Estatistica Aplicada À gestão, Vida Económica-Editorial, SA, 2012 LEVIN, J. Fox James. Estatística para Ciências Humanas. São Paulo, Prentice Hall, 2000. PESTANA Maria e GAGEIRO, João. Análise de Dados para Ciências Sociais- A complementaridade do SPSS. 3 ed. Edições Sílabo, 2000. Sonia Maria Barros Barbosa Correa. Probabilidade e Estatística. 2ª Edição. © PUCMINAS, 2003 Distribuicão dos Salário de Empregados de uma Empresa Número de Empregados 500 600 700 1500 1700 2000 2600 1 4 2 1 1 1 1 Vencimentos Número de Empregados E Empregados por ramo de actividade Administractivo-100º Transporte-60º Design- 45º Construcao- 125º Vendas- 30º 100 60 45 125 30 Administractivo-100º Transporte-60º Design- 45º Construcao- 125º Vendas- 30º Administractivo-100º Transporte-60º Design- 45º Construcao- 125º Vendas- 30º Vendas(milhares) Jan Feb Mar Apr May Jun 3.32 3.2800000000000002 3.3 3.38 3.4499999999999997 3.5 Jan Feb Mar Apr May Jun Jan Feb Mar Apr May Jun Vendas(milhares) Jan Feb Mar Apr May Jun 3 3 3 3 3 4 Jan Feb Mar Apr May Jun Jan Feb Mar Apr May Jun No. de alunos 13 14 15 16 17 2 7 9 3 2 Distribuicão das Alturas dos alunos da 10aclasse fi [1,45;1,50[ [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65; 1,70[ [1,70; 1,75[ 2 4 5 7 3 2 altura Distribuicão das Alturas dos Alunos da 10a Classe Freq.Absoluta [1,45; 1,50[ [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65; 1,70[ [1,70; 1,75[ 2 4 5 7 3 2 Alturas Números de alunos Cor dos olhos de 54 pessoas Efectivos Azul Verde Cinzenta castanha 10 5 19 20 2 1 + = n K 1 n 2 n 2 1 s s e ) 1 ; 0 ( ~ ) ( ) ( 2 2 2 1 2 1 2 1 2 1 N n n x x Z s s m m + - - - = a a a - = ÷ ÷ ø ö ç ç è æ < < ÷ ø ö ç è æ - 1 2 1 2 Z Z Z P Þ a s s m m s s a a - = ÷ ÷ ø ö ç ç è æ + + - < - < + - - ÷ ø ö ç è æ - ÷ ø ö ç è æ - 1 2 2 2 1 2 1 2 1 2 1 2 1 2 2 2 1 2 1 2 1 2 1 n n Z X X n n Z X X P % 100 ) 1 ( ´ - a ê ê ë é ú ú û ù + + - < - < + - - ÷ ø ö ç è æ - ÷ ø ö ç è æ - 2 2 2 1 2 1 2 1 2 1 2 1 2 2 2 1 2 1 2 1 2 1 n n Z X X n n Z X X s s m m s s a a ) 2 ( ~ 2 ) 1 ( ) 1 ( 1 1 ) ( ) ( 2 1 2 1 2 2 2 2 1 1 2 1 2 1 2 1 - + - + - + - + - - - = n n t n n S n S n n n x x T m m 2 1 + + = k k x x Me ) ( ~ ) ( ) ( 2 2 2 1 2 1 2 1 2 1 v t n S n S x x T + - - - = m m 2 2 2 2 2 2 1 2 1 1 2 2 2 2 1 2 1 1 1 1 1 ÷ ÷ ø ö ç ç è æ - + ÷ ÷ ø ö ç ç è æ - ÷ ÷ ø ö ç ç è æ + = n S n n S n n S n S T ï î ï í ì = = = 60 85 6 2 2 2 2 x S n ï î ï í ì = = = 625 , 59 125 , 89 8 2 2 3 3 x S n 27 , 5 2 8 6 125 , 89 7 85 5 8 1 6 1 2 ) 1 ( ) 1 ( 1 1 2 1 2 2 2 2 1 1 2 1 = - + ´ + ´ + = - + - + - + n n S n S n n n ( ) ê ê ë é ú ú û ù - + - + - + ± - - - + 2 ) 1 ( ) 1 ( 1 1 2 1 2 2 2 2 1 1 2 1 2 1 ; 2 2 2 3 2 n n S n S n n n t x x n n a ( ) ( ) ] [ ] [ 974 , 11 ; 224 , 11 27 , 5 625 , 59 60 ; 27 , 5 625 , 59 60 975 , 0 ; 11 975 , 0 ; 11 - = ´ + - ´ - - t t 2 1 n k = 1832 = x 497 = S å = = 10 1 7 , 147 i i x å = = 10 1 2 37 , 3067 i i x ] [ 98 , 500 ; 02 , 499 ] [ 324 , 73 ; 676 , 56 ] [ 31 , 0 ; 19 , 0 ] [ 09 , 681 ; 58 , 394 . 1 2 1 2 + = + = n k k ] [ 867 , 21 ; 673 , 7 ] [ 112 , 18 ; 824 , 6 0 H 1 H 0 0 : m m = H 0 1 : m m ¹ H 0 0 : m m £ H 0 1 : m m > H 0 0 : m m ³ H 0 1 : m m < H P < a P ³ a 0 H 0 H 4 2 1 7 = + a £ P 0 H 1 H b - 1 0 H a - > 1 P b = P Þ ) ( 2 observado Z z P P ³ = ) ( observado Z z P P ³ = ) ( observado Z Z P P - £ = î í ì > £ 5 , 0 : 5 , 0 : 1 0 p H p H 47 , 0 100 47 = = p ) n p p S p ) ˆ 1 ( - = ) 6 , 0 05 , 0 03 , 0 100 ) 5 , 0 1 ( 5 , 0 5 , 0 47 , 0 - = - = - - = Z 3 2 6 2 1 = = = n k 95 , 0 05 , 0 1 1 Z Z Z = = - - a 645 , 1 95 , 0 = Z ] [ 645 , 1 ; ¥ - [ [ ¥ ; 645 , 1 0 H 206 : 206 : 1 0 ¹ = m m H H ] [ 28 , 1 ; ¥ - [ [ +¥ ; 28 , 1 g x i i 13443 30 1 = å = ( ) 2 30 1 2 2100 g x x i i = - å = 8 2 9 7 2 2 4 3 1 = + = + = + = + x x x x Me k k 0 H P X P P gl = > ) ( 2 ; c anos X Me n k 15 12 2 1 23 2 1 12 = = Þ = + = + = 24 2 48 2 1 = = = n k 87 2 25 24 = + = x x Me h f ant F n l Me e M i Me ]. 2 [ ¯ - + = 2 n 2 n 65 , 1 046 , 0 60 , 1 05 , 0 . 7 5 , 6 60 , 1 05 , 0 . 7 5 5 , 11 60 , 1 ]. 2 [ » + = + = ú û ù ê ë é - + = ¯ - + = h f ant F n l Me e M i Me h x M oc ]. 2 1 [ 1 0 D + D D + = h f f f f f x M post ant ant Mo oc ]. ) ( 2 ) ( [ max max + - - + = m h f f f f f x M post ant ant Mo oc 62 , 1 02 , 0 60 , 1 05 , 0 . 6 2 60 , 1 05 , 0 ]. ) 3 5 ( 7 . 2 5 7 [ 60 , 1 ]. ) ( 2 ) ( [ max max = + = + = + - - + = + - - + = h f f f x M post ant post o M ok . ú ú û ù ê ê ë é + + = X m h f f f x M post ant post o M ok 62 , 1 02 , 0 60 , 1 05 , 0 . 8 3 60 , 1 05 , 0 ]. 3 5 3 [ 60 , 1 . = + = + = + + = ú ú û ù ê ê ë é + + = X Me M op 2 3 - = X Þ = X X X 1100 11 2600 2000 1700 1500 700 . 2 600 . 4 500 7 1 = + + + + + + = = å = n fiXi X i 6 2 12 2 1 = = + = Þ n K X 4 n i q i = e ) 1 ( 75 , 5 4 ) 23 .( 1 1 posicaoQ q = = e ) 2 ( 5 , 11 4 ) 23 ( 2 2 posicaoQ q = = e 2 12 11 = = x x 2 = 0 + 2 = 2).0,5 - (2 + 2 5 , 0 ). ( 2 11 12 11 = - + = x x x Q ) 3 ( 25 , 17 4 ) 23 ( 3 3 posicaoQ q = = e 18 17 x e x ) 1 ( 5 , 1 4 ) 6 .( 1 1 psicaoQ q = = e ) 3 ( 5 , 4 4 ) 6 .( 3 3 posicaoQ q = = e 4 in q i = e h f ant Fi q l Qi classe i i * ¯ - + = e 5 , 27 4 110 . 1 1 = = q e 0 , 55 4 110 . 2 2 = = q e 5 , 82 4 110 . 3 3 = = q e h f ant F q l Q Q Q * ¯ - + = 1 1 1 1 1 e ant F ¯ 1 06 , 2 2 16 27 5 , 27 2 1 = * - + = Q 70 , 4 2 34 43 55 4 2 = * - + = Q 65 , 6 2 17 77 5 , 82 6 3 = * - + = Q 10 in Edi = h f ant Fi Edi li Di Di * . ¯ - + = 22 10 110 * 2 2 = = Ed 55 10 110 * 5 5 = = Ed 77 10 110 * 7 7 = = Ed 63 , 1 2 * 27 0 22 0 2 = - + = D 70 , 4 2 * 34 43 55 4 5 = - + = D 00 , 6 2 * 34 43 77 4 7 = - + = D 100 in Eci = h f ant Fi Eci li Ci ci * . ¯ - + = 5 , 27 100 110 * 25 25 = = Ec 55 100 110 * 50 50 = = Ec 5 , 82 100 110 * 75 75 = = Ec 06 , 2 2 * 16 27 5 , 27 2 25 = - + = C 70 , 4 2 * 34 43 55 4 50 = - + = C 65 , 6 2 * 17 75 5 , 82 6 75 = - + = C n x x Dm n i i å = - = 1 n x x fi Dm m i i å = - = 1 } { 20 , 15 , 8 , 5 , 2 10 5 20 15 8 5 2 = + + + + = = å n xi x 6 5 10 20 10 15 10 8 10 5 10 2 = - + - + - + - + - = Dm x 2 d ( ) 2 1 2 1 2 2 x n x n x xi n i i n i - = - = å å = = d ( ) 1 1 1 2 1 2 1 2 2 - ÷ ø ö ç è æ - = - - = å å å = = = n n xi xi n x xi S n i n i n i ( ) 2 1 2 1 2 2 * * x n x fi n x xi fi m i i m i - = - = å å = = d ( ) 1 * * 1 * 1 2 1 2 1 2 2 - ÷ ø ö ç è æ - = - - = å å å = = = n n xi fi xi fi n x xi fi S m i m i m i d ( ) 2 1 2 1 2 x n xi n x xi n i n i - = - = å å = = d ( ) 1 ) ( 1 1 1 2 2 1 2 - - = - - = å å å = = = nn xi xi n x xi S n i n i n i ( ) 2 1 2 1 2 * * x n xi fi n x xi fi m i m i - = - = å å = = d ( ) 1 * * 1 * 1 2 1 2 1 2 - ÷ ø ö ç è æ - = - - = å å å = = = n n xi fi xi fi n x xi fi S m i m i m i 2 d O M Me x = = ] [ d d + - x x ; ] [ d d 2 ; 2 + - x x ] [ d d 3 ; 3 + - x x å = 100 fi å = 1047 . xi fi å = 11869 . 2 xi fi å = * 1047 xi fi 47 , 10 100 1047 = = * = å n xi fi x å = * 11869 2 xi fi ( ) 0691 , 9 47 , 10 100 11869 2 2 2 2 = - = - * = å x n xi fi d 01 , 3 0691 , 9 2 = = = d d 49 , 16 01 , 3 2 47 , 10 2 45 , 4 01 , 3 2 47 , 10 2 = * + = + = * - = - d d x x ] [ d d + - x x ; å = + + + = = 50 9 11 25 5 n fi å = 5 , 586 . xi fi å = 75 , 7276 . 2 xi fi 73 , 11 = x ( ) 818 , 2 73 , 11 50 75 , 7276 2 = - = d ] [ d d + - x x ; Î 49 , 0 5 6 91 , 8 5 , 9 = * - Î 11 , 0 9 4 5 , 14 55 , 14 = * - % 2 , 73 % 100 50 6 , 36 = * Media oabsoluta a Dispers ~ = d x % 100 * = x CVp d n fi fi fi fri k i = = å = 1 % 100 * = x S CVp mm x 108 = % 52 , 2 0252 , 0 9 , 107 72 , 2 = = = mm mm CVp % 00 , 1 01 , 0 108 08 , 1 = = = mm mm CVp % 15 £ CV % 30 % 15 p p CV % 30 ³ CV d x x Z - = i X ( ) i i Y X ; % 100 * n fi fri = 2 l = A l i Y i Y xy xy C ou S ( ) ( ) n y y x x S n i i i xy å = - - = 1 i x i y ( ) x x i - fk f f fi n k i + + + = = å = ... 2 1 1 ( ) y y i - ( ) ( ) y y x x i i - - å = n i 1 51 10 510 3 10 30 1 1 = = = = = = å å = = n y y e n x x n i i n i i ( ) ( ) 9 . 9 10 99 1 = = - - = å = n y y x x S n i i i xy xy r ( ) ( ) ( ) ( ) å å å = = = - - - - = = n i n i i i n i i i y x xy xy y y x x y y x x S S S r 1 1 2 2 1 0 2 , 0 2 , 0 0 < < - < < xy xy r ou r 2 , 0 4 , 0 4 , 0 2 , 0 - £ < - < £ xy xy r ou r 4 , 0 7 , 0 7 , 0 4 , 0 - £ < - < £ xy xy r ou r i f 7 , 0 9 , 0 9 , 0 7 , 0 - £ < - < £ xy xy r ou r 9 , 0 1 1 9 , 0 - £ < - < £ xy xy r ou r xy r ( ) 2 x x i - ( ) 2 y y i - ( ) ( ) ( ) ( ) 93 . 0 4 . 106 99 566 20 99 1 1 2 2 1 = = ´ = - - - - = å å å = = = n i n i i i n i i i xy y y x x y y x x r l + + = b ax y l % 100 ´ = n f f i ri ( ) y onde y y n i i ˆ ; ˆ 1 å = - ( ) ( ) ( ) x a y b x x y y x x S a n i i n i i i x xy S - = - - - = = å å = = ; 1 2 1 2 b ax y + = 15 . 36 95 . 4 + = x y 85 . 65 15 . 36 6 95 . 4 = + = x y r xy R 2 2 = 8649 , 0 93 , 0 2 2 2 = = = r xy R å fi å * xi fi i F ] [ d d 4 ; 4 + - x x ] [ d d + - x x ; x y 969 , 22 56 , 260 - = { } co ca , { } coco coca caco caca , , , { } 6 , 5 , 4 , 3 , 2 , 1 = S { } caca A = { } caco caca B , = { } = C A i Fr { } coco coca caco caca S , , , = { } caca A = { } caco coca coco A , , = S A = f = Ç A A f = Ç B A { } 6 , 5 , 4 , 3 , 2 , 1 = S { } 2 = A { } 6 , 5 , 4 , 3 = B f = Ç B A 042 , 0 6 25 , 0 classe de Amplitude = = - = k Li Ls S B A ¹ È S B A = È ( ) ( ) ( ) ( ) { } coco coca caco caca S , , , = B A B A + = È { } 7 , 6 = A { } 7 , 6 , 5 , 4 , 3 = B { } 7 , 6 , 5 , 4 , 3 = + = È B A B A B A B A * = Ç { } 9 , 7 , 6 , 5 = A { } 10 , 8 , 5 , 4 = B n k = { } 5 * = = Ç B A B A ) ( ) ( ) ( S n A n A P = { } 6 , 5 , 4 , 3 , 2 , 1 = S { } 3 = A 6 1 ) ( = A P 5 , 0 2 1 6 3 ) ( = = = B P { } 6 , 4 , 2 = B 4 , 0 5 2 15 6 5 4 6 6 ) ( = = = + + = A P 1680 5 . 6 . 7 . 8 ! 4 ! 4 . 5 . 6 . 7 . 8 ! 4 ! 8 = = = ( ) ( ) ( ) ( ) ( ) n n n n n n n n n n - = - = - - - = - 2 1 ! 2 ! 2 1 ! 2 ! ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ] ( ) ( ) 1 1 ! 2 1 1 1 ! 2 ! 2 1 ! 2 ! 2 1 ! 1 ! 2 ! 2 - + - = - - + - - = - - - + - - = - - + n n n n n n n n n n n n n n n n n ( ) ! 1 - n ! !... ! ! 2 1 r n n n n Pn = 1260 3 . 2 . 5 . 6 . 7 ! 2 . 1 . 2 ! 2 . 3 . 4 . 5 . 6 . 7 ! 2 ! 2 ! 7 = = = ri f n r £ ( ) ! ! ) , ( r n n r n A - = r n ³ ( ) 24 1 . 2 . 3 . 4 ! 3 4 ! 4 = = - ( ) 12 ! 2 ! 2 . 3 . 4 ! 2 4 ! 4 = = - = ( ) ( ) 15600 24 . 25 . 26 ! 23 ! 23 . 24 . 25 . 26 ! 3 26 ! 26 3 , 26 = = = - = A N n Î n n A A 2 4 42 * = ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3 2 1 ! 4 ! 4 3 2 1 ! 4 ! 4 - - - = - - - - - = - = n n n n n n n n n n n n A n ( ) ( ) ( ) ( ) ( ) 1 ! 2 ! 2 1 ! 2 ! 2 - = - - - = - = n n n n n n n n A n ( ) ( ) ( ) 3 2 1 - - - n n n n ( ) 1 - n n Þ ( ) ( ) 3 2 - - n n Þ i Fr 42 6 5 2 = + - n n 0 36 5 2 = - - Þ n 1 ³ n N n Î ÷ ø ö ç è æ n r C n r ( ) ( ) ! ! ! ! , r r n n r r n A C n r - = = ) r ³ ÷ ÷ ø ö ç ç è æ - + - 1 1 n p n ÷ ÷ ø ö ç ç è æ - - 1 1 p n ( ) 2600 1 . 2 . 3 !. 23 ! 23 . 24 . 25 . 26 ! 3 ! 3 26 ! 26 = = - 000 . 14 1 . 2 . 3 . 4 5 . 6 . 7 . 8 . 1 . 2 4 . 5 . 1 . 2 . 3 4 . 5 . 6 . . 8 4 5 2 6 3 = = C C C 1326 52 2 = C 78 13 2 = C 51 3 1326 78 = = P 102 13 1326 169 = = P ( ) ! ! 2 n n + ( ) ! 1 ! - n n ( ) ( ) ! 1 ! 1 - + n n ( ) ( ) ! 2 ! 1 + - n n ( ) ! ! 1 n n + ( ) ! 2 ! - n n ( ) ( ) ! 1 ! 1 - - + - r n r n ( ) ( ) ! 2 ! 2 2 n n + ( ) ( ) ! 1 ! ! 1 - + + n n n 5 4 3 3 A A + 4 2 5 2 A A 3 2 5 3 2 A A - 10 6 10 4 C C = 15 5 15 6 15 6 C C C + = 30 3 2 4 3 = + A A ! 3 3 3 2 n n C C n n n n - = + - - 72 2 = n A 10 1 10 1 + - = n n C C n n A A 4 1 3 = + n n C C 2 1 3 7 3 = + n n A A 2 2 2 50 2 = - ( ) 2 2 1 3 3 9 7 - - + = n n n A A A ( ) ( ) 2 3 1 2 2 + + = + + n n n n å å å = = = = = + + + + = n i i n i i n i i n f X n X n x x x x X 1 1 1 3 2 1 ... ( ) n n n n + = + 2 1 . ( ) ( ) n n n n n n 2 3 1 2 2 3 + + = + + ( ) n n n n - = - 2 1 . ( ) ( ) r n r n - + - 1 ( ) ( ) 2 6 4 1 2 2 2 2 + + = + + n n n n ( ) n n n n 2 2 . 2 + = + N $ / 1 ) ( 0 £ £ A P 0 6 0 = = P , S S A = Ç X 1 ) ( ) ( ) ( = = S n S n A P A ( ) ( ) 1 = + A P A P ( ) ) ( 1 A P A P - = A ( ) 6 , 0 5 3 5 2 1 ) ( 1 = = - = - = A P A P ( ) ( ) ( ) ( ) B A P B P A P B A P Ç - + = È ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) C B A P C B P C A P B A P C P B P A P C B A P Ç Ç + Ç - Ç - Ç - + + = È È ( ) ( ) ( ) B P A P B A P + = È 2 , 3 5 16 5 5 4 2 3 2 = = + + + + = ( ) 0 = Ç B A P n A A A ,..., , 2 1 n P P P ,..., , 2 1 n P p P P + + + = ... 2 1 ( ) 5 2 15 6 = = A P ( ) 15 4 = B P ( ) 0 = Ç B A P ( ) ( ) ( ) 3 2 15 4 6 15 4 5 2 = + = + = + = È B P A P B A P ( ) 13 4 52 16 52 1 52 13 52 4 = = - + = È B A P ( ) 52 4 = A P å å å = = = = = + + + = m i i m i i i m i i i m m f x f n x f n x f x f x f X 1 1 1 2 2 1 1 ... ( ) 52 13 = B P ( ) 52 1 = Ç B A P ( ) ( ) ( ) ( ) ( ) A P B A P B P A P B A P A B P / ) ( ´ = Ç = ( ) elementosA n B elementosA n A B P 0 0 Ç = ( ) ( ) B P A B P = ( ) ( ) ( ) A B P A P B A P . = Ç ( ) ( ) ( ) B P A P AB P . = ( ) ( ) ( ) ( ) B A C P A B P A P C B A P Ç = Ç Ç . . ( ) ( ) ( ) % 25 25 , 0 4 1 2 1 2 1 . = = = * = = Ç B P A P B A P 83 , 14 23 341 23 17 . 2 16 . 3 15 . 9 14 . 7 13 . 2 5 5 4 4 3 3 2 2 1 1 1 = = + + + + = + + + + = = å = n x f x f x f x f x f n x f X m i i i ( ) 5 2 3 2 2 = + = A P ( ) 4 1 1 3 1 = + = A B P ( ) ( ) ( ) % 10 1 , 0 10 1 4 1 . 5 2 . = = = = = Ç A B A P B A P { } ( ) ( ) ( ) ( ) ( ) { } 1 , 5 , 2 , 4 , 3 , 3 , 4 , 2 , 5 , 1 6 = = = soma A ( ) A B P ( ) ( ) { } 2 , 4 , 4 , 2 = Ç B A ( ) 5 2 = A B P ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) { } 2 , 6 , 2 , 5 , 2 , 4 , 2 , 3 , 2 , 1 , 6 , 2 , 5 , 2 , 4 , 2 , 3 , 2 , 2 , 2 , 1 , 2 = B ( ) 36 11 = B P 12 8 å å = = = + + + + + + = k i i k i i i k k k w x w w w w x w x w x w X 1 1 2 1 2 2 1 1 ... ... , 11 7 10 6 55 14 10 6 11 7 12 8 = * * = P ( ) 10 7 = A P ( ) 3 2 9 6 = = B P A ( ) 8 5 = C P AB ( ) ( ) ( ) ( ) 24 7 8 5 5 2 10 7 . . = * * = = Ç Ç C P B P A P C B A P AB A ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) i i n n B A P B P B A P B P B A P B P B A P B P A P å ´ = + + ´ + ´ = .... 2 2 1 1 ( ) 0 > A P , ,..., 1 n j = 2 , 7 10 40 14 18 5 2 3 8 . 5 7 . 2 6 . 3 = + + = + + + + = X ( ) ( ) ( ) ( ) ( ) å = ´ ´ = n i i i j j j B A P B P B A P B P A B P 1 ( ) ( ) ( ) 60 , 0 58 , 0 7 , 0 5 , 0 ) ( » ´ = ´ = V P BEV V P BEV P V BEV P X ( ) 4 , 0 = A P ( ) 9 , 0 = È B A P ( ) ( ) A P B P 2 1 = ( ) A P ( ) B P ( ) 6 , 0 = A P ( ) 8 , 0 = È B A P å å = = k i k i i i fi Pm f 1 1 ( ) t B P = ( ) ( ) B P A P 4 = ( ) A P ( ) B P ( ) A P ( ) B P ( ) 2 , 0 = A P % 9 . 10 % 8 . 6 % 2 . 61 2 i i i l L X Pm - = = % 9 . 44 5 2 ( ) 0 = Ç B A p ( ) ( ) B p A p 4 1 = - m 2 s ) , ( ~ 2 s m N X 0 , , 2 1 ) ( 2 2 1 > Î = ÷ ø ö ç è æ - - s p s s m R x e x f x 2 s = å = 6 1 i fixi R x Î " s m - = x Z ) 1 , 0 ( ~ N Z ) 45 , 0 ( < z P 6736 , 0 ) 45 , 0 ( = < z P 9345 , 0 ) 52 , 1 ( = < z P ) 52 , 1 ( > z P ) 52 , 1 ( 1 ) 52 , 1 ( £ - = > z Pz P Þ 2 li Li - 0655 , 0 9345 , 0 1 ) 52 , 1 ( = - = > z P s m - = x Z ) 3 , 2 ( ³ x P ) 1 , 2 8 , 1 ( £ £ x P i B i B 2 1 2 ~ n n i i B X c å = = ( ) ( ) 0 , 0 , 0 0 , 2 2 2 1 2 2 > ï ï î ï ï í ì £ > ÷ ø ö ç è æ = - - n x x n T x e x f n n x a c = ³ ) ( 2 x P Þ ( ) 605 , 4 2 2 ³ c P ( ) 676 , 0 2 6 ³ c P ( ) 872 , 0 2 6 ³ c P ) ( ~ n t X ) 0 ( , 1 2 2 1 ) ( 2 1 2 > Î ÷ ÷ ø ö ç ç è æ + ÷ ø ö ç è æ ÷ ø ö ç è æ + = + - n R x n x n T n n T x f n p ò ¥ - - = 0 1 ) ( dx e x n T x n ) ( ~ n t X 2 , 2 ) ( > - = n para n n x V m 2 X s , 475 , 1 2 50 , 1 45 , 1 1 = + = X n X 2 2 s s = ÷ ø ö ç è æ - - = 1 2 2 N n N n X s s 2 s m n X 2 2 s s = ) 1 ; 0 ( ~ N x Z x s m - = X x s n x s s = ) 1 ; 0 ( ~ N n x Z s m - = = X a s m s a a - = ÷ ÷ ø ö ç ç è æ + < < - ÷ ø ö ç è æ - ÷ ø ö ç è æ - 1 2 1 2 1 n Z X n Z X P % 100 ) 1 ( ´ - a ê ê ë é ú ú û ù + - ÷ ø ö ç è æ - ÷ ø ö ç è æ - n Z X n Z X s s a a 2 1 2 1 ; 975 , 0 2 05 , 0 1 1 Z Z Z = = - - a 96 , 1 975 , 0 = Z ê ë é ú û ù + - - - n Z X n Z X s s a a 2 1 2 1 ; ê ë é ú û ù + - 2 , 11 02 , 0 96 , 1 6 , 0 ; 2 , 11 02 , 0 96 , 1 6 , 0 Þ ] [ 635 , 0 ; 565 , 0 å å = = k i k i i i fi Pm f 1 1 ) 1 ( ~ - - = - = n t n S x S x T x x m m a m a a - = ÷ ÷ ø ö ç ç è æ + < < - - - - - 1 2 1 ; 1 2 1 ; 1 n S t X n S t X P n n % 100 ) 1 ( a - ê ë é ú û ù + - - - - - n S t X n S t X n n 2 1 ; 1 2 1 ; 1 ; a a ê ë é ú û ù + - - - n Z X n Z X s s a a 2 1 2 1 ; p ) n X p = ) n q p S p ) ) = p q - = 1 n p p S p ) ˆ 1 ( - = ) 6 , 1 23 775 , 36 » p S p p Z - = ) ê ë é ú û ù + - - - p p S Z p S Z p 2 1 2 1 ; a a ) ) 7449 , 0 98 73 = = p ) 051 , 0 98 ) 7449 , 0 1 ( 7449 , 0 ) ˆ 1 ( = - = - = n p p S p ) ] [ ] [ ] [ 645 , 0 ; 645 , 0 09996 , 0 7449 , 0 ; 09996 , 0 7449 , 0 051 , 0 96 , 1 7449 , 0 ; 051 , 0 96 , 1 7449 , 0 Þ + - Þ ´ + ´ - ) 1 ( ~ ) 1 ( 2 2 2 - - = n S n Q c s a c s c a a - = ÷ ÷ ÷ ø ö ç ç ç è æ - < < - - - - 1 ) 1 ( ) 1 ( 2 ) 2 ; 1 ( 2 2 2 ) 2 1 ; 1 ( 2 n n S n S n P ê ê ê ë é ú ú ú û ù - - - - - 2 ) 2 ; 1 ( 2 2 ) 2 1 ; 1 ( 2 ) 1 ( ; ) 1 ( a a c c n n S n S n X ~ å = = 7 1 1 455 i i x ( ) å = = - 7 1 2 1 486 i i x x å = = 6 1 2 360 i i x 85 2 2 = S 71 ; 49 ; 73 ; 47 ; 58 ; 64 ; 60 ; 55 ( ) 81 1 7 486 1 1 2 2 = - = - - = å = n x x S n i i ] [ 7607 , 392 ; 6346 , 33 2373 , 1 486 ; 4494 , 14 486 81 ) 1 7 ( ; 81 ) 1 7 ( 2 ) 2 05 , 0 ; 1 7 ( 2 ) 2 05 , 0 1 ; 1 7 ( Þ ê ë é ú û ù = ê ê ê ë é ú ú ú û ù - - - - - c c , 1 13 , 12 , 11 ,..., n X X X X , 2 23 , 22 , 21 ,..., n X X X X