Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Luiz Arthur Dornelles Jr. 1 A palavra Estatística origina-se do latim e o seu radical, status, significa estado. Sendo assim, a palavra estatística significa o estudo do Estado. Prof. Luiz Arthur Dornelles Jr. 2 Um conjunto de métodos científicos para a coleta, organização, apresentação e análise de dados, bem como, para a conclusão e tomada de decisões baseadas em tais análises. DEFINIÇÃO Prof. Luiz Arthur Dornelles Jr. 3 DIVISÕES DA ESTATÍSTICA DESCRITIVA INDUTIVA(probabilidade) Observar Organizar Analisar, etc. Estimar Prever Amostrar, etc Prof. Luiz Arthur Dornelles Jr. 4 PROCESSO DE PESQUISA Prof. Luiz Arthur Dornelles Jr. 5 FASES DO MÉTODO ESTATÍSTICO definição do problema; planejamento; coleta de dados; crítica e apuração dos dados; análise e interpretação dos dados; apresentação dos dados; relatório final e publicação. Prof. Luiz Arthur Dornelles Jr. 6 O que é População e Amostra? População: é o conjunto total de elementos com pelo menos uma característica em comum, cujo comportamento interessa estudar. N= número de elementos da população Amostra: é o conjunto de elementos ou observações, recolhidos a partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões para a população de onde foi recolhida. n= número de elementos da amostra Prof. Luiz Arthur Dornelles Jr. 7 Por que usar amostragem? ECONOMIA TEMPO CONFIABILIDADE Prof. Luiz Arthur Dornelles Jr. 8 PLANO DE AMOSTRAGEM OBJETIVOS DA PESQUISA POPULAÇÃO AMOSTRAGEM Forma de seleção dos elementos – plano de amostragem Prof. Luiz Arthur Dornelles Jr. 9 O objetivo da amostragem é fazer inferências, estimar e tirar conclusões a respeito da população. AMOSTRA DEVE SER REPRESENTATIVA EVITAR DISTORÇÃO DA REALIDADE Prof. Luiz Arthur Dornelles Jr. 10 Qualitativas ALGUNS CONCEITOS IMPORTANTES O que são Variáveis? Quantitativas Tipos de Variáveis Prof. Luiz Arthur Dornelles Jr. 11 Nominais ALGUNS CONCEITOS IMPORTANTES Qualitativas Ordinais Prof. Luiz Arthur Dornelles Jr. 12 Discretas ALGUNS CONCEITOS IMPORTANTES Quantitativas Contínuas Prof. Luiz Arthur Dornelles Jr. 13 ALGUNS CONCEITOS IMPORTANTES Prof. Luiz Arthur Dornelles Jr. 14 ARREDONDAMENTO DE DADOS IBGE - resolução 886/66 ABNT - NBR 5891/77 CASO I: O algarismo seguinte à casa é 0, 1, 2, 3 ou 4 Exemplos: Arredondar para a primeira casa decimal: 158,4385 → → há uma perda de Arredondar para a segunda casa decimal: 24,1028 → → há uma perda de Prof. Luiz Arthur Dornelles Jr. 15 ARREDONDAMENTO DE DADOS CASO II: O algarismo seguinte à casa é 5, 6, 7, 8 ou 9 Exemplos: Arredondar para a 2ª casa decimal: 158,4385 → → há uma ganho de Arredondar para a 3ª casa decimal: 24,1029 → → há uma ganho de Arredondar para a 1ª casa decimal: 67,97 → → há uma ganho de Prof. Luiz Arthur Dornelles Jr. 16 ARREDONDAMENTO DE DADOS CASO III: O algarismo seguinte à casa é 5 – é um caso especial previsto pela norma. Não é muito usado. O critério que adotaremos em nosso estudo será o caso dois (slide anterior) NÃO VAMOS USAR ESTE CRITÉRIO PARA O 5 VALE O CASO II Prof. Luiz Arthur Dornelles Jr. 17 NOÇÕES DE SOMATÓRIO Seja x={x1, x2, x3, x4, ... xn}. A soma dos elementos deste conjunto pode ser representada por: Exemplo 01: € xi i=1 n ∑ = € a) xi i=1 6 ∑ = b) xi i=4 9 ∑ = c) xi i=25 39 ∑ = Prof. Luiz Arthur Dornelles Jr. 18 NOÇÕES DE SOMATÓRIO Exemplo 01 (cont.): € d) xi i=1 6 ∑ yi = e) xi( )2 i=4 9 ∑ = Exemplo 02: sendo x={1, 3, 5} e y={2, 4, 7} calcule: € a) xi i=1 3 ∑ = b) yi i=1 3 ∑ = € c) (xi + yi) i=1 3 ∑ = d) xi i=1 3 ∑ + yi i=1 3 ∑ = € (xi ± yi ) = i=1 n ∑ xi i=1 n ∑ ± yi i=1 n ∑ Prof. Luiz Arthur Dornelles Jr. 19 NOÇÕES DE SOMATÓRIO Exemplo 03: sendo x={1, 3, 5} e y={2, 4, 7} calcule: € a) xi i=1 3 ∑ = b) yi i=1 3 ∑ = € c) (xi .yi) i=1 3 ∑ = d) xi i=1 3 ∑ . yi i=1 3 ∑ = € (xi .yi)≠ i=1 n ∑ xi i=1 n ∑ . yi i=1 n ∑ € xi i=1 n ∑ ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 2 ≠ xi( ) i=1 n ∑ 2 € a) (xi)2 i=1 3 ∑ = b) xi i=1 3 ∑ ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 2 = Exemplo 04: sendo x={1, 3, 5} e y={2, 4, 7} calcule: Prof. Luiz Arthur Dornelles Jr. 20 NOÇÕES DE SOMATÓRIO Exemplo 05: Calcule as seguintes quantidades para os dados abaixo: € a) xi ∑ = b) fi ∑ = c) xi fi ∑ = d) (xi)2 ∑ = e) fi(xi)2 ∑ = RESOLVER LISTA 1 Prof. Luiz Arthur Dornelles Jr. 21 O que são dados brutos? O que são dados agrupados? Prof. Luiz Arthur Dornelles Jr. 22 Para uma variável qualitativa nominal. I M R P I I P R P R I P P I R I P P P M I P P P M P I I I M P R M R R P M M P R I R M P P I R P M P I P P M P I Legenda I – Investimentos imobiliários M – Investimento em mercado de ações P – Investimento em poupança R – Investimento em fundos de renda fixa A seguir está relacionado o tipo de investimento preferido por clientes de um banco: Prof. Luiz Arthur Dornelles Jr. 23 Para uma variável qualitativa ordinal. A seguir está relacionada a satisfação de cada cliente com os serviços de um banco: Prof. Luiz Arthur Dornelles Jr. 24 Para uma variável quantitativa discreta. A seguir está relacionado o número de defeitos por peça conforme são produzidas neste lote: 1 1 4 1 0 0 1 6 5 0 0 0 0 0 0 0 0 1 0 0 1 0 3 2 4 2 0 0 2 0 1 0 0 0 3 3 0 0 4 0 0 1 0 2 0 0 1 0 3 0 0 0 3 0 0 0 Prof. Luiz Arthur Dornelles Jr. 25 Para uma variável quantitativa contínua Os valores anotados a seguir representam o volume de vendas mensal de 56 representantes: 23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74 32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13 21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89 24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84 29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93 17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03 16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05 Prof. Luiz Arthur Dornelles Jr. 26 Título Coluna numérica Coluna indicadora Corpo Rodapé Total Linhas Cabeçalho TABELAS Ano PIB (em bilhões de dólares) 1996 775,5 1997 807,8 1998 787,9 1999 531,1 2000 594,2 2001 503,9 Total 4000,4 O PIB do Brasil em bilhões de dólares – 1996-2001 Fonte: IBGE Prof. Luiz Arthur Dornelles Jr. 27 COMO MONTAR TABELAS PARA VARIÁVEL QUALITATIVA NOMINAL? 1º) Organizar os dados por semelhança I I I I I I I I I I I I I I M M M M M M M M M M P P P P P P P P P P P P P P P P P P P P P P R R R R R R R R R R I – Investimentos imobiliários M – Investimento em mercado de ações P – Investimento em poupança R – Investimento em fundos de renda fixa Prof. Luiz Arthur Dornelles Jr. 28 COMO MONTAR TABELAS PARA VARIÁVEL QUALITATIVA? 2º) Escrever cada uma das opções verificadas e contar I 14 M 10 P 22 R 10 Prof. Luiz Arthur Dornelles Jr. 29 COMO MONTAR TABELAS PARA VARIÁVEL QUALITATIVA? 3º) Montar a tabela Tipo de investimento Número de clientes Imobiliário 14 Mercado de ações 10 Poupança 22 Fundos de renda fixa 10 Total 56 Investimentos mais confiáveis segundo clientes do banco Fonte: dados fictícios Prof. Luiz Arthur Dornelles Jr. 30 COMO MONTAR TABELAS PARA VARIÁVEL QUALITATIVA ORDINAL? 1º) Organizar os dados por semelhança Prof. Luiz Arthur Dornelles Jr. 31 2º) Escrever cada uma das opções verificadas e contar COMO MONTAR TABELAS PARA VARIÁVEL QUALITATIVA ORDINAL? Satisfação com os serviços prestados pelo banco Fonte: dados fictícios Prof. Luiz Arthur Dornelles Jr. 32 3º) Pode ser usado escala numérica: COMO MONTAR TABELAS PARA VARIÁVEL QUALITATIVA ORDINAL? Satisfação com os serviços prestados pelo banco Fonte: dados fictíciosProf. Luiz Arthur Dornelles Jr. 33 TABELAS PARA VARIÁVEL QUANTITATIVA DISCRETA 1º) Organize os dados em ordem crescente - ROL 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 5 6 Prof. Luiz Arthur Dornelles Jr. 34 TABELAS PARA VARIÁVEL QUANTITATIVA DISCRETA 2º) Escrever cada uma das opções verificadas 0 33 1 9 2 4 3 5 4 3 5 1 6 1 Prof. Luiz Arthur Dornelles Jr. 35 TABELAS PARA VARIÁVEL QUANTITATIVA DISCRETA 3º) Montar a tabela Número de defeitos por peças analisadas do lote xxxx Fonte: Setor de Controle de Qualidade fictício Número de defeitos (xi) Número de peças (fi) 0 33 1 9 2 4 3 5 4 3 5 1 6 1 Total (!fi) 56 Freqüência simples Valores que a variável pode assumir Freqüência total Prof. Luiz Arthur Dornelles Jr. 36 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 1º) Organize os dados em ordem crescente - ROL 15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05 17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30 20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65 22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11 24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55 30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33 33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13 Prof. Luiz Arthur Dornelles Jr. 37 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 2º) Número de intervalos (k) - são usados dois critérios Critério da raiz Fórmula de Sturges 3,3.logn1k += nk = k=? Prof. Luiz Arthur Dornelles Jr. 38 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 3º) Amplitude Total (At) At=? AT=L(máx) – l(min) 4º) Amplitude do intervalo de classe (h) k ATh = h=? Prof. Luiz Arthur Dornelles Jr. 39 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA Amplitude total 19,23 (At=19,23) Sete intervalos (k=7) Cada um com o tamanho de 2,8 (h=2,8) RESUMINDO h.k>AT 5º) Testar os cálculos Prof. Luiz Arthur Dornelles Jr. 40 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 6º) Escrever os intervalos da tabela (15,9); 15,9 |--- 18,7 18,7 |--- 21,5 21,5 |--- 24,3 24,3 |--- 27,1 27,1 |--- 29,9 29,9 |--- 32,7 32,7 |--- 35,5 Começar pelo menor valor Somar 2,8 (h): Amplitude total 19,23 (At=19,23) Sete intervalos (k=7) Cada um com o tamanho de 2,8 (h=2,8) Prof. Luiz Arthur Dornelles Jr. 41 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 7º) Construção da tabela Classe Volume de vendas (em mil reais) 1 15,9 |--- 18,7 2 18,7 |--- 21,5 3 21,5 |--- 24,3 4 24,3 |--- 27,1 5 27,1 |--- 29,9 6 29,9 |--- 32,7 7 32,7 |--- 35,5 Total (!fi) Prof. Luiz Arthur Dornelles Jr. 42 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 8º) Contar e marcar o número de valores em cada intervalo 15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05 17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30 20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65 22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11 24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55 30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33 33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13 Prof. Luiz Arthur Dornelles Jr. 43 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 8º) Contar e marcar o número de valores em cada intervalo Classe Volume de vendas (em mil reais) Contagem Nº de representantes (fi) 1 15,9 |--- 18,7 12 2 18,7 |--- 21,5 8 3 21,5 |--- 24,3 12 4 24,3 |--- 27,1 5 5 27,1 |--- 29,9 3 6 29,9 |--- 32,7 6 7 32,7 |--- 35,5 10 Total (!fi) 56 Prof. Luiz Arthur Dornelles Jr. 44 TABELAS PARA VARIÁVEL QUANTITATIVA CONTÍNUA 9º) A tabela Volume de vendas (em mil reais) Nº de representantes (fi) 15,9 |--- 18,7 12 18,7 |--- 21,5 8 21,5 |--- 24,3 12 24,3 |--- 27,1 5 27,1 |--- 29,9 3 29,9 |--- 32,7 6 32,7 |--- 35,5 10 Total (!fi) 56 Volume de vendas mensal, em milhares de reais Fonte: Setor fictício de vendas LISTA 02 Prof. Luiz Arthur Dornelles Jr. 45 Quais são os tipos de freqüências? Freqüência acumulada direta ou "abaixo de" (fiacd) Prof. Luiz Arthur Dornelles Jr. 46 Quais são os tipos de freqüências? Freqüência acumulada indireta ou "acima de" (fiaci) Prof. Luiz Arthur Dornelles Jr. 47 Quais são os tipos de freqüências? Freqüência relativa (fr) n ffr i= Prof. Luiz Arthur Dornelles Jr. 48 Quais são os tipos de freqüências? Freqüência percentual (fp) fp = fr.100 Prof. Luiz Arthur Dornelles Jr. 49 Quais são os tipos de freqüências? Ponto médio de uma classe 2 LiliPM += Prof. Luiz Arthur Dornelles Jr. 50 Veja como fica a tabela (distribuição de freqüências) completa Prof. Luiz Arthur Dornelles Jr. 51 Freqüências acumuladas direta e indireta percentual LISTA 03 Prof. Luiz Arthur Dornelles Jr. 52 Para que usar gráficos? Representar dados de forma clara e simples Possibilitar acesso rápido à informações Requisitos de um gráfico Simplicidade Clareza Veracidade Prof. Luiz Arthur Dornelles Jr. 53 Censo Demográfico - Brasil - 1890- 2000 0 20 40 60 80 100 120 140 160 180 18 90 19 20 19 50 19 70 19 90 Anos Censo Demográfico - Brasil - 1890-2000 0 20 40 60 80 100 120 140 160 180 1890 1900 1920 1940 1950 1960 1970 1980 1990 2000 Anos Po pu la çã o (e m m ilh õe s) Evitar distorções! Prof. Luiz Arthur Dornelles Jr. 54 Diagramas Cartogramas Pictogramas Prof. Luiz Arthur Dornelles Jr. 55 Censo Demográfico - Brasil - 1890-2000 0 20 40 60 80 100 120 140 160 180 1890 1900 1920 1940 1950 1960 1970 1980 1990 2000 Anos Po pu la çã o (e m m ilh õe s) Escala horizontal Título Fonte Fonte: IBGE Linhas de grade Escala vertical Identificação dos eixos Prof. Luiz Arthur Dornelles Jr. 56 Investimentos mais confiáveis segundo clientes do banco 14 10 22 10 0 5 10 15 20 25 Imobiliário Mercado de ações Poupança Fundos de renda f ixa Ti po d e in ve st im en to Nº de clientes Censo Demográfico - Brasil - 1890-2000 0 20 40 60 80 100 120 140 160 180 1890 1900 1920 1940 1950 1960 1970 1980 1990 2000 Anos TEMPERATURA MÉDIA MENSAL EM 2000 0 1 0 20 30 40 Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Tipos de diagrama Gráficos em barras Gráficos em colunas Gráficos de setores (pizza) Gráfico de linhas ou curvas Gráfico Polar Volume de vendas mensal por representante de uma empresa que fabrica remédios – outubro/2003 0 2 4 6 8 10 12 14 15,9 |--- 18,7 18,7 |--- 21,5 21,5 |--- 24,3 24,3 |--- 27,1 27,1 |--- 29,9 29,9 |--- 32,7 32,7 |--- 35,5 Volume de vendas (em mil reais)Investimentos mais confiáveis segundo clientes do banco Mercado de ações 17,86% Imobiliário 25,00% Poupança 39,29% Fundos de renda fixa 17,86% Prof. Luiz Arthur Dornelles Jr. 57 São mais usados para representar séries específicas, temporais e geográficas. Construção Eixos cartesianos Valores da variável - eixo vertical Freqüência - eixo horizontal Barras - mesma base (largura) Barras - comprimentos proporcionais às freqüências Título e fonte. Prof. Luiz Arthur Dornelles Jr. 58 Investimentos mais confiáveis segundo clientes do banco 14 10 22 10 0 5 10 15 20 25 Imobiliário Mercado de ações Poupança Fundos de renda f ixa Ti po d e in ve st im en to Nº de clientes Fonte: dados fictícios Prof. Luiz Arthur Dornelles Jr. 59 São mais usados para representar séries específicas, temporais e geográficas. Construção Eixos cartesianos Valores da variável - eixo horizontal Freqüência - eixo vertical Colunas - mesma base (largura) Colunas - comprimentos proporcionais às freqüências Título e fonte. Prof. Luiz Arthur Dornelles Jr. 60 Número de defeitos por peças analisadas do lote xxxx 33 5 3 1 1 9 4 0 5 10 15 20 25 30 35 0 1 2 3 4 5 6 Número de defeitos (xi) N úm er o de p eç as( fi) Fonte: dados fictícios Prof. Luiz Arthur Dornelles Jr. 61 Fonte: dados fictícios Volume de vendas mensal por representante de uma empresa que fabrica remédios – outubro/2003 12 5 3 6 10 12 8 0 2 4 6 8 10 12 14 15,9 |--- 18,718,7 |--- 21,521,5 |--- 24,324,3 |--- 27,127,1 |--- 29,929,9 |--- 32,732,7 |--- 35,5 Volume de vendas (em mil reais) N º de r ep re se nt an te s (fi ) Prof. Luiz Arthur Dornelles Jr. 62 É recomendado para situações em que se deseja evidenciar o quanto cada informação representa do total . Construção Circunferência Soma ou 100% representa 360º Marcar cada ângulo – traças retas (separar setores) Pintar ou marcar cada setor Legenda Título e fonte. Prof. Luiz Arthur Dornelles Jr. 63 Fonte: dados fictícios Investimentos mais confiáveis segundo clientes do banco Mercado de ações 17,86% Imobiliário 25,00% Poupança 39,29% Fundos de renda fixa 17,86% Fonte: dados fictícios Investimentos mais confiáveis segundo clientes do banco 14 10 22 10 Imobiliário Mercado de ações Poupança Fundos de renda fixa Prof. Luiz Arthur Dornelles Jr. 64 É mais utilizado para definir a tendência de aumento ou diminuição dos valores numéricos de uma dada informação ao longo do tempo (séries temporais). Construção Eixos vertical e horizontal Escalas - horizontal o tempo - vertical a freqüência Marcar os pontos Unir os pontos por linhas Legenda Título e fonte. Prof. Luiz Arthur Dornelles Jr. 65 Fonte: IBGE Censo Demográfico - Brasil - 1890-2000 0 20 40 60 80 100 120 140 160 180 1890 1900 1920 1940 1950 1960 1970 1980 1990 2000 Anos Po pu la çã o (e m m ilh õe s) Prof. Luiz Arthur Dornelles Jr. 66 É indicado para representar variações cíclicas, ou seja, que se repetem em períodos pré-determinados. Mais utilizado em estudos climáticos (séries temporais). Construção Eixo vertical com escala e marcar ponto central Passar retas pelo ponto com mesmo ângulo O número de retas = número de observações Marcar pontos, usando escala do eixo vertical Unir pontos com semi-retas Título e fonte. Prof. Luiz Arthur Dornelles Jr. 67 Fonte: IBGE TEMPERATURA MÉDIA MENSAL EM 2000 0 10 20 30 40 Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Prof. Luiz Arthur Dornelles Jr. 68 Características Símbolos auto-explicativos Quantidades - número de símbolos ou variações nos tamanhos; Sem muitos detalhes - visão geral Não serve para interpretações técnicas. Construídos a partir de figuras ou conjunto de figuras representativas do fenômeno. São mais utilizados em jornais, revistas, cartazes e propagandas. Prof. Luiz Arthur Dornelles Jr. 69 Prof. Luiz Arthur Dornelles Jr. 70 São usados para apresentar os dados estatísticos referentes à regiões bem definidas geograficamente. Prof. Luiz Arthur Dornelles Jr. 71 Usados para interpretações de informações Análises de dados Dedução geométrica de fórmulas Histograma Polígono de freqüências Histograma para freqüências acumuladas Polígono de freqüências acumuladas (Ogivas de Galton) Prof. Luiz Arthur Dornelles Jr. 72 Semelhante ao gráfico de colunas Altura dos retângulos proporcionais à freqüência simples Área dos retângulos proporcionais à freqüência simples Soma das áreas proporcional à freqüência total Prof. Luiz Arthur Dornelles Jr. 73 EMISSÃO DE ÓXIDO DE ENXOFRE NOS ÚLTIMOS 70 MESES - em ton 6 10 11 20 13 7 3 0 5 10 15 20 25 6,2 |-- 9,99,9 |-- 13,613,6 |-- 17,317,3 |-- 2121 |-- 24,724,7 |-- 28,428,4 |-- 32,1 Toneladas N º de m es es Fonte: dados fictícios Prof. Luiz Arthur Dornelles Jr. 74 Unir por linhas retas os pontos médios das bases superiores dos retângulos do histograma EMISSÃO DE ÓXIDO DE ENXOFRE - EM TONELADAS 0 5 10 15 20 25 6,2 |-- 9,9 9,9 |-- 13,613,6 |-- 17,317,3 |-- 21 21 |-- 24,7 24,7 |-- 28,428,4 |-- 32,1 Toneladas N º de m es es Polígono de Freqüências Esses triângulos compensam os que ficam fora do polígono Prof. Luiz Arthur Dornelles Jr. 75 Fonte: Fonte: SECEX (Secretaria do Comércio Exterior). Prof. Luiz Arthur Dornelles Jr. 76 Procedimentos Identificar as variáveis expressas pelo gráfico Identificar máximo e mínimo Identificar tendência Analisar de maneira geral, identificando as alterações mais expressivas Outras análises 12/4 13/4 14/4 15/4 16/4 2,9092,920 2,910 2,900 2,890 2,880 Dólar comercial Em R$ 2,894 Prof. Luiz Arthur Dornelles Jr. 77 2002 2003 10/10 15/1 12/2 4/4 ... O DÓLAR TAMBÉM CAIU... 3,89 (em reais) 3,62 3,33 3,22 Procedimentos Identificar as variáveis expressas pelo gráfico Identificar máximo e mínimo Identificar tendência Analisar de maneira geral, identificando as alterações mais expressivas Outras análises Fonte: Veja de 9 de abril de 2003 Prof. Luiz Arthur Dornelles Jr. 78 Medidas de tendência central Média Mediana Moda Separatrizes Prof. Luiz Arthur Dornelles Jr. 79 A média é uma das medidas mais importantes dentro da Estatística. Ela é o ponto de equilíbrio de uma série de dados. Notação: para a amostra µ para população X Prof. Luiz Arthur Dornelles Jr. 80 Tipos de média: Média Aritmética Simples € x= xi∑ n = x1 + x2 +...+ xn n Média Aritmética Ponderada € x = xi pi∑ pi∑ Prof. Luiz Arthur Dornelles Jr. 81 € xg = x 1 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ p1 . x 2 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ p2 ... x n ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ pnp i ∑ Média Geométrica Ponderada € xg = xi∏ n = x 1 . x 2 ... x n n Média Geométrica Simples Tipos de média: Prof. Luiz Arthur Dornelles Jr. 82 Média Harmônica Ponderada Média Harmônica Simples Tipos de média: € xh = n 1 xi ∑ € xh = pi∑ pi xi ∑ Prof. Luiz Arthur Dornelles Jr. 83 Média aritmética para dados agrupados € x = xi fi∑ fi∑ Dados agrupados sem intervalos (variável discreta) Número de defeitos por peças analisadas do lote Zyz Número de defeitos (xi) Número de peças (fi) xi.fi 0 33 1 9 2 4 3 5 4 3 5 1 6 1 Total (!fi) 56 Prof. Luiz Arthur Dornelles Jr. 84 Mediana para dados brutos – nº ímpar de observações Exemplo: X: 5, 30, 27, 9, 15, 19, 24, 20, 31 1º passo: Rol - ordem crescente 2º passo: posição 3º passo: identificar a Mediana ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ += 2 1nPos Posição A mediana é valor que divide o total de observações em duas partes iguais. Notação: Me ou Md Prof. Luiz Arthur Dornelles Jr. 85 Mediana para dados brutos – nº ímpar de observações 1º 2º 3º 4º 5º 6º 7º 8º 9º 5 9 15 19 20 24 27 30 31 Interpretação: 50% dos valores da série são menores ou iguais a 20 e 50% dos valores da série são maiores ou iguais a 20. Prof. Luiz Arthur Dornelles Jr. 86 Mediana para dados brutos – nº par de observações Exemplo: X: 5, 30, 27, 9, 15, 19, 24, 20 1º passo: Rol - ordem crescente Posição1 Posição2 € Pos1 = n 2 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ = 8 2 = 4o € Pos2 = n 2 +1 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ = 8 2 +1 = 5o Rol: X: 5, 9, 15, 19, 20, 24, 27, 30 2º passo: posição Prof. Luiz Arthur Dornelles Jr. 87 Mediana para dados brutos – nº par de observações 3º passo: identificar e calcular a Mediana 1º 2º 3º 4º 5º 6º 7º 8º 5 9 15 19 Me 20 24 27 30 € Me = 19 + 20 2 = 39 2 =19,5 Interpretação: 50% dos valores da série são menores que 19,5 e 50% dos valores da série são valores maiores que 19,5. Prof. Luiz Arthur Dornelles Jr. 88 Mediana para dados agrupados Sem intervalos (variável discreta) exemplo para n par Número de defeitos por peças analisadas do lote xxxx Número de defeitos (xi) Número de peças (fi) fiacd 0 33 33 1 9 42 2 4 46 3 5 51 4 3 54 5 1 55 6 1 56 Total (!fi) 56 Posição € Pos1= 56 2 =28o €Pos2 = 562 +1= 29o Me=0 Interpretação: 50% das peças apresentaram zero (nenhum) defeito e 50% das peças apresentaram zero ou mais defeitos. Prof. Luiz Arthur Dornelles Jr. 89 Sem intervalos (variável discreta) exemplo para n ímpar Posição € Pos = 63+1 2 = 32o Me=19 Interpretação: 50% dos estagiários tem idade menor ou igual a 19 anos e 50% dos estagiários tem idade maior ou igual a 19 anos . Idade dos estagiários da empresa Idade (xi) Número de estagiários (fi) fiacd 17 5 5 18 20 25 19 22 47 20 10 57 21 6 63 Total (!fi) 63 Mediana para dados agrupados Prof. Luiz Arthur Dornelles Jr. 90 Moda para dados brutos Exemplo: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26,28 Interpretação: O elemento que mais se repete é o 22. Mo=22 A moda é o valor que mais se repete, ou seja, o valor de maior freqüência. Notação: Mo Prof. Luiz Arthur Dornelles Jr. 91 Moda para dados brutos Exemplo: X: 20, 20, 22, 22, 25, 25, 28,28 Interpretação: Na série acima não se tem um elemento que mais se repete Mo=não existe Exemplo: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26,28 Interpretação: Os elementos que mais se repetem são o 20 e o 22 Mo1=20 e Mo2=22 Prof. Luiz Arthur Dornelles Jr. 92 Moda para dados agrupados sem intervalos Sem intervalos (variável discreta) Remuneração da empresa – filial 1 Nº de salários- mínimos fi 1 29 2 28 3 20 4 18 5 16 6 15 7 9 ! 135 Remuneração da empresa – filial 2 Nº de salários- mínimos fi 1 9 2 25 3 16 4 18 5 20 6 22 7 25 ! 134 Mo=1 Mo1=2 e Mo2=7 Prof. Luiz Arthur Dornelles Jr. 93 Sem intervalos (variável discreta) Mo=não existe Remuneração da empresa – filial 3 Nº de salários- mínimos fi 1 7 2 7 3 7 4 7 5 7 6 7 7 7 ! 49 Moda para dados agrupados sem intervalos LISTA 04 Prof. Luiz Arthur Dornelles Jr. 94 Média aritmética para dados agrupados Dados agrupados com intervalos (variável contínua) € x = PM. f i∑ f i∑ Volume de vendas mensal, em milhares de reais Volume de vendas (em mil reais) Nº de Representantes (fi) PM PM.fi 15,9 |--- 18,7 12 17,3 18,7 |--- 21,5 8 20,1 21,5 |--- 24,3 12 22,9 24,3 |--- 27,1 5 25,7 27,1 |--- 29,9 3 28,5 29,9 |--- 32,7 6 31,3 32,7 |--- 35,5 10 34,1 Total (!fi) 56 Prof. Luiz Arthur Dornelles Jr. 95 Com intervalos (variável contínua) € Me= lime+ n 2 − f iacd ant f i me ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ .h Posição 2 nPos = lime = limite inferior da classe mediana n = número de elementos da série fiacdant = freqüência acumulada direta anterior fime = freqüência simples da classe mediana h = amplitude do intervalo de classe Mediana para dados agrupados Prof. Luiz Arthur Dornelles Jr. 96 Com intervalos (variável contínua) € Me= lime+ n 2 − f iacd ant f i me ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ .h Posição € Pos = n 2 lime = n = fiacdant = fime = h = Me=23,3667 Mediana para dados agrupados Prof. Luiz Arthur Dornelles Jr. 97 Moda para dados agrupados Com intervalos (variável contínua) € Mo= limo+ f i mo - f i ant 2. f i mo - ( f i ant+ f i post) ⎡ ⎣ ⎢ ⎢ ⎢ ⎤ ⎦ ⎥ ⎥ ⎥ .h limo = limite inferior da classe modal fimo = freqüência simples da classe modal fiant = freqüência simples anterior à classe modal fipost = freqüência simples posterior à classe modal h = amplitude do intervalo de classe Moda de Czuber Prof. Luiz Arthur Dornelles Jr. 98 Moda para dados agrupados Com intervalos (variável contínua) limo = fimo = fiant = fipost = h = Mo1=22,5182 Mo2=18 LISTA 05 Prof. Luiz Arthur Dornelles Jr. 99 Levantamento salarial de três filiais de uma empresa € X = 60 10 = 6Filial 1: Filial número de salários-mínimos por pessoa (10 pessoas) Total Filial 1: 6 6 6 6 6 6 6 6 6 6 Filial 2: 1 8 9 2 6 10 5 8 7 4 Filial 3: 5 6 7 7 6 5 6 7 5 6 € X = 60 10 = 6Filial 3: € X = 60 10 = 6Filial 2: Prof. Luiz Arthur Dornelles Jr. 100 " As principais medidas de dispersão absolutas são: Amplitude total, Desvio médio simples, Variância e Desvio-padrão. Prof. Luiz Arthur Dornelles Jr. 101 " Como calcular a variância e o desvio-padrão? NOTAÇÃO USADA: POPULAÇÃO € σ 2 (x) variância € σ (x) desvio-padrão AMOSTRA (x)2S variância S (x) desvio-padrão Prof. Luiz Arthur Dornelles Jr. 102 " Como calcular a variância e o desvio-padrão? Para dados brutos: População € σ 2 (x) = (xi −µ∑ )2 n variância € σ (x) = σ 2 (x) desvio-padrão Amostra 1-n )x(x (x)S 2 2 i∑ − = variância (x)(x)S 2S= desvio-padrão Prof. Luiz Arthur Dornelles Jr. 103 " Como calcular a variância e o desvio-padrão? Para dados brutos: exemplo - Notas: 7; 7,8; 6 e 8 Passo 1 – Calcule a média € µ = x = 7 + 7,8 + 6 + 8 4 = 28,8 4 = 7,2 € S2(x) = Σ(xi − x )2 n -1 Prof. Luiz Arthur Dornelles Jr. 104 " Como calcular a variância e o desvio-padrão? Passo 2 – agora calcule os desvios (xi - ): x (x1-x )=(7-7,2)=-0,2 (x2-x )=(7,8-7,2)=0,6 (x3-x )=(6-7,2)=-1,2 (x4-x )=(8-7,2)=0,8 € S2(x) = Σ(xi − x )2 n -1 Prof. Luiz Arthur Dornelles Jr. 105 " Como calcular a variância e o desvio-padrão? Passo 3 – elevar ao quadrado cada desvio (xi - )2 x (x1-x )2=(-0,2)2=0,04 (x2-x )2=(0,6)2=0,36 (x3-x )2=(-1,2)2=1,44 (x4-x )2=(0,8)2=0,64 € S2(x) = Σ(xi − x )2 n -1 Prof. Luiz Arthur Dornelles Jr. 106 " Como calcular a variância e o desvio-padrão? Passo 4 – A média dos quadrados dos desvios Caso sejam dados de uma população: € σ 2 (x) = (xi −µ∑ )2 n = 0,04 + 0,36 + 1,44 + 0,64 4 = 2,48 4 Então € σ 2 (x) = 0,62 € S2(x) = Σ(xi − x )2 n -1 Prof. Luiz Arthur Dornelles Jr. 107 " Como calcular a variância e o desvio-padrão? Passo 4 – A média dos quadrados dos desvios VARIÂNCIA: (amostra) 3 2,48 3 0,641,440,360,04 1-n )x(x (x)S 2 2 i = +++ = ! =" Então 0,8267(x)S2 = € S2(x) = Σ(xi − x )2 n -1 Prof. Luiz Arthur Dornelles Jr. 108 " Como calcular a variância e o desvio-padrão? Passo 5 – Desvio-padrão - raiz da variância Prof. Luiz Arthur Dornelles Jr. 109 " Como calcular a variância e o desvio-padrão? Dados agrupados sem intervalos (variável discreta) População € σ 2 (x) = (xi −µ∑ )2 . fi fi∑ variância € σ (x) = σ 2 (x) desvio-padrão Amostra 1-f .f)x(x (x)S i ii 2 2 ∑ ∑ − = variância (x)(x)S 2S= desvio-padrão Prof. Luiz Arthur Dornelles Jr. 110 " Como calcular a variância e o desvio-padrão? € S2(x) = Σ(xi − x )2. f i Σf i -1 € x = Σxi . fi Σf i Prof. Luiz Arthur Dornelles Jr. 111 " Como calcular a variância e o desvio-padrão? VARIÂNCIA: população : € σ 2 (x) = (xi −µ∑ )2. fi f i∑ = 490,015 135 = 3,6297 VARIÂNCIA: amostra 6568,3 341 015,490 1-351 015,490 1-f .f)x(x (x)S i ii 2 2 === − = ∑ ∑ Prof. Luiz Arthur Dornelles Jr. 112 " Como calcular a variância e o desvio-padrão? DESVIO-PADRÃO: população : € σ (x) = 3,6297 =1,9052 DESVIO-PADRÃO: amostra € S(x) = 3,6568 =1,9123 Prof. Luiz Arthur Dornelles Jr. 113 " Como calcular a variância e o desvio-padrão? Dados agrupados com intervalos (variável contínua) POPULAÇÃO € σ 2 (x) = (PMi −µ∑ )2. fi f i∑ variância € σ (x) = σ 2 (x) desvio-padrão AMOSTRA 1-f .f)x(PM (x)S i i 2 i2 ∑ ∑ − = variância (x)(x)S 2S= desvio-padrão Prof. Luiz Arthur Dornelles Jr. 114 " Como calcular a variância e o desvio-padrão? € S2(x) = Σ(PMi − x )2. f i Σf i -1 € x = ΣPMi . f i Σf i Prof. Luiz Arthur Dornelles Jr. 115 " Como calcular a variância e o desvio-padrão? VARIÂNCIA: população : € σ 2 (x) = (PMi −µ∑ )2. fi fi∑ = 2058,42 56 = 36,7575 VARIÂNCIA: amostra 4258,37 55 42,20581-56 42,2058 1-f .f)x(PM (x)S i ii 2 2 === − = ∑ ∑ Prof. Luiz Arthur Dornelles Jr. 116 " Como calcular a variância e o desvio-padrão? DESVIO-PADRÃO: população : € σ (x) = 36,7575 = 6,0628 DESVIO-PADRÃO: amostra 1177,64258,37(x)S2 == Prof. Luiz Arthur Dornelles Jr. 117 Para entender melhor o desvio-padrão 1 2 3 4 5 6 7 1 2 3 4 5 6 7 s=0 1 2 3 4 5 6 7 s=0,8 1 2 3 4 5 6 7 s=1,2 1 2 3 4 5 6 7 s=3,0 O desvio padrão cresce quando a dispersão dos dados aumenta 1 2 3 4 5 6 7 1 2 3 4 5 6 7 s=0 1 2 3 4 5 6 7 s=0,8 1 2 3 4 5 6 7 s=1,2 1 2 3 4 5 6 7 s=3,0 O desvio padrão cresce quando a dispersão dos dados aumenta Prof. Luiz Arthur Dornelles Jr. 118 " Como comparar séries com médias iguais? " Como comparar séries com médias diferentes? Filial 1 Filial 2 =µ 122 mil reais =σ )x( 4,5 mil reais =µ 122 mil reais =σ )x( 7,5 mil reais Filial 1 Filial 2 =µ 145 mil reais =σ )x( 9,8 mil reais =µ 95 mil reais =σ )x( 7,5 mil reais Prof. Luiz Arthur Dornelles Jr. 119 " Coeficiente de Variação ? Exemplo: Filial 1: Filial 2: 0676,0 145 8,9)x()x(CV === µ σ 0789,0 95 5,7)x()x(CV === µ σ Para a população € CV(x) = σ (x) µ Para a amostra x (x)SCV(x) = Filial 1 Filial 2 =µ 145 mil reais =σ )x( 9,8 mil reais =µ 95 mil reais =σ )x( 7,5 mil reais LISTA 06 Prof. Luiz Arthur Dornelles Jr. 120 TIPOS DE FENÔMENOS Fenômenos determinísticos: São fenômenos em que as condições iniciais determinam um único resultado; Fenômenos aleatórios: São fenômenos em que as condições iniciais não determinam a possibilidade da existência de um resultado em particular Prof. Luiz Arthur Dornelles Jr. 121 " As principais conceitos O que é espaço amostral? É o conjunto de todos os possíveis resultados de um experimento (fenômeno) aleatório Notação: Representação do conjunto espaço amostral – S número de elementos de S= n(S) Exemplo: Em um exame de admissão, cada questão tem 5 respostas possíveis, sendo somente uma delas a correta. Pode-se construir o seguinte conjunto: S={a, b, c, d, e }: Observe que são todas as possibilidades para a questão. Prof. Luiz Arthur Dornelles Jr. 122 " As principais conceitos O que são eventos? É qualquer subconjunto do espaço amostral determinado pelo experimento (fenômeno) aleatório em estudo. Notação: Representação do subconjunto evento – A (letra maiúscula). Número de elementos de A = n(A) Exemplo: Em um exame de admissão, cada questão tem 5 respostas possíveis, sendo somente uma delas a correta. Identifique o número de elementos do evento A: acertar a questão Prof. Luiz Arthur Dornelles Jr. 123 " As principais conceitos Evento simples: Formado por apenas um elemento - n(A)=1 Evento composto: Formado por dois ou mais elementos - n(B)=5 Evento impossível: Não ocorre, seja qual for a realização do experimento aleatório. - n(C)=0 Evento certo: É quando o evento é o próprio espaço amostral. - n(D)=n(S) Prof. Luiz Arthur Dornelles Jr. 124 " Operações com eventos União de eventos A B S Prof. Luiz Arthur Dornelles Jr. 125 " Operações com eventos Interseção de eventos A B S Prof. Luiz Arthur Dornelles Jr. 126 A S A’ " Operações com eventos Complementar de um evento Prof. Luiz Arthur Dornelles Jr. 127 A B S " Operações com eventos Subtração de eventos Prof. Luiz Arthur Dornelles Jr. 128 A B S C " Operações com eventos Eventos excludentes Prof. Luiz Arthur Dornelles Jr. 129 " Quais são os Conceitos de Probabilidade e seus cálculos? Probabilidade clássica: A probabilidade de ocorrer um determinado resultado na realização de um experimento é igual ao quociente entre o número de casos favoráveis ao sucesso (número de elementos do evento A) e o número de casos possíveis (número de elementos do espaço amostral - S). Probabilidade de um evento A ocorrer: )S(n )A(n)A(P = = p = sucesso OBS: A probabilidade de não-ocorrência pode ser representada por: )A(P1)A(P != = q = fracasso Prof. Luiz Arthur Dornelles Jr. 130 " Quais são os Conceitos de Probabilidade e seus cálculos? Exemplo 01: Determinado despachante aduaneiro controla negócios de 8 empresas exportadoras. Sabe, ele, que duas destas empresas são mal pagadoras. Qual a probabilidade de, ao escolher uma empresa, ela ser mal pagadora? S: empresas controladas pelo despachante A: empresas controladas pelo despachante que são mal pagadoras n(A) = 2 n(S) = 8 25% ou 0,25 8 2 )S(n )A(n)A(P === Prof. Luiz Arthur Dornelles Jr. 131 " Quais são os Conceitos de Probabilidade e seus cálculos? Exemplo 02: Um relatório recente distinguiu em seis tipos os principais motivos de tensão (estresse). A pesquisa realizada para provar isso, resultou nos dados abaixo (dados fictícios). Pesquisa dos motivos de estresse Motivos de estresse Número de pessoas Morte de um filho 29 Morte do cônjuge 24 Morte dos pais ou irmãos 20 Divórcio 17 Doença grave 17 Demissão 11 Total 118 Prof. Luiz Arthur Dornelles Jr. 132 " Quais são os Conceitos de Probabilidade e seus cálculos? Pesquisa dos motivos de estresse Motivos de estresse Número de pessoas Probabilidade Morte de um filho 29 0,2458 Morte do cônjuge 24 0,2034 Morte dos pais ou irmãos 20 0,1695 Divórcio 17 0,1441 Doença grave 17 0,1441 Demissão 11 0,0932 Total 118 1 24,58%ou 0,2458 118 29 n(S) n(A)P(A) === 20,34%ou 0,2034 118 24 n(S) n(B)P(B) === 16,95%ou 0,1695 118 20 n(S) n(C)P(C) === 14,41%ou 0,1441 118 17 n(S) n(D)P(D) === 14,41%ou 0,1441 118 17 n(S) n(E)P(E) === 9,32%ou 0,0932 118 11 n(S) n(F)P(F) === Prof. Luiz Arthur Dornelles Jr. 133 " Quais são os Conceitos de Probabilidade e seus cálculos? Freqüência Relativa : A freqüência relativa de um evento A é calculada dividindo o número de vezes que ocorre o evento A pelo total de observação do experimento. É chamada, também, de probabilidade avaliada ou probabilidade estimada. Freqüência relativa de um evento A: sobservaçõe de total número Aocorreu que vezes de número =Afr É importante que você saiba que essa aproximação para o cálculo de probabilidade só será considerável caso aja um número bastante grande de tentativas de execução do experimento. Prof. Luiz Arthur Dornelles Jr. 134 " Quais são os Conceitos de Probabilidade e seus cálculos? Exemplo 01: Um estudo de 3.500 vôos da VARIG, selecionados aleatoriamente mostrou que 875 chegaram no horário (com base nos dados do Ministério dos Transportes). Qual é a probabilidade estimada (freqüência relativa) de um vôo da VARIG, chegar no horário? Você acha que é um resultado satisfatório, com relação às possibilidades de atraso? A: um vôo da VARIG, chegar no horário. Número de vezes que ocorre A: 875 Número total de observações: 3500 25% ou 0,25 3500 875 sobservaçõe de total número Aocorreu que vezes de número ===Afr Prof. Luiz Arthur Dornelles Jr. 135 " Quais são os Conceitos de Probabilidade e seus cálculos? Algumas considerações Para cada evento A 0 ≤ P(A) ≤ 1 P(S) = 1 Sejam A, B e C, todos os eventos possíveis do espaço amostral, então: P(A) + P(B) + P(C) = 1 ou 100% Quando A e B são mutuamente exclusivos: P(A U B) = P(A) + P (B) Quando A e B não são mutuamente exclusivos: P(A U B) = P(A) + P(B) – P(A∩B) Se A, B, C, ... são uma seqüência de eventos mutuamente exclusivos, então: P(A U B U C U ...) = P(A) + P(B) + P(C) + .... LISTA 07 Prof. Luiz Arthur Dornelles Jr. 136 Prof. Luiz Arthur Dornelles Jr. 137 Prof. Luiz Arthur Dornelles Jr. 138 " EXEMPLO 01: Quantos números de dois algarismos distintos podem ser formados usando os algarismos 2, 3, 4, 5 ? Prof. Luiz Arthur Dornelles Jr. 139 " EXEMPLO 02: Quantascomissões de duas pessoas podem ser formadas com 4 alunos? ALUNOS:{A, B, C, D} Prof. Luiz Arthur Dornelles Jr. 140 " FATORIAL 0!= 1!= 5! + 3! = 5! . 3! = 8!/4!= . . = − )!022(!0 !22 = − )!422(!4 !22 (22-2)!= (5-3)!= (8/2)! Prof. Luiz Arthur Dornelles Jr. 141 " ANÁLISE COMBINATÓRIA Arranjo - grupo é diferente de outro pela ordem ou pela natureza dos elementos componentes. Combinações - grupo é diferente de outro apenas pela natureza dos elementos componentes. )!kn( !nA k,n − = )!kn!.(k !nC k,n − = Prof. Luiz Arthur Dornelles Jr. 142 " Distribuição de Bernoulli EXEMPLO: Uma questão de um exame tem 5 respostas e somente uma está correta. Qual a probabilidade, ao respondermos aleatoriamente, de errarmos a questão? FRACASSO ⇒NÃO OCORRER ⇒P(F)=q SUCESSO ⇒OCORRER ⇒P(S)=p p+q=1 Prof. Luiz Arthur Dornelles Jr. 143 " Distribuição de Binomial 1)Experimento for repetido “n” vezes independentes; 2) A cada tentativa admitir somente dois resultados: Sucesso ou Fracasso 3) Estudar o número de sucessos e fracassos, sem importar a ordem em que acontecem Seja X: o número de sucessos em “n” tentativas do experimento € P(X = k) = Cn,k .p k .qn−k Prof. Luiz Arthur Dornelles Jr. 144 " Distribuição de Binomial Exemplo: Num exame com 4 questões, sendo que cada uma delas apresentam 5 alternativas e somente uma está correta, calcule a probabilidade de, por acaso (a resolução será feita em sala de aula): Acertar três questões; Acertar uma questão; Errar três questões; Errar uma questões; Acertar nenhuma questão; Acertar todas questões; Errar todas questões; Errar nenhuma questão; Acertar três ou menos questões; Errar uma ou mais questões; € P(X = k) = Cn,k .p k .qn−k Prof. Luiz Arthur Dornelles Jr. 145 " Representação gráfica de uma distribuição Binomial Número de erros P(X) 0 0,0016 1 0,0256 2 0,1536 3 0,4096 4 0,4096 Total 1 Probabilidade de errar as questões do teste Probabilidade de errar as questões do teste 0,0016 0,0256 0,1536 0,4096 0,4096 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0 1 2 3 4 Número de erros Pr ob ab ilid ad e LISTA 08 Prof. Luiz Arthur Dornelles Jr. 146 Prof. Luiz Arthur Dornelles Jr. 147 Fonte: dados fictícios Escores (em pontos) de um teste realizado em uma escola de periferia de Florianópolis 0 2 4 6 8 10 12 14 16 15,9 |--- 18,7 18,7 |--- 21,5 21,5 |--- 24,3 24,3 |--- 27,1 27,1 |--- 29,9 29,9 |--- 32,7 32,7 |--- 35,5 Escore (em pontos) N º d e es tu da nt es Prof. Luiz Arthur Dornelles Jr. 148 Escores (em pontos) de um teste realizado em uma escola de periferia de Florianópolis 0 2 4 6 8 10 12 14 16 15,9 |--- 18,718,7 |--- 21,521,5 |--- 24,324,3 |--- 27,127,1 |--- 29,929,9 |--- 32,732,7 |--- 35,5 Escore (em pontos) N º de e st ud an te s Polígono de Freqüências Esses triângulos compensam os que ficam fora do polígono Prof. Luiz Arthur Dornelles Jr. 149 Você observou que o polígono de freqüências tem um formato especial? Sim, ele tem o formato de um sino. Essa curva é chamada de curva Normal ou de Gauss-Laplace e ela tem algumas características bem especiais. Veja a seguir: Forma de um sino É simétrica com relação à média Área total é 1 ou 100% É assintótica É unimodal MODA = MÉDIA = MEDIANA f xa b P(a<x<b) € P(a < x < b) = f (x) a b ∫ = 1 σ. 2π .e − 1 2 x − µ σ ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 2 a b ∫ Prof. Luiz Arthur Dornelles Jr. 150 X1 = 28 µ(x)= 21 σ(x) = 7 Cálculo da variável padronizada: Onde: X1 = valor da v.a. (limite do intervalo) µ = média σ = desvio padrão € Z = (x − µ) σ Prof. Luiz Arthur Dornelles Jr. 151 0 z Área P(21<X1< 28)=0,3413 ou 34,13% Procurar 1,0 Procurar 0,00 Cruzando a linha com a coluna... Cruzando a linha com a coluna... Prof. Luiz Arthur Dornelles Jr. 152 Cálculo da variável padronizada: e Onde: X1 e X2 = limites do intervalo µ = média σ = desvio padrão σ µ− = )x( Z 1 1 σ µ− = )X( Z 2 2 P(z <Z<z )1 2 x1 x2 x z1 z2 z0 P(x1<x<x2) X1 = 13,65 e X2 = 27,65 µ(x)= 21 σ(x) = 7 Prof. Luiz Arthur Dornelles Jr. 153 Z 0,00 0,01 ... 0,04 0,05 0,0 0,0000 0,0040 ... 0,0160 0,0199 0,1 0,0398 0,0438 ... 0,0557 0,0596 0,2 0,0793 0,0832 ... 0,0948 0,0987 ... ... ... ... ... ... 0,8 0,2881 0,2910 ... 0,2995 0,3023 0,9 0,3159 0,3186 ... 0,3264 0,3289 1,0 0,3413 0,3438 ... 0,3508 0,3531 1,1 0,3643 0,3665 ... 0,3729 0,3749 1,2 0,3849 0,3869 ... 0,3925 0,3944 Cruzando a linha com a coluna... Procurar 0,05 Cruzando a linha com a coluna... Procurar 1,0 Prof. Luiz Arthur Dornelles Jr. 154 Procurar 0,9 Procurar 0,05 Z 0,00 ... 0,04 0,05 0,0 0,0000 ... 0,0160 0,0199 0,l 0,0398 ... 0,0557 0,0596 ... ... ... ... ... 0,7 0,2580 ... 0,2704 0,2734 0,8 0,2881 ... 0,2995 0,3023 0,9 0,3159 ... 0,3264 0,3289 1,0 0,3413 ... 0,3508 0,3531 1,1 0,3643 ... 0,3729 0,3749 Cruzando a linha com a coluna... Cruzando a linha com a coluna... Prof. Luiz Arthur Dornelles Jr. 155 P(13,65 <X1< 27,65)=0,3531+0,3289= P(13,65 <X1< 27,65) =0,682 ou 68,2% Prof. Luiz Arthur Dornelles Jr. 156 z=0,95 µ=24 x1=29,7 Área 0 Área Média: µ=24 Desvio padrão: σ(x)=6 Limitado abaixo por x=29,7 e não tem limite acima Prof. Luiz Arthur Dornelles Jr. 157 Média: µ=24 Desvio padrão: σ(x)=6 Limitado abaixo por x=29,7 e não tem limite acima z=0,950 0,3289 0,5-0,3289 Prof. Luiz Arthur Dornelles Jr. 158 0,3413 ou 34,13% 0,5 X 50% ou Média: µ=24 Desvio padrão: σ(x)=3 Limitado abaixo por x=21 e não tem limite acima Prof. Luiz Arthur Dornelles Jr. 159 Exemplo 01: Numa prova final de Estatística, as notas dos alunos tiveram uma distribuição normal com média 6,0 e desvio padrão 1,5. Sendo 5,0 a nota mínima de aprovação, qual a proporção de alunos reprovados? z µ= 0 x Prof. Luiz Arthur Dornelles Jr. 160 Exemplo 02: O Departamento de Marketing da empresa resolve premiar 5% dos seus vendedores mais eficientes. Um levantamento das vendas individuais por semana mostrou que elas se distribuíam normalmente com média 240.000 u.m. e desvio-padrão 30.000 u.m. Qual o volume de vendas mínimo que um vendedor deve realizar para ser premiado? z µ= 0 x Prof. Luiz Arthur Dornelles Jr. 161 Exemplo 03: O volume de exportações de uma empresa, durante um determinado período, se distribui normalmente. Apresentou uma média de 250 u.m. e um desvio padrão de 50. Dentre os meses pesquisados, qual a probabilidade de escolhermos um que tenha um volume de exportação: Maior que 250 u.m.? Maior que 312,5 u.m.? Menor que 187,5 u.m.? Entre 295 e 344 u.m.? z µ= 0 x LISTA 09 Prof. Luiz Arthur Dornelles Jr. 162 Prof. Luiz Arthur Dornelles Jr. 163 O que é População e Amostra? População: é o conjunto total de elementos com pelo menos uma característica em comum, cujo comportamento interessa estudar. N= número de elementos da população Amostra: é o conjunto de elementos ou observações, recolhidos a partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões para a população de onde foi recolhida. n= número de elementos da amostra Prof. Luiz Arthur Dornelles Jr. 164 O objetivo da amostragem é fazer inferências, estimar e tirar conclusões a respeito da população. AMOSTRA DEVE SER REPRESENTATIVA EVITAR DISTORÇÃO DA REALIDADE Prof. Luiz Arthur Dornelles Jr. 165 Que informações a amostragem pode revelar? Intenções de votos - Pesquisa Eleitoral 39%37% 35% 26%24%26% 9% 15% 11%10% 7% 11% 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% Agosto Setembro Outubro A B C D Outras informações: Margem de erro: 2 % Tamanho da amostra: 2000 eleitores Nível de confiança: 95% Intervalo: Prof.Luiz Arthur Dornelles Jr. 166 Intervalos de proporção (%): São intervalos como o visto no exemplo anterior, os percentuais das intenções de votos. Exemplos: Proporção de famílias, Percentual de pacientes Proporção de consumidores, etc.; Intervalos da média: São intervalos baseados em medidas. Sempre calculado pela média dessas medidas. Exemplo: Preço médio, Peso médio, Altura média, etc Prof. Luiz Arthur Dornelles Jr. 167 Nível de confiança: Nível de confiança é a probabilidade do intervalo conter o parâmetro estimado. Veja a figura abaixo: Intervalo de confiança: Intervalo de confiança é o intervalo que contém o parâmetro estudado com determinada probabilidade (nível de confiança). Veja a figura acima. Exemplo 01: Determinar os valores de Z (valores críticos) do intervalo de confiança, sabendo que o Nível de confiança é de 95%: Prof. Luiz Arthur Dornelles Jr. 168 Exemplo 02: Determinar os valores de Z (valores críticos) do intervalo de confiança, os valores para o Nível de confiança da tabela abaixo: Prof. Luiz Arthur Dornelles Jr. 169 Prof. Luiz Arthur Dornelles Jr. 170 Distribuições Amostrais Prof. Luiz Arthur Dornelles Jr. 171 Estimativa para a média populacional Exemplo estimativas para a média populacional: Tempo médio de atendimento; Idade média dos clientes; custo médio; consumo médio mensal, etc. Obs.: Note que estes valores foram obtidos usando uma amostra. Prof. Luiz Arthur Dornelles Jr. 172 Estimativa para a média populacional Cálculo do erro amostral: Caso 01: amostra utilizada é maior que 30 elementos e desvio padrão da amostra ou população conhecidos. € e = Zvc. S n Sendo: e= erro amostral Zvc= Valor crítico (mostrado na seção anterior e depende do Nível de Confiança) S=Desvio padrão amostral (ou da população se for conhecido) σ=Desvio padrão populacional n= tamanho da amostra utilizada Cálculo do erro amostral: Caso 02: amostra utilizada é menor ou igual a 30 elementos e o desvio padrão da população for conhecido. € e = Zvc. σ n Prof. Luiz Arthur Dornelles Jr. 173 Estimativa para a média populacional Cálculo do erro amostral: Resumindo: no caso 01 amostra maior que 30 elementos e desvio padrão da amostra ou população, caso 02, amostra menor ou igual a 30 e desvio da população. OBS.: Caso a amostra seja menor ou igual a 30 elementos e o desvio padrão da população não seja conhecido, deve ser usado outro método. Prof. Luiz Arthur Dornelles Jr. 174 Estimativa para a média populacional Cálculo do erro amostral: Exemplo 01: O Departamento de Recursos Humanos de uma empresa informa que o tempo de execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o desvio padrão permanece aproximadamente constante, em 3 minutos. Uma nova tarefa está sendo implantada na empresa. Uma amostra aleatória do tempo de execução de 50 destas novas tarefas forneceu o valor médio de 15 minutos. Determine um intervalo de confiança de 95% para o tempo médio de execução desta nova tarefa. Prof. Luiz Arthur Dornelles Jr. 175 Estimativa para a média populacional Cálculo do erro amostral: Exemplo 02: Sabe-se que as despesas mensais com alimentação dos alunos de uma faculdade no período escolar são normalmente distribuídas com desvio padrão de R$ 7,00. Uma amostra, sem reposição de 100 estudantes, revelou uma despesa média mensal de R$ 60,00. Determine um intervalo de confiança de 90% para a despesa média com alimentação no período escolar dos alunos desta faculdade. Prof. Luiz Arthur Dornelles Jr. 176 Estimativa para a média populacional Cálculo do intervalo de confiança Exemplo: Uma amostragem feita com o consumo dos caminhões da empresa deu uma média de 19 km/l de diesel. Calculado o erro amostral, seu resultado foi de 1,7 km/l. Qual seria o intervalo de confiança? € X − e < µ < X + e ⇒ ⇒19−1,7 < µ <19+1,7⇒ ⇒19−1,7 < µ <19+1,7⇒ ⇒17,3 < µ < 20,7 Prof. Luiz Arthur Dornelles Jr. 177 Estimativa para a proporção populacional Exemplo estimativas para a proporção populacional: Intenções de voto; Proporção de peças com defeito; Percentual de atrasos na entrega, etc. Obs.: Note que estes valores foram obtidos usando uma amostra. Prof. Luiz Arthur Dornelles Jr. 178 Estimativa para a proporção populacional Cálculo do erro amostral: Fórmula para cálculo do erro: € e = Zvc. ˆ p . ˆ q n € Sendo : e = Erro amostral Zvc = Valor Crítico ˆ p = é a proporção amostral de sucesso (é o percentual de sucesso) ˆ q = é a proporção amostral de fracasso (é o percentual de fracasso) n = Tamanho da amostra utilizada Prof. Luiz Arthur Dornelles Jr. 179 Estimativa para a proporção populacional Cálculo do erro amostral: Exemplo 01: Uma pesquisa eleitoral realizada em uma cidade com 150 eleitores, revelou que 35% votariam no candidato A. Determine um intervalo de confiança para o percentual populacional dos eleitores que votam neste candidato. Use com nível de confiança 95%. Prof. Luiz Arthur Dornelles Jr. 180 Estimativa para a proporção populacional Cálculo do erro amostral: Exemplo 02: Em pesquisa feita com uma amostra de 500 estudantes, detectou-se que 140 possuem acesso a internet em casa. Determine um intervalo de confiança de 90% para a população de estudantes que possuem acesso a internet em casa. Prof. Luiz Arthur Dornelles Jr. 181 Estimativa para a proporção populacional Cálculo do intervalo de confiança Exemplo: Uma amostragem feita com eleitores de uma cidade resultou que 29% destes eleitores votariam no Candidato A. O erro amostral calculado foi de 2,2% para mais ou para menos. Qual seria o intervalo de confiança? € ˆ p − e < p < ˆ p + e ⇒ ⇒ 29− 2,2 < p < 29+ 2,2 ⇒ ⇒ 26,8 < p < 31,2 LISTAS 10 Prof. Luiz Arthur Dornelles Jr. 182 População pequena ou amostragem sem reposição A correção é feita multiplicando o erro amostral pelo Fator de Correção: € FC = N − n N −1 Antes de calcular o erro para uma estimativa, testar se a amostra é maior que 5% da população. Como fazer: € n N > 0,05 Se for maior que 0,05, você deve usar o FC. Caso contrário, fica como antes. Prof. Luiz Arthur Dornelles Jr. 183 População pequena ou amostragem sem reposição Abaixo as fórmulas para o erro usando o FC: € Para estimativas da média populacional : e = Zvc. S n .FC ⇒ e = Zvc. S n . N − n N −1 Para estimativas da proporção populacional : e = Zvc. ˆ p . ˆ q n .FC ⇒ e = Zvc. ˆ p . ˆ q n . N − n N −1 Prof. Luiz Arthur Dornelles Jr. 184 População pequena ou amostragem sem reposição Exemplo 01: Sabe-se que as despesas mensais com alimentação dos 1.000 alunos de uma faculdade no período escolar são normalmente distribuídas com desvio padrão de R$ 7,00. Uma amostra, sem reposição de 100 estudantes, revelou uma despesa média mensal de R$ 60,00. Determine um intervalo de confiança de 90% para a despesa média com alimentação no período escolar dos alunos desta. Prof. Luiz Arthur Dornelles Jr. 185 População pequena ou amostragem sem reposição Exemplo 02: Uma pesquisa eleitoral realizada em uma cidade com 150 eleitores, revelou que 35% votariam no candidato A. Determine um intervalo de confiança para o percentual populacional dos eleitores que votam neste candidato. Use com nível de confiança 95% e considere que a população é de 1000 eleitores nesta cidade. LISTA 11 Prof. Luiz Arthur Dornelles Jr. 186 Que tamanho de amostra usar? Quando não se têm informações sobre a População Tamanho da amostra: 20 E 1n = Onde: n0 – primeira aproximação para o tamanho da amostra; E – erro amostral tolerável. (usar o erro na forma unitária, ex.: 2%, usar 0,02) Tamanho da amostra: 0 0 nN nNn + = . Onde: n0 – primeira aproximação para o tamanho da amostra; E – erro amostral tolerável N – tamanho da população; n – tamanho da amostra; (usar oerro na forma unitária, ex.: 2%, usar 0,02) Quando não se conhece o tamanho da população Quando se conhece o tamanho da população Quando não se têm informações sobre a População Prof. Luiz Arthur Dornelles Jr. 187 Que tamanho de amostra usar? Quando não se têm informações sobre a População Exemplo 01: Um pesquisador deseja realizar estudo para conhecer melhor o perfil das empresas, do estado de Santa Catarina, que utilizam os serviços de entrega rápida de outras empresas. Nessa pesquisa, irá tolerar um erro amostral de 4%. Ele gostaria de saber qual seria o tamanho da amostra necessária para realizar sua pesquisa, nos seguintes casos: a) Não conhece o número total de empresas do estado de Santa Catarina; b) O número total de empresas do estado de Santa Catarina 27.000 empresas (população). Prof. Luiz Arthur Dornelles Jr. 188 Que tamanho de amostra usar? Quando se têm informações sobre a População € n = Z.σ e ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 2 € n = Z2.σ 2N e2(N −1) + Z2.σ 2 € n = Z 2. ˆ p ̂ q e2 € n = Z 2. ˆ p ̂ q N e2(N −1) + Z 2. ˆ p ˆ q Onde: n = tamanho da amostra N = tamanho da população e = erro amostral = desvio padrão € ˆ p = percentual de elementos com a característica estudada € ˆ q = percentual de elementos sem a característica estudada Z = limite do intervalo (dist. Normal) Com reposição (população infinita) Sem reposição (população finita) ESTIMATIVA DA MÉDIA Com reposição (população infinita) Sem reposição (população finita) ESTIMATIVA DA PROPORÇÃO TAMANHO DA AMOSTRA PARA ESTIMATIVAS POPULACIONAIS Prof. Luiz Arthur Dornelles Jr. 189 Que tamanho de amostra usar? Quando se têm informações sobre a População Exemplo 01: Uma população admite distribuição normal de probabilidades com σ=2. Calcule o tamanho da amostra necessário para que possamos ter 95% de confiança de que não erraremos por mais que 0,5 unidades ao estimar a média populacional. Exemplo 02: Um instituto de pesquisa pretende avaliar a proporção de eleitores que votarão em determinado candidato, com 90% de confiança de que não errará por mais de 3%. Para isto em uma pré-amostra a proporção de eleitores deste candidato foi de 20%. Determine o tamanho da amostra necessário para atingir a precisão desejada. LISTA 12 Prof. Luiz Arthur Dornelles Jr. 190 O que é correlação linear simples? Como faço para analisar e comparar duas variáveis simultaneamente? A correlação é uma ferramenta destinada ao estudo da relação entre duas variáveis quantitativas, além de fornecer a intensidade dessa relação. Prof. Luiz Arthur Dornelles Jr. 191 DIAGRAMA DE DISPERSÃO Ano Emprego Produção 1975 100,00 100,00 1976 104,03 111,90 1977 108,63 114,31 1978 115,58 121,32 1979 120,28 129,77 1980 129,10 141,71 1981 118,63 127,28 1982 120,31 127,31 1983 106,54 120,72 1984 114,01 129,30 1985 117,60 122,70 1986 122,30 129,00 1987 119,70 125,00 1988 103,60 110,90 1989 109,70 116,00 1990 110,20 119,50 Índices da Indústria Produção x Emprego 90 100 110 120 130 140 150 95 100 105 110 115 120 125 130 135 Emprego Pr od uç ão Prof. Luiz Arthur Dornelles Jr. 192 DIAGRAMA DE DISPERSÃO Produção x Emprego 90 100 110 120 130 140 150 95 100 105 110 115 120 125 130 135 Emprego P ro du çã o Reta imaginária Pares ordenados Prof. Luiz Arthur Dornelles Jr. 193 Coeficiente de Correlação Linear de Pearson ( )( )[ ] ( ) ( ) !" # $% & ' '(!" # $% & ' '( ' '' = 2222 xy yy.n.xx.n y.x- y.x.n r Onde: r = resultado do coeficiente de correlação linear de Pearson n = número de observações x = valores assumidos pela variável X y = valores assumidos pela variável Y Prof. Luiz Arthur Dornelles Jr. 194 Como calcular o coeficiente de correlação? EXEMPLO: Calcule o coeficiente de correlação de Pearson e construa o diagrama de dispersão para as operações de crédito do sistema financeiro (Saldos em final de período em R$ bilhões) e as taxas de juros descritas a seguir: Prof. Luiz Arthur Dornelles Jr. 195 Quanto ao resultado de r você deve considerar : Valor de r correlação entre as variáveis ‘r’ próximo de 0 correlação linear pouco significativa ‘r’ = 0 não há correlação linear entre as variáveis ‘r’ próximo de –1 há correlação linear negativa (significativa) ‘r’ = –1 há correlação linear negativa perfeita ‘r’ próximo de +1 há correlação linear positiva (significativa) ‘r’ = +1 há correlação linear positiva perfeita Prof. Luiz Arthur Dornelles Jr. 196 TIPOS DE CORRELAÇÕES: Correlação linear positiva Produção x Emprego 90 100 110 120 130 140 150 95 100 105 110 115 120 125 130 135 Emprego P ro du çã o x cresce, y cresce ⇒emprego cresce, produção cresce x decresce, y decresce ⇒ emprego decresce, produção decresce coeficiente de Pearson entre 0 e 1 ⇒ intervalo (0,1) ou próximo de 1 Prof. Luiz Arthur Dornelles Jr. 197 Produção x Emprego 90 100 110 120 130 140 95 100 105 110 115 120 125 130 135Emprego P ro du çã o TIPOS DE CORRELAÇÕES: Correlação linear perfeita positiva x cresce, y cresce ⇒emprego cresce, produção cresce x decresce, y decresce ⇒ emprego decresce, produção decresce coeficiente de Pearson r=1 Prof. Luiz Arthur Dornelles Jr. 198 Empréstimos x Juros 16,0 16,5 17,0 17,5 18,0 18,5 19,0 19,5 20,0 250 260 270 280 290 300 310 Empréstimos (R$ bilhões) TIPOS DE CORRELAÇÕES: Correlação linear negativa x cresce, y decresce ⇒empréstimo cresce, taxa de juros decresce x decresce, y cresce ⇒empréstimo decresce, taxa de juros cresce coeficiente de Pearson entre -1 e 0 ⇒ intervalo (-1,0) ou próximo de -1 Prof. Luiz Arthur Dornelles Jr. 199 Empréstimos x Juros 10,0 12,0 14,0 16,0 18,0 20,0 22,0 250 260 270 280 290 300 310 Empréstimos (R$ bilhões) Tx J ur os (% a . a .) TIPOS DE CORRELAÇÕES: Correlação linear perfeita negativa x cresce, y decresce ⇒empréstimo cresce, taxa de juros decresce x decresce, y cresce ⇒empréstimo decresce, taxa de juros cresce coeficiente de Pearson r=-1 Prof. Luiz Arthur Dornelles Jr. 200 Empréstimos x Juros 0,0 5,0 10,0 15,0 20,0 25,0 30,0 0 5 10 15 20 Empréstimos (R$ bilhões) Tx J ur os (% a . a .) TIPOS DE CORRELAÇÕES: Correlação linear nula ou ausência de correlação coeficiente de Pearson r=0, ou próximo de zero Prof. Luiz Arthur Dornelles Jr. 201 Como fazer uma análise de regressão? A reta imaginária obtida pela aproximação dos pontos do diagrama de dispersão é chamada de reta de regressão Prof. Luiz Arthur Dornelles Jr. 202 Como fazer uma análise de regressão? MÉTODO DOS MÍNIMOS QUADRADOS RETA DE REGRESSÃO X.abŶ += ( )( )[ ] ( )22 xx.n y.xy.xn a !"! !!"! = n x.ay b !"! = = valor predito de y x= valor da variável x para determinado elemento da amostra y= valor da variável y para determinado elemento da amostra n= n.º total de observações (tamanho da amostra) b= a intersecção do eixo y a= coeficiente de inclinação da reta Ŷ Prof. Luiz Arthur Dornelles Jr. 203 Interpolação: estimativas com valores entre os da série; Extrapolação: estimativas com valores fora dos da série; Resíduo: é a diferença entre um valor amostral observado y, e o valor predito com base na equação de regressão. Prof. Luiz Arthur Dornelles Jr. 204 EXEMPLO: A tabela a seguir (mesma do exemplo anterior) descreve as operações de crédito do sistema financeiro (Saldos em final de período em R$ bilhões) e as taxas de juros. Você deverá: • Construir a equação de uma reta de regressão para prever a taxa de juros; • Prever a taxa de juros para julho de 2000, admitindo que o saldo de empréstimos foi de 30,7 (bilhões de reais). Mês Empréstimos (x) Tx. Juros em % (y) x.y x2 y2 1999 Ago 26,1 19,5 508,95 681,21 380,25 Set 26,3 19,4 510,22 691,69 376,36 Out 26,8 18,9 506,52 718,24 357,21 Nov 27,118,9 512,19 734,41 357,21 Dez 26,3 19 499,7 691,69 361 2000 Jan 26,2 18,9 495,18 686,44 357,21 Fev 26,2 18,9 495,18 686,44 357,21 Mar 28,6 18,8 537,68 817,96 353,44 Abr 29 18,6 539,4 841 345,96 Mai 29,9 18,5 553,15 894,01 342,25 Jun 30 18 540 900 324 TOTAIS 302,5 207,4 5698,17 8343,09 3912,1 Fonte: Banco Central Operações de crédito do sistema financeiro € ˆ Y = b + a.X € a = n x.y∑ − x∑( ). y∑( )[ ] n. x 2∑ − x∑( )2 € b = y∑ − a. x∑ n LISTA 13 Prof. Luiz Arthur Dornelles Jr. 205 Distribuição t de Student para a estimativa da média Quando usar a distribuição t de Student: Quando o tamanho da amostra for menor ou igual à 30 elementos; Quando o desvio padrão da população for desconhecido; Quando a população tem distribuição normal. 1-α α/2 -tα/2 α/2 tα/2 Prof. Luiz Arthur Dornelles Jr. 206 Área de 0 à t gl 0,25 0,40 0,45 0,475 0,49 0,495 1. 1,000 3,078 6,314 12,71 31,82 63,66 2. 0,816 1,886 2,920 4,303 6,965 9,925 3. 0,765 1,638 2,353 3,182 4,541 5,841 4. 0,741 1,533 2,132 2,776 3,747 4,604 5. 0,727 1,476 2,015 2,571 3,365 4,032 6. 0,718 1,440 1,943 2,447 3,143 3,707 7. 0,711 1,415 1,895 2,365 2,998 3,499 8. 0,706 1,397 1,860 2,306 2,896 3,355 9. 0,703 1,383 1,833 2,262 2,821 3,250 10. 0,700 1,372 1,812 2,228 2,764 3,169 11. 0,697 1,363 1,796 2,201 2,718 3,106 12. 0,695 1,356 1,782 2,179 2,681 3,055 13. 0,694 1,350 1,771 2,160 2,650 3,012 14. 0,692 1,345 1,761 2,145 2,624 2,977 15. 0,691 1,341 1,753 2,131 2,602 2,947 16. 0,690 1,337 1,746 2,120 2,583 2,921 17. 0,689 1,333 1,740 2,110 2,567 2,898 18. 0,688 1,330 1,734 2,101 2,552 2,878 19. 0,688 1,328 1,729 2,093 2,539 2,861 20. 0,687 1,325 1,725 2,086 2,528 2,845 21. 0,686 1,323 1,721 2,080 2,518 2,831 22. 0,686 1,321 1,717 2,074 2,508 2,819 23. 0,685 1,319 1,714 2,069 2,500 2,807 24. 0,685 1,318 1,711 2,064 2,492 2,797 25. 0,684 1,316 1,708 2,060 2,485 2,787 26. 0,684 1,315 1,706 2,056 2,479 2,779 27. 0,684 1,314 1,703 2,052 2,473 2,771 28. 0,683 1,313 1,701 2,048 2,467 2,763 29. 0,683 1,311 1,699 2,045 2,462 2,756 30. 0,683 1,310 1,697 2,042 2,457 2,750 Exemplo para determinar valor crítico t: Com um nível de confiança 95% e uma amostra de 25 elementos, determinar os valores críticos t, sabendo que o desvio padrão da população é desconhecido. Prof. Luiz Arthur Dornelles Jr. 207 Prof. Luiz Arthur Dornelles Jr. 208 Estimativa para a média populacional CÁLCULO DO ERRO AMOSTRAL USANDO A DISTRIBUIÇÃO t DE STUDENT : Sendo: e= erro amostral tvc= Valor crítico S=Desvio padrão amostral n= tamanho da amostra utilizada € e = tvc. S n Prof. Luiz Arthur Dornelles Jr. 209 Estimativa para a proporção populacional CÁLCULO DO ERRO AMOSTRAL USANDO A DISTRIBUIÇÃO t DE STUDENT : Exemplo 01: O Departamento de Recursos Humanos de uma empresa informa que o tempo de execução de tarefas que envolvem participação manual varia de tarefa para tarefa. Uma nova tarefa está sendo implantada na empresa. Uma amostra aleatória do tempo de execução de 28 destas novas tarefas forneceu o valor médio de 15 minutos e o desvio padrão em 3 minutos.. Determine um intervalo de confiança de 95% para o tempo médio de execução desta nova tarefa. Prof. Luiz Arthur Dornelles Jr. 210 Exemplo 01: n=28 GL=n-1=28-1=27 Média= 15 min DP = 3 min NC= 95% Área de 0 à t gl 0,25 0,40 0,45 0,475 0,49 0,495 1. 1,000 3,078 6,314 12,71 31,82 63,66 2. 0,816 1,886 2,920 4,303 6,965 9,925 3. 0,765 1,638 2,353 3,182 4,541 5,841 4. 0,741 1,533 2,132 2,776 3,747 4,604 5. 0,727 1,476 2,015 2,571 3,365 4,032 6. 0,718 1,440 1,943 2,447 3,143 3,707 7. 0,711 1,415 1,895 2,365 2,998 3,499 8. 0,706 1,397 1,860 2,306 2,896 3,355 9. 0,703 1,383 1,833 2,262 2,821 3,250 10. 0,700 1,372 1,812 2,228 2,764 3,169 11. 0,697 1,363 1,796 2,201 2,718 3,106 12. 0,695 1,356 1,782 2,179 2,681 3,055 13. 0,694 1,350 1,771 2,160 2,650 3,012 14. 0,692 1,345 1,761 2,145 2,624 2,977 15. 0,691 1,341 1,753 2,131 2,602 2,947 16. 0,690 1,337 1,746 2,120 2,583 2,921 17. 0,689 1,333 1,740 2,110 2,567 2,898 18. 0,688 1,330 1,734 2,101 2,552 2,878 19. 0,688 1,328 1,729 2,093 2,539 2,861 20. 0,687 1,325 1,725 2,086 2,528 2,845 21. 0,686 1,323 1,721 2,080 2,518 2,831 22. 0,686 1,321 1,717 2,074 2,508 2,819 23. 0,685 1,319 1,714 2,069 2,500 2,807 24. 0,685 1,318 1,711 2,064 2,492 2,797 25. 0,684 1,316 1,708 2,060 2,485 2,787 26. 0,684 1,315 1,706 2,056 2,479 2,779 27. 0,684 1,314 1,703 2,052 2,473 2,771 28. 0,683 1,313 1,701 2,048 2,467 2,763 29. 0,683 1,311 1,699 2,045 2,462 2,756 30. 0,683 1,310 1,697 2,042 2,457 2,750 Prof. Luiz Arthur Dornelles Jr. 211 Estimativa para a proporção populacional CÁLCULO DO ERRO AMOSTRAL USANDO A DISTRIBUIÇÃO t DE STUDENT : Exemplo 02: Sabe-se que as despesas mensais com alimentação dos alunos de uma faculdade no período escolar são normalmente distribuídas. Uma amostra, sem reposição de 18 estudantes, revelou uma despesa média mensal de R$ 60,00 e com desvio padrão de R$ 7,00. Determine um intervalo de confiança de 90% para a despesa média com alimentação no período escolar dos alunos desta faculdade. Prof. Luiz Arthur Dornelles Jr. 212 Exemplo 02: n=18 GL=n-1=18-1=17 Média= 60 DP = 7 min NC= 90% Área de 0 à t gl 0,25 0,40 0,45 0,475 0,49 0,495 1. 1,000 3,078 6,314 12,71 31,82 63,66 2. 0,816 1,886 2,920 4,303 6,965 9,925 3. 0,765 1,638 2,353 3,182 4,541 5,841 4. 0,741 1,533 2,132 2,776 3,747 4,604 5. 0,727 1,476 2,015 2,571 3,365 4,032 6. 0,718 1,440 1,943 2,447 3,143 3,707 7. 0,711 1,415 1,895 2,365 2,998 3,499 8. 0,706 1,397 1,860 2,306 2,896 3,355 9. 0,703 1,383 1,833 2,262 2,821 3,250 10. 0,700 1,372 1,812 2,228 2,764 3,169 11. 0,697 1,363 1,796 2,201 2,718 3,106 12. 0,695 1,356 1,782 2,179 2,681 3,055 13. 0,694 1,350 1,771 2,160 2,650 3,012 14. 0,692 1,345 1,761 2,145 2,624 2,977 15. 0,691 1,341 1,753 2,131 2,602 2,947 16. 0,690 1,337 1,746 2,120 2,583 2,921 17. 0,689 1,333 1,740 2,110 2,567 2,898 18. 0,688 1,330 1,734 2,101 2,552 2,878 19. 0,688 1,328 1,729 2,093 2,539 2,861 20. 0,687 1,325 1,725 2,086 2,528 2,845 21. 0,686 1,323 1,721 2,080 2,518 2,831 22. 0,686 1,321 1,717 2,074 2,508 2,819 23. 0,685 1,319 1,714 2,069 2,500 2,807 24. 0,685 1,318 1,711 2,064 2,492 2,797 25. 0,684 1,316 1,708 2,060 2,485 2,787 26. 0,684 1,315 1,706 2,056 2,479 2,779 27. 0,684 1,314 1,703 2,052 2,473 2,771 28. 0,683 1,313 1,701 2,048 2,467 2,763 29. 0,683 1,311 1,699 2,045 2,462 2,756 30. 0,683 1,310 1,697 2,042 2,457 2,750 LISTA 14 Prof. Luiz Arthur Dornelles Jr. 213 Principais conceitos O que é uma Hipótese Estatística? Segundo SILVA (1996): “Uma hipótese estatística, que denotaremos por H, é qualquer afirmação sobre a população em estudo.” Determinado produto tem vida útil média de 1500 horas: A altura média dos estudantes da Unisul é de 1,71 m: Um determinado produto apresenta resistência maior que outro: € H : µ = 1500 hs € H : µ = 1,71 hs € H : µA < µB Prof. Luiz Arthur Dornelles Jr. 214 Principais conceitos Tipos de erros: REALIDADE DECISÃO H0 é verdadeira H0 é falsa aceita-se H0 decisão correta Erro Tipo II rejeita-se H0 Erro Tipo I decisão correta Prof. Luiz Arthur Dornelles Jr. 215 Principais conceitos Importância do erro do tipo I: REALIDADE DECISÃO Ho - inocente Ha - culpado Inocente – aceita-se Ho decisão correta Erro Tipo II Culpado – rejeita-se Ho Erro Tipo I decisão correta Prof. Luiz Arthur Dornelles Jr. 216 Principais conceitos Importância do erro do tipo I: REALIDADE DECISÃO Precisa operar Não precisa operar Opera decisão correta Erro Tipo II Não opera Erro Tipo I decisão correta Prof. Luiz Arthur Dornelles Jr. 217 Principais conceitos Nível de significância de um teste: é a probabilidade de se cometer o erro tipo I, ou seja, rejeitar uma hipótese verdadeira. Hipótese nula: é a hipótese relacionada ao valor do parâmetro que queremos avaliar. Notação: H0: hipótese nula Hipótese alternativa: é a afirmação a respeito da valor do parâmetro que estaremos aceitando caso haja rejeição a hipótese nula (H0). Notação: HA: hipótese alternativa. Teste de significância: é o teste específico feito para apoiar a decisão de não rejeitar ou rejeitar uma hipótese nula , isto tudo, com base em informações provenientes de uma amostra. Prof. Luiz Arthur Dornelles Jr. 218 Principais conceitos TIPOS DE TESTES: Testes bilaterais: a região de não rejeição é central e as regiões críticas estão a direita e a esquerda da região de não rejeição: € H 0 : parâmetro = b HA : parâmetro≠ b ⎧ ⎨ ⎩ Prof. Luiz Arthur Dornelles Jr. 219 Principais conceitos TIPOS DE TESTES: Testes unilateral a esquerda: a região de não rejeição é a direita e tem uma região crítica a esquerda: € H 0 : parâmetro = b HA : parâmetro < b ⎧ ⎨ ⎩ Prof. Luiz Arthur Dornelles Jr. 220 Principais conceitos TIPOS DE TESTES: Testes unilateral a direita: a região de não rejeição é a esquerda e tem uma região crítica a direita: € H 0 : parâmetro = b HA : parâmetro > b ⎧ ⎨ ⎩ Prof. Luiz Arthur Dornelles Jr. 221 Principais conceitos TIPOS DE TESTES: Observação: A mostra deve ser selecionada após a escolha do tipo de teste a ser utilizado e não ao contrário. Os dados coletados não devem influenciar na escolha do teste a ser utilizado. Prof. Luiz Arthur Dornelles Jr. 222 Como testar hipóteses para as médias populacionais? Prof. Luiz Arthur Dornelles Jr. 223 Exemplo 01: Para uma determinada população, sabe-se que historicamente apresenta um desvio padrão de 6. Tirando uma amostra aleatória de 16 elementos, desta população, observou-se que a média apresentada é . Um pesquisador afirma que a média populacional é µ=45 com um grau de significância de 10%, ele está correto? € H 0 : µ = 45 HA : µ ≠ 45 ⎧ ⎨ ⎩ ⇒ Teste bilateral Como testar hipóteses para as médias populacionais? Prof. Luiz Arthur Dornelles Jr. 224 Exemplo 02: Como os males que o tabagismo traz, uma série de institutos de pesquisa levantam dados sobre o consumo e suas patologias. Um deles levantou uma amostra de 10 cigarros de uma marca que, em média, tem 25,3 mg de nicotina. Por experiência, os institutos sabem que o desvio padrão para esta marca é de 2,31 mg. Já o fabricante desta marca afirma que este cigarro apresenta menos de 26 mg. Usando um grau de significância de 5%, determine se este fabricante está correto. € H 0 : µ = 26 HA : µ < 26 ⎧ ⎨ ⎩ ⇒ Teste unilateral a esquerda Como testar hipóteses para as médias populacionais? Prof. Luiz Arthur Dornelles Jr. 225 Exemplo 03: Um industrial está tentando aumentar a resistência de um tipo de aço fabricado por sua empresa. Atualmente sua resistência é de 325 kg. A resistência deste tipo de aço apresenta uma variabilidade σ=18 kg. O setor de controle de qualidade examinou uma amostra de 35 peças e constatou uma resistência média de 334 Kg. Ao nível de significância de 10% pode o industrial afirmar que a resistência aumentou? € H 0 : µ = 325 HA : µ > 325 ⎧ ⎨ ⎩ ⇒ Teste unilateral a direita Como testar hipóteses para as médias populacionais? Prof. Luiz Arthur Dornelles Jr. 226 Como testar hipóteses para as proporções populacionais? Prof. Luiz Arthur Dornelles Jr. 227 Exemplo 01: Uma máquina é considerada regulada quando 5% de sua produção é defeituosa. Um levantamento feito com 500 peças, resultou que 32 delas eram defeituosas. A um nível de significância de 2% se esta máquina está desregulada. Como testar hipóteses para as proporções populacionais? € H 0 : p = 0,05 HA : p > 0,05 ⎧ ⎨ ⎩ ⇒ Teste unilateral a direita Exemplo 02: O prefeito da cidade afirmou que mais de 40% dos trabalhadores do município tem algum convênio particular de assistência médica. Representante dos trabalhadores resolveu testar esta hipótese e com uma amostra de 90 trabalhadores, descobriu que 30% deles tinham este tipo de convênio. Com base nestes dados e com um nível de significância de 5%, determine se o prefeito está correto. Prof. Luiz Arthur Dornelles Jr. 228 Como testar hipóteses para as proporções populacionais? € H 0 : p = 0,4 HA : p =< 0,4 ⎧ ⎨ ⎩ ⇒ Teste unilateral a esquerda Prof. Luiz Arthur Dornelles Jr. 229 Exemplo 03: Um candidato a governador do estado afirmou que tem 60% das intenções de votos. A pedido do partido oponente, um instituto levantou uma amostra de 300 eleitores para investigar qual o percentual de votantes neste candidato. Nesta amostra, 159 indicaram que votariam no candidato. A afirmação do candidato está correta adotando um nível de significância de 5%? Como testar hipóteses para as proporções populacionais? € H 0 : p = 0,6 HA : p ≠ 0,6 ⎧ ⎨ ⎩ ⇒ Teste bilateral Prof. Luiz Arthur Dornelles Jr. 230 Usando a distribuição t de Student para testar hipóteses Prof. Luiz Arthur Dornelles Jr. 231 Exemplo 01: Um determinado produto por uma empresa, apresenta, em média, vida útil de 1120 horas. O setor de qualidade para manter atualizadas as informações sobre os produtos, levantou uma amostra de 8 elementos deste produto e verificou que a vida útil média foi de 1070 horas e apresentou desvio padrão de 125 horas e distribuição normal. Este setor comunicou que a vida média deste produto não se alterou. Com um grau de significância de 1%, verifique se o setor está correto? Usando a distribuição t de Student para testar hipóteses € H 0 : µ = 1120 HA : µ ≠ 1120 ⎧ ⎨ ⎩ ⇒ Teste bilateral Prof. Luiz Arthur Dornelles Jr. 232 Exemplo 02: Como os males que o tabagismo traz, uma série de institutos de pesquisa levantam dados sobre o consumo e suas patologias. Um deles levantou uma amostra de 25 cigarros de uma marca que, em média, tem 38 mg de nicotina e o desvio padrão de 0,5 mg. Já o fabricante desta marca afirma que este cigarro apresenta menos de 40 mg. Usando um grau de significância de 5%, determine se este fabricante está correto. Usando a distribuição t de Student para testar hipóteses € H 0 : µ = 40 HA : µ < 40 ⎧ ⎨ ⎩ ⇒ Teste unilateral a esquerda Prof. Luiz Arthur Dornelles Jr. 233 Exemplo 03: Uma máquina que produz uma determinada peça de precisão, está sendo testada pela manutenção. Esta máquina produz peças de 2 cm de diâmetro. Para testar o setor utilizou uma amostra de 10 peças e os resultados obtidos foram . A manutenção deseja saber se esta máquina está produzindo peças com diâmetros maiores. Use um grau de significância de 10%. Usando a distribuição t de Student para testar hipóteses € H 0 : µ = 2 HA : µ > 2 ⎧ ⎨ ⎩ ⇒ Teste unilateral a direita € x = 2,008 cm e S = 0,004 cm Prof. Luiz Arthur Dornelles Jr. 234 OBSERVAÇÕES: • A amostra é selecionada depois da escolha do teste. • Dados amostrais não devem influenciar na escolha do tipo de teste. • Nível de significância: Menor ou igual a 5% - altamente significativos. Entre 5% e 10% - provavelmente significativos. Maior ou igual a 10% - pouco significativos. • A hipótese nula é expressa por uma igualdade enquanto que a hipótese alternativa é dada por uma desigualdade ( < , > , ≠ ). Prof. Luiz Arthur Dornelles Jr. 235 PODER DE UM TESTE: A força de um teste é dada pela probabilidade de os erros do tipo I ou II ocorrerem, ou seja: * - Probabilidade de cometer o erro do tipo I ** - Probabilidade de cometer o erro do tipo II Prof. Luiz Arthur Dornelles Jr. 236 PODER DE UM TESTE: Quanto menor o β (Probabilidade de cometer o erro do tipo II) melhor o poder do teste. * - Probabilidade de cometer o erro do tipo I ** - Probabilidade de cometer o erro do tipo II Prof. Luiz Arthur Dornelles Jr. 237 PODER DE UM TESTE: LISTA 15 BIBLIOGRAFIA
Compartilhar