Prévia do material em texto
Livro Eletrônico Aula 09 Estatística p/ TCU 2018 (Auditor Federal de Controle Externo) - Com videoaulas Professor: Jeronymo Marcondes Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 1 de 130 AULA 09 – Correlação e Regressão SUMÁRIO PÁGINA Associação entre variáveis 2 Associação entre variáveis qualitativas 4 Associação entre variáveis quantitativas 10 Associação entre variáveis qualitativas e quantitativas 15 Introdução ao método de regressão 17 Estimação com base em amostra e Método dos Mínimos Quadrados Ordinários (MQO) 21 Tabela ANOVA 28 Teste de hipóteses sobre os coeficientes 35 Eficiência do estimador de Mínimos Quadrados Ordinários (MQO) 38 Lista de Exercícios resolvidos 101 Gabarito 130 Bem vindos! Nesta aula, temos alguns assuntos importantes para discutir: 1) Correlação. 2) Regressão Linear. Dica de um concurseiro Aquele pensamento de estudar matérias de exatas, tais como estatística, só por exercícios não é muito correto. Toda matéria, independentemente de qual, deve ser estudada com base em teoria também. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 2 de 130 1. Associação entre variáveis Até agora estudamos o comportamento de variáveis com distribuições e parâmetros definidores de sua dinâmica, tal como sua média, por exemplo. Mas, uma questão que os estatísticos sempre têm que abordar é: como é o comportamento conjunto de mais de uma variável? Por exemplo, um pesquisador pode estar interessado em saber como a renda dos indivíduos de uma determinada região está correlacionada com seus gastos em consumo. O que deve ser feito é avaliar como a variável “renda” de um determinado indivíduo se relaciona com a variável “gastos em consumo” do mesmo. Neste caso, teríamos um conjunto de variáveis relativas à renda dos diversos indivíduos pesquisados (堅沈) e outro conjunto com as variáveis relativas ao consumo destes mesmos indivíduos (潔沈). Suponha que nossa amostra seja dada por 8 (oito) indivíduos, cujos valores para estas variáveis sejam dados por: Indivíduo Renda (R$) Consumo (R$) 1 1000 700 2 1500 800 3 2000 1000 4 2300 1100 5 2700 1200 6 5500 2300 7 6000 2500 8 7300 3000 Se você colocar em um gráfico os pontos relativos a cada indivíduo, de forma que localizemos o valor de consumo no eixo vertical, da renda no eixo horizontal e que o ponto seja a “intersecção” destes valores, teríamos o seguinte gráfico de dispersão: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 3 de 130 Olhe o que este gráfico está te mostrando! Conforme a renda cresce, o valor gasto em consumo também cresce, mas a taxas decrescentes. Veja que, para o primeiro indivíduo o consumo é 70% de toda sua renda, enquanto que, para o 8º indivíduo, o consumo é 41%. Viu que conclusão interessante você tirou a partir da análise desta amostra fictícia? A lista de possibilidades é infinita! Vocês terão que fazer isso várias vezes no setor público, pois a análise de muitos projetos necessita este conhecimento estatístico. Assim, nesta aula, precisaremos estudar a forma de avaliar o comportamento conjunto de variáveis. Entretanto, vocês devem lembrar-se de que há dois tipos de variáveis: quantitativas e qualitativas. Assim, podemos ter 3 (três) casos de associação entre variáveis: 1) Entre duas variáveis qualitativas; 2) Entre duas variáveis quantitativas; 3) Entre uma variável qualitativa e outra quantitativa. Então, vamos começar! Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 4 de 130 2. Associação entre variáveis qualitativas Para que vocês entendam direitinho, vamos analisar alguns exemplos do livro “Estatística Básica” dos professores Bussab e Morettin. Suponha que queiramos verificar se existe associação entre o sexo e a carreira escolhida por 200 alunos de Economia e Administração. Nós podemos verificar como se dá a distribuição conjunta destas variáveis por meio de uma tabela de dupla entrada ou tabela de contingência. Veja como seria uma tabela deste tipo: Curso\Sexo Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Olhe, cada entrada da tabela representa quantas vezes ocorre cada realização conjunta. Não entendeu? Veja o primeiro quadradinho da tabela, que tem o valor de 85: Curso\Sexo Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 O que ele está te dizendo é que há 85 homens que cursam economia, ou seja, ele dá a realização simultânea de (嫌結捲剣 噺 兼欠嫌潔憲健件券剣) e (潔憲堅嫌剣 噺 結潔剣券剣兼件欠). Em termos matriciais, nós podemos chamar esta célula de (な┸な), pois se trata da intersecção da primeira linha com a primeira coluna. Assim, sempre que você ver a definição de uma célula de uma matriz com base em dois números entre parênteses (捲 e 検, por exemplo), o que isso está te falando é que: 岫捲┸ 検岻 噺 岫健件券月欠┸ 潔剣健憲券欠岻 噺 件券建結堅嫌結潔çã剣 穴欠 健件券月欠 捲 潔剣兼 潔剣健憲券欠 検. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 5 de 130 Este é um exemplo de amostragem aleatória estratificada em contraposição à amostragem aleatória simples, que estudamos até agora! Esta última é o caso no qual qualquer membro da população tem a mesma chance de ser sorteado para a amostra, como se fosse um sorteio. Já no presente exemplo, a população foi dividida em subgrupos (tal como homens e mulheres, por exemplo) e, a partir daí, é realizada uma amostragem aleatória simples em cada um destes estratos. E qual é a quantidade de alunos de Economia, independentemente do sexo? Ora, basta somar a linha respectiva à economia: Curso\Sexo Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Entendeu? Há 120 alunos de Economia, sendo 85 homens e 35 mulheres. Este valor, que nos dá o valor total de realizações de uma variável qualitativa (independentemente das outras variáveis qualitativas), é chamado de distribuição marginal. Na nossa tabela, estes valores estão nas células (1,3), (2,3), (3,1) e (3,2). Em vez de trabalharmos com frequências absolutas, como é o caso, fica mais fácil visualizar interações utilizando frequências relativas! -“Como fazer isso, professor”? Basta dividir as células pelas suas distribuições marginais. “Mas, devo utilizar as distribuições marginais das linhas ou das colunas”? Aí,depende do que você quer avaliar. No nosso caso, vamos fixar o total dos sexos como 100% e, com base nisso, encontrar quanto cada curso representa de matriculas por sexo. Veja como ficaria: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 6 de 130 Curso\Sexo Masculino Feminino Total Economia 61% 58% 60% Administração 39% 42% 40% Total 100% 100% 100% Viu o que eu fiz? Eu dividi cada célula pelo total dado pela coluna e multipliquei por 100. Por exemplo, na célula (1,1), realizamos a divisão de 85 por 140, o que dá, aproximadamente, 0,61. Agora eu te pergunto: existe relação entre o sexo da pessoa e o curso escolhido?Quando nós fixamos a coluna e encontramos as frequências relativas, estamos encontrando, nas duas primeiras colunas, qual o percentual de cada sexo que frequenta cada curso, enquanto que, na última coluna, determinamos o percentual de pessoas que frequenta cada curso, independentemente do sexo. Isso não te lembra nada? Exatamente! As probabilidades condicionais. As duas primeiras colunas referem-se a “frequências condicionais”, enquanto que a última seria como se fosse uma “frequência incondicional”. Lembra- se de que, quando os eventos são independentes, a probabilidade condicional é igual à incondicional? Aplique um raciocínio análogo ao presente caso, se a frequência condicional é muito próxima à incondicional, a “condição” parece não ajudar a explicar o fenômeno. Vamos exemplificar! No nosso exemplo, 60% das pessoas da população frequentam cursos de Economia e 40% frequentam cursos de Administração, independentemente do sexo. Assim, olhando a tabela, podemos ver que as proporções do sexo masculino (61% e 39%) e feminino (58% e 42%) são muito próximas das marginais (60% e 40%). Este resultado parece indicar não haver dependência entre as duas variáveis. Com base nestas afirmações podemos inferir que, provavelmente, o sexo de uma pessoa não influencia na escolha entre cursos de Economia e Administração. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 7 de 130 Veja outro exemplo: Curso\Sexo Masculino Feminino Total Física 100 (71%) 20(33%) 120(60%) Ciências Sociais 40 (29%) 40(67%) 80(40%) Total 140(100%) 60(100%) 200(100%) Agora a coisa é diferente! Veja que as proporções de frequência nos cursos de Física e Ciências Sociais por parte do sexo masculino (71% e 29%, respectivamente) e feminino (29% e 67%, respectivamente) são muito diferentes das proporções marginais (60% e 40%, respectivamente). Ou seja, quando incluímos a informação referente ao sexo do indivíduo, a distribuição de pessoas pelos cursos se modifica muito com relação ao total geral. Assim, as variáveis parecem estar associadas! Porém, muitas vezes, é importante quantificar esta associação, isso é, o “quanto” estas variáveis estão associadas? Para isso utilizaremos o chamado coeficiente de contingência de Pearson. Este coeficiente se baseia no somatório dos desvios de cada célula com relação ao seu valor esperado caso as variáveis em estudo não fossem associadas. Não entendeu nada, não é? Vamos voltar ao exemplo dos alunos de Física e Ciências Sociais. No fundo, o que fizemos foi comparar a proporção marginal de cada curso com relação às suas respectivas proporções associada a cada sexo. Assim, caso as variáveis não tivessem nenhuma associação, esperar-se-ia que: Curso\Sexo Masculino Feminino Total Física 84 (60%) 36 (60%) 120 (60%) Ciências Sociais 56 (40%) 24 (40%) 80 (40%) Total 140 (100%) 60(100%) 200 (100%) Entendeu? Se as variáveis não forem associadas, espera-se que 60% das pessoas frequentarão cursos de Física e 40% cursos de Ciências Sociais, independentemente do sexo. Se isso for verdade, basta aplicar estes percentuais no total de cada coluna que encontraríamos os valores esperados de cada célula se as variáveis não fossem associadas. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 8 de 130 Se compararmos o valor real de cada célula com seu valor esperado, teremos a seguinte distribuição: Curso\Sexo Masculino Feminino Total Física 100-84=16 20-36=-16 0 Ciências Sociais 40- 56=-16 40-24=16 0 Total 0 0 0 Este é o mesmo problema que encontramos quando estudamos a variância, pois a soma dos desvios deve igualar zero. Assim, vamos adotar uma estratégia semelhante para resolver o problema, elevando os desvios ao quadrado e dividindo tal resultado pelo valor esperado da célula: Curso\Sexo Masculino Feminino Física (16)²/84 (-16)²/36 Ciências Sociais (-16)²/56 (16)²/24 Pode-se provar que a soma de todos estes elementos gera uma estatística de teste qui-quadrado (璽ふ). Não cabe demonstrar isso aqui, portanto, decore! Assim, a estatística de teste para análise de associação entre estas variáveis é dada por: 鋼ふ 噺 岫なは岻態ぱね 髪 岫伐なは岻態のは 髪 岫なは岻態にね 髪 岫伐なは岻態ぬは 噺 ぬ┸どね 髪 ね┸のば 髪 ば┸なな 髪 など┸はば 簡 匝捜┸ 想 Este é um valor significantemente maior do que zero, portanto, pode-se inferir que as variáveis estão associadas. Quanto maior este valor, maior é a associação entre as variáveis. Viu como se faz? Portanto, guarde a fórmula: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 9 de 130 鋼ふ 噺 み 峭盤堅沈┸沈 伐 結沈沈匪ふ結沈沈 嶌 Sendo que esta expressão está te dizendo para somar, para todas as células (件┸ 件), o quadrado das diferenças entre o valor real (堅沈┸沈) e o valor esperado em cada célula (結沈沈), caso as variáveis não fossem associadas, divido pelo seu respectivo valor esperado. “Tá bom professor, mas devo comparar este valor com a tabela qui-quadrado”? Olha, não precisamos entrar nisso. Esta parte fica um pouco mais complicadinha e nunca cai em concursos que não sejam específicos para estatísticos. Assim, só saiba calcular a estatística de teste e o coeficiente de Pearson que já basta. Com base neste valor qui-quadrado, pode-se calcular o coeficiente de contingência de Pearson, dado por: 察伺蚕讃餐算餐蚕仔嗣蚕 纂蚕 皿蚕珊司史伺仔 噺 俵 璽ふ璽ふ 髪 仔 Sendo 券 o tamanho da amostra. Surge uma pergunta natural: -“Qual o tamanho ideal de minha amostra”? Essa é uma pergunta sem uma única resposta! Isso muda de autor para autor. Mas, é importante que vocês conheçam uma “regrinha de bolso” para determinação do valor ideal de uma amostra com base no erro amostral tolerável (撮). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 10 de 130 Nós já estudamos o que é um erro amostral: a margem de erro da aula anterior. Existe uma fórmula que nos dá a amostra mínima com base no máximo de erro que estamos dispostos a cometer: 仔 噺 層撮ふ Isso é, para um erro amostral da ordem de 4%, devemos ter uma amostra de, no mínimo: 券 噺 な継ふ 噺 な岫ど┸どね岻態 噺 掃匝捜 Ou seja, nossa amostra deve ter, no mínimo, 625 elementos. 3. Associação entre variáveis quantitativas No caso de uma análise entre variáveis quantitativas o nosso “arsenal” para análise é muito maior! Nós podemos tanto utilizar o que estudamos na seção anterior, quanto outras possibilidades gráficas, como o diagrama de dispersão. Veja o exemplo que demos no início da aula: Indivíduo Renda (R$) Consumo (R$) 1 1000 700 2 1500 800 3 2000 1000 4 2300 1100 5 2700 1200 6 5500 2300 7 6000 2500 8 7300 3000 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 11 de 130 Este é um caso de variáveis quantitativas em que podemos usar o diagrama de dispersão, ensinado na aula 00. O que eu quero que vocês notem é o seguinte: Entendeu? Se você traçar uma reta que “mais ou menos” que une os pontos, você encontra uma reta inclinada para cima, ou como chamam os matemáticos, positivamente inclinada. O que isso quer dizer é: quanto maior a renda, maior será o consumo associado, isso é, trata-se de variáveis positivamente correlacionadas. Este é um caso possível de associação entre duas variáveis quantitativas, mas nãoo único. As variáveis podem ser negativamente correlacionadas. Neste caso, quanto maior uma delas, menor será o valor associado na outra. Quer um exemplo? Suponha que seja feita uma pesquisa que relacione o PIB de 6 economias com a taxa de incidência de leptospirose nas mesmas. É de se esperar que economias mais ricas tendam a ter melhores condições de saneamento, o que reduz a taxa de incidência desta doença. Em termos gráficos, seria algo mais ou menos assim: 0 500 1000 1500 2000 2500 3000 3500 0 2000 4000 6000 8000 C o n su m o Renda Consumo x Renda Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 12 de 130 Com efeito, os pontos indicam que, quanto maior o PIB, menor a taxa de incidência da doença. O traçado de uma reta que explicita esta dinâmica mostra uma reta inclinada para baixo, ou negativamente inclinada. Este é um caso de variáveis negativamente associadas. Os dois casos mostram exemplos de correlação linear, ou seja, que podem ser representados por uma linha reta. Podem existir casos de associação não linear, entretanto não vamos entrar neste detalhe. Apenas entenda o que é uma associação entre variáveis, que pode ser positiva (quando uma aumenta a outra também aumenta, ou quando uma se reduz a outra também reduz) ou negativa (quando uma aumenta a outra reduz ou quando uma reduz a outra aumenta). No frigir dos ovos: uma relação positiva significa que a “direção” em que uma variável se movimenta é a mesma da outra variável, por outro lado, uma relação negativa implica que as variáveis se “movimentarão” em sentidos opostos. -“E se as variáveis forem não associadas”? Boa pergunta! Neste caso, não conseguiremos tirar uma “tendência” da análise gráfica. A título de ilustração: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 13 de 130 Neste caso, não há uma tendência clara entre as duas variáveis! Este é um exemplo de variáveis não associadas. Uma medida numérica de associação pode ser obtida pelo coeficiente de correlação (持). Para uma amostra de tamanho (券), o coeficiente de correlação entre duas variáveis quaisquer, 捲 e 検, é dado por: Sendo 捲違 e 検博 as médias e 穴喧岫捲岻 e 穴喧岫検岻 os desvios padrões das variáveis 捲 e 検 respectivamente. Em termos bem simples, cada parêntese representa a versão padronizada de cada uma das variáveis, portanto o coeficiente de correlação é igual à média dos produtos dos valores padronizados das variáveis em análise. Este valor vai de – 1 (menos hum) a 1 (hum): 伐層 判 持 判 層 貢掴┸槻 噺 な券 み 釆磐捲沈 伐 捲違穴喧岫捲岻卑 糾 磐検沈 伐 検博穴喧岫検岻卑挽 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 14 de 130 Um valor próximo de 1 indica associação positiva, enquanto que outro próximo de -1 indica associação negativa. Um valor próximo de zero indica não associação entre variáveis. Outra forma de explicitar o coeficiente de correlação é por meio da covariância. Covariância (系剣懸) é uma medida da “variância conjunta” entre duas variáveis. Para uma amostra de tamanho (券), a covariância entre duas variáveis quaisquer, 捲 e 検, é dada por: 系剣懸岫捲┸ 検岻 噺 な券 み岷岫捲沈 伐 捲違岻 糾 岫検沈 伐 検博岻峅 Aí fica fácil ver que: 持姉┸姿 噺 察伺士岫姉┸ 姿岻纂使岫姉岻 糾 纂使岫姿岻 Entendeu? Antes de passarmos para o próximo tópico, vocês precisam saber uma coisa importante demais sobre a covariância! A covariância entre duas variáveis é influenciada pela associação que uma variável tem sobre a outra. Assim, se duas variáveis são independentes, a covariância entre ambas é igual à zero. Porém, o fato de a covariância entre duas variáveis ser igual à zero não quer dizer que elas sejam independentes. Atenção a isso! Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 15 de 130 4. Associação entre variáveis quantitativas e qualitativas Este é um caso que não é muito cobrado em concurso, assim vamos tentar ser mais rápidos aqui. Vamos nos basear em outro exemplo dos professores Bussab e Morettin. Suponha que seja feita uma pesquisa de forma a avaliar o comportamento dos salários (variável quantitativa) dentro de cada categoria de grau de instrução (variável qualitativa). Os resultados encontrados foram: Grau de Instrução Tamanho da amostra (仔) Média Salarial Variância Amostral Fundamental 12 7,84 7,77 Médio 18 11,54 13,1 Superior 6 16,48 16,89 Total 36 11,12 20,46 Pode-se inferir que, quanto maior o nível educacional, na média, maior será o salário do indivíduo. Uma forma de confirmar a veracidade dessa afirmação é percebendo que a variância amostral para todos os dados é maior do que a variância para cada subclasse. -“Por que isso é importante”? Ora, se os dados totais apresentam maior variância do que cada classe individualmente, isso significa que reduzir nossa análise a subclasse melhora a acurácia de nossas conclusões. -“E se, por exemplo, a variância da subclasse “ensino superior” fosse de 23”? Neste caso, a subdivisão dos dados em uma classe de nível superior não estaria “ajudando” na análise, pois a variabilidade seria menor se analisássemos os dados dos salários como um todo. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 16 de 130 Assim, podemos quantificar o grau de associação entre duas variáveis como o “ganho relativo na variância” obtido pela introdução da variável qualitativa. Isso é feito por meio do R² (nós a estudaremos com mais detalhes logo mais). Para quantificarmos o R² precisamos definir (撃欠堅博博博博博), a média das variâncias dentro dos subgrupos, que chamaremos de variância média. Ao definirmos 撃欠堅沈 糾 券沈 como o produto da variância do subgrupo 件 pelo tamanho da amostra no mesmo, a variância média será dada por: 撃欠堅博博博博博 噺 み岫撃欠堅沈 糾 券沈岻み岫券沈岻 Assim, com base na variância total da amostra (撃欠堅), podemos definir R² como: 迎ふ 噺 な 伐 撃欠堅博博博博博撃欠堅 Então se aplicarmos esta fórmula a nosso exemplo acima: 迎ふ 噺 な 伐 磐なに 糾 岫ば┸ばば岻 髪 なぱ 糾 岫なぬ┸など岻 髪 は 糾 岫なは┸ぱひ岻なに 髪 なぱ 髪 は 卑にど┸ねは 噺 なな┸ひはにど┸ねは 噺 宋┸ 想層捜 噺 想層┸ 捜ガ Isso quer dizer que 41,5% da variabilidade dos salários é explicada pela variável “grau de instrução”. Beleza, terminamos a parte de correlação, vamos à regressão! Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 17 de 130 5. Introdução ao método de Regressão Pessoal, hora de forçar a memória escolar e lembrar o que é uma função, ou melhor, uma função linear. Função é uma relação entre duas variáveis, como por exemplo: a) Vendas de uma empresa e gastos em propaganda; b) Aumento de peso de uma pessoa e quantidade de comida ingerida; c) Valor da conta de energia e número de equipamentos elétricos em uma casa. Se chamarmos a primeira variável de cada item de y e a segunda de x, matematicamente, pode-se descrever tal relação como: y = f(x). O que quer dizer “y é função de x”, ou que as vendas de uma empresa são uma função da quantidade investida em propaganda. Pode-se afirmar que y depende de x, portanto, a nomenclatura usual chama y de variável dependente ou explicada e x de variável independente ou explicativa. Uma das formas de seexpressar tal função é a partir de uma relação linear, tal como: y = 2 + 3x. Ou, genericamente, para qualquer valor que pudesse substituir 2 e 3 na equação acima: y = g + くx. (1) Este é um exemplo de uma função linear, dado que o expoente de x é 1. (lembrem- se que qualquer variável elevada a 1 é igual à própria variável). Esta função linear (lembrem-se da escola) é uma reta. Se x estivesse elevado ao quadrado, seria uma parábola. Para que você tenha certeza que isso é uma reta, substitua alguns valores na primeira equação e os coloque em um gráfico, você verá que se trata de uma equação de reta. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 18 de 130 - “Professor, ótimo, mas por que você está falando tudo isso?” Porque, meus queridos alunos, um dos principais objetivos da análise de regressão é encontrar uma função linear que descreva o comportamento estatístico entre duas variáveis. Assim, com base em uma série estatística, a estimação de uma regressão possibilitaria que você encontrasse os valores de g e く na equação (1). O processo de encontrar a relação entre y e x é chamado de Regressão e, se for uma reta, como na equação (1), é chamado de Regressão Linear. Como a equação (1) só possui uma variável explicativa, o processo de encontrar tal relação se chama Regressão Linear Simples. Porém, perceba que é muito raro que uma variável do mundo real, ainda mais quando ligada à economia ou a fenômenos sociais, consiga ser representada por uma reta. Vamos supor que estamos tratando do exemplo (a) acima descrito para o ano de 2012 e que possuímos dados de todas as vendas de todas as empresas de um determinado setor e de todos os gastos de propaganda efetuados por estas empresas.1 Colocando tal relação em um gráfico: 1 Gente, só para chamar a atenção, por enquanto estamos trabalhando com dados coletados em um único período de tempo, no caso uma única observação por empresa no ano de 2012 (pode ser a soma de todo o ano, ou de um determinado mês, etc.) Este tipo de disposição de dados é chamado de dados em cortes transversais ou “cross section”. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 19 de 130 A reta é representada pela equação (1) e os pontos são os valores que y assume para cada x. Uma propriedade importante dessa reta de regressão é que ela passa pelo ponto 岫隙博┸ 桁博岻, ou seja o ponto que é pela média de X e Y, simultaneamente. Essa é uma propriedade da regressão linear simples! Isso já foi cobrado em provas anteriores e é importante que você guarde. Não vou adentrar na prova dessa propriedade, apenas saiba isso! E aí pessoal, o que vocês estão vendo? Veja que a reta explica bem o comportamento da variável, se aproximando dos valores reais, mas ainda assim não explica tudo. Olhe o 3º ponto, nele o valor das vendas aumentou, na média, muito mais do que o esperado para um determinado investimento em propaganda. Isso pode ser decorrência de muitos fatores do mundo real, como o fato de que a empresa talvez fosse muito desconhecida até então, portanto, um pequeno investimento em propaganda teve resultados muito grandes quando comparado a empresas que já são relativamente conhecidas. Este tipo de raciocínio pode ser aplicado para os pontos abaixo da reta também, que apresentam, na média, retornos abaixo do esperado para um determinado gasto em propaganda. Assim, se uma versão linear e simples da equação de reta for a mais bem ajustada à série de dados, pode-se inferir que a equação que representa a real dinâmica do fenômeno em estudo, no caso, as vendas da empresa é dada por: 9 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 20 de 130 検沈 噺 糠 髪 紅捲沈 髪 綱沈 Sendo i o termo que representa o “erro”, ou seja, os desvios das observações com relação à reta (pensem comigo, o erro é a distância da reta até cada um daqueles pontos no gráfico acima). O subscrito “i” se refere à cada uma das empresas analisadas em 2012, isto é, a empresa representada no primeiro ponto no gráfico tem subscrito (1), a segunda subscrito (2) e assim por diante. Vocês concordam comigo que não dá para levar em conta todas as variáveis que afetam o comportamento das vendas de todas as empresas? Pode ser que um gerente comercial muito bom de serviço tenha pedido demissão da empresa (4), o que puxaria suas vendas para baixo, apesar do investimento em propaganda, etc. Assim, o erro leva em conta estes efeitos impossíveis de se mensurar, mas que afetam a dinâmica de y. Bom, apesar do fato de que este erro é algo que nós temos que aprender a viver com ele, o mesmo possui uma característica interessante que nós temos que levar em conta: 継岫綱沈岻 噺 ど Isto é, a média dos erros é igual a zero. Ou seja, os desvios “para cima da reta” igualam o valor dos desvios” para baixo da reta” na média. Ou seja, estes erros são supostamente aleatórios, então a teoria nos permite inferir que, se o modelo estiver corretamente especificado, o erro será, na média, igual à zero. 1ª hipótese sobre o modelo de regressão linear: 継岫綱沈岻 噺 ど e Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 21 de 130 E aí rapaziada, que cara de sono é esta? Vamos acordando, pois um futuro servidor público não pode dormir em serviço! Você será bem remunerado e com status, mas com muita responsabilidade. 6. Estimação com base em amostra e Método dos Mínimos Quadrados Ordinários (MQO) Vamos ver se vocês estão realmente atentos: lembram-se quando eu disse que a regressão tinha a ver com todas as empresas, todas as receitas de vendas e todos os gastos em propaganda? Atenção, até agora falamos de uma regressão com a população, ou universo, das variáveis escolhidas. Mas, na maioria dos casos, não possuímos o universo. Por exemplo, no caso de uma regressão do valor salarial obtido por um trabalhador em função do nível de escolaridade de cada um destes, é praticamente impossível se realizar este exercício, pois a base de dados para isto é infinitamente grande. Assim, na maior parte das vezes, o pesquisador acaba trabalhando com uma amostra! Ao se avaliar uma regressão para uma amostra estaremos a estimar os parâmetros de regressão (g e く na equação (1)), ou como nós falamos no dia a dia, estimar uma regressão. - “Tá bom Professor, mas, afinal de contas, como se estima uma regressão?” Ótimo! Tente imaginar um momento: a estimativa dos parâmetros deve ser feita de forma a garantir o que? É isso! De forma a minimizar os erros. Isso é feito pelo método dos Mínimos Quadrados Ordinários (MQO) que nos dá um valor estimado para g e く, que, chamaremos, a partir daqui, de 欠 e 決. 8 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 22 de 130 Com base no fato de que a média dos erros é igual a zero, não há como se minimizar a soma dos erros, dado que o valor sempre será zero. Assim, o objetivo do método é minimizar a soma dos quadrados dos erros, o que é feito pelo estimador de MQO. Gente, sejamos práticos, nunca caiu e, provavelmente, nunca vai cair a derivaçãodo estimador de MQO, assim, decorem: Sendo que o travessão sobre determinada variável representa o valor médio da mesma, define-se a média de uma variável, bem como o valor de uma variável centrada na média: 捲博 噺 デ捲件券 捲葡件 噺 捲件 伐 捲博 Assim, b pode ser encontrado pelo somatório da multiplicação de cada 捲葡件 com seu respectivo 検葡件 (covariância entre x e y) dividido pela soma de todos os 捲葡件 elevados ao quadrado (variância de x). Gente, muita atenção mesmo, perceba que as variáveis devem ser inseridas na fórmula acima de forma a estarem centradas na média, ou seja, reduzidas do valor da média de sua série. Atenção! Muitos exercícios de concursos públicos se utilizam de propriedades estatísticas que permitem inferir que: デ姿蕪餐姉蕪餐 噺 デ散桟 伐 デ散デ桟仔 デ姉蕪餐匝 噺 デ散匝 伐 岫デ散岻匝仔 決 噺 デ捲葡沈検葡沈デ捲葡沈態 噺 系剣懸岫捲┸ 検岻撃欠堅岫捲岻 欠博 噺 検 拍 伐 決捲博 c Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 23 de 130 Ou seja, o exercício fornece o somatório das variáveis utilizadas na equação, mas sem estarem centradas na média. Neste caso, você precisa decorar estas fórmulas, ok? No caso da segunda equação, que define g (também chamado de intercepto), há uma forma específica, mas ela é um pouco esquisita e eu acho que esta forma facilita a memorização, dado que com os valores médios das variáveis e com a estimativa de b, encontra-se 欠. Exercício 1 Só para vocês ficarem contentes em ver uma aplicação prática, vamos fazer um exemplo. Vamos lá! Dada a seguinte série de dados, estime a regressão linear Y = f(X), ou costumeiramente chamada de “Y contra X”. Variáveis X Y 103 160 123 167 145 207 126 173 189 256 211 290 178 237 155 209 141 193 156 219 166 235 179 234 197 273 204 272 125 181 112 166 107 161 135 195 144 201 188 255 Soma 3084 4284 Média 154,2 214,2 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 24 de 130 Resolução Bom, primeiramente, vamos encontrar alguns dados necessários para a resolução. Vamos aplicar a fórmula: 決 噺 デ検葡沈捲葡沈デ捲葡沈 噺 なにばひ┸のはなどのひ┸ひは 噺 な┸にどば Com base no resultado acima, podemos calcular: 欠 噺 検博 伐 決捲違 噺 になね┸に 伐 な┸にどば 茅 なのね┸に 噺 にぱ┸どの Portanto, a reta estimada por meio de MQO é: 検賦件 噺 にぱ┸どの 髪 な┸にどば捲件 Variáveis X Y X centrado Y centrado X(centrado)*Y(centrado) (X centrado)² (Y centrado)² 103 160 -51,2 -54,2 2775,04 2621,44 2937,64 123 167 -31,2 -47,2 1472,64 973,44 2227,84 145 207 -9,2 -7,2 66,24 84,64 51,84 126 173 -28,2 -41,2 1161,84 795,24 1697,44 189 256 34,8 41,8 1454,64 1211,04 1747,24 211 290 56,8 75,8 4305,44 3226,24 5745,64 178 237 23,8 22,8 542,64 566,44 519,84 155 209 0,8 -5,2 -4,16 0,64 27,04 141 193 -13,2 -21,2 279,84 174,24 449,44 156 219 1,8 4,8 8,64 3,24 23,04 166 235 11,8 20,8 245,44 139,24 432,64 179 234 24,8 19,8 491,04 615,04 392,04 197 273 42,8 58,8 2516,64 1831,84 3457,44 204 272 49,8 57,8 2878,44 2480,04 3340,84 125 181 -29,2 -33,2 969,44 852,64 1102,24 112 166 -42,2 -48,2 2034,04 1780,84 2323,24 107 161 -47,2 -53,2 2511,04 2227,84 2830,24 135 195 -19,2 -19,2 368,64 368,64 368,64 144 201 -10,2 -13,2 134,64 104,04 174,24 188 255 33,8 40,8 1379,04 1142,44 1664,64 Soma 3084 4284 21199,2 31513,2 Média 154,2 214,2 1059,96 1575,66 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 25 de 130 Voltando à aula! Pessoal, vocês estão entendendo o que representa cada coeficiente? Pense um pouquinho, se o valor gasto em propaganda aumenta em 1 (uma unidade), espera-se que o valor das vendas varie, na média, em b. Cabe destacar a diferença entre erros e resíduos. Os erros são decorrentes dos aspectos que relatamos acima, já os resíduos são os erros de ajuste após a estimação da reta original (1), ou seja, na regressão feita com base na amostra e não mais na população. Assim, a versão estimada de (1) é dada por: 検件 噺 欠 髪 決捲件 髪 結件 (2) Então, estes parâmetros são a versão estimada dos parâmetros na equação (1). Portanto, 結件 são os resíduos da regressão com base em uma amostra n da população N. Meus amigos, vocês conseguem enxergar que este resíduo tem mais um problema além dos já citados para os erros? Lembra do gerente comercial eficiente que pediu demissão? Então, este é um desvio natural de se interpretar um comportamento econômico, derivado de influências de infinitas variáveis, a partir de uma reta. Agora, há outro fator em cena, há um “erro” decorrente de se inferir uma estimativa da reta (1) a partir de (2). Ou seja, o fato de nós só termos uma amostra leva a desvios com relação à estimativa dos parâmetros. Dado que, com base na nossa regressão estimada, o valor esperado de y (検賦) é: 検賦件 噺 欠 髪 決捲件 Assim, os resíduos são: 結件 噺 検件 伐 岫欠 髪 決捲件岻 結件 噺 検件 伐 検賦 件 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 26 de 130 Bom pessoal, nós já temos uma estimativa de uma regressão, agora vocês podem estar se perguntando: “Será que isso está bom? Será que esta reta representa bem a situação ocorrida no mundo real?” Nós vamos estudar isso a seguir. Exercício 2 (FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples. Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa: デ桁件 噺 などど デ隙件 噺 はど デ桁件隙件 噺 はのど デ隙沈態 噺 ねどど デ桁沈態 噺 などぱど Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem- se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 27 de 130 a) 158 b) 128,4 c) 121 d) 102,5 e) 84 Resolução Bom, primeiramente, não caia na armadilha! Estes valores que o exercício te deu não estão centrados na média. Portanto, com base em propriedades estatísticas, pode- se demonstrar que: デ検葡沈捲葡沈 噺 デ隙桁 伐 デ隙デ桁券 デ捲葡沈態 噺 デ隙態 伐 岫デ隙岻態券 Assim, dadas as formas funcionais para cálculo: 決 噺 デ捲葡沈検葡沈デ捲葡沈態 欠博 噺 検 拍 伐 決捲博 Pode-se inferir as estimativas: 決 噺 はのど 伐 はど 茅 などどなどねどど 伐 岫はど岻態など 噺 のどねど 噺 な┸にの 欠 噺 などどなど 伐 な┸にの 茅 はどなど 噺 に┸の Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 28 de 130 Assim, temos a equação de reta. Substituindo X = 80, tem-se que: 検賦 噺 に┸の 髪 な┸にの隙 噺 に┸の 髪 な┸にの 茅 ぱど 噺 などに┸の 7. Tabela ANOVA Vamos lá pessoal, de olho na aprovação! Agora vamos falar sobre o grau de ajustamento de uma regressão. Isso é, quanto uma reta explica dos dados? Bom, é fácil pensar que há uma parcela da variação explicada pela regressão, ouseja, aqueles parâmetros que nós estimamos devem explicar parte da variação real nas observações da amostra, excluída a parte explicada pelos resíduos. -“Professor, não entendi nada!” Ok. Acho que esta parte que fica mais intuitiva com a matemática. E aí, qual a expressão que vocês acham que representa a parcela explicada por uma regressão realizada com base em uma amostra? Claro que é: 検賦件 噺 欠 髪 決捲件 Dado que 欠 é constante, ela não compõe a parte da variância explicada. Assim, com o intuito de se definir uma expressão para a variância explicada pode-se descartá-la: 検賦件 噺 決捲件 Portanto, trata-se da parte estimada da reta que dá o valor previsto de y para cada x, que é costumeiramente descrita como a variável dependente com um acento circunflexo em cima. E a parte não explicada? Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 29 de 130 検 伐 検賦 噺 結 É evidente que a soma de ambas as equações geram a equação de reta original, com a soma do comportamento dos resíduos com a parte explicada. Assim, precisaríamos somar tais expressões para encontrar o total e, a partir daí, tentar entender como cada uma destas parcelas participam da formação do resultado. Mas, sabendo-se que os resíduos têm soma igual à zero, o estudo será feito com base na soma dos quadrados dos resíduos e, por conseqüência, com base na soma dos quadrados explicados e na soma dos quadrados totais. Vamos, primeiro, pelo mais fácil. A soma dos quadrados totais (SQT) é: Segue-se a Soma dos Quadrados Explicados (SQE): E a Soma dos Quadrados dos Resíduos (SQR): Vocês estão entendendo o que nós estamos fazendo? Em termos bem leigos, nós estamos decompondo o quanto uma regressão consegue explicar de quanto ela não 鯨芸劇 噺 デ検葡沈態 鯨芸迎 噺 鯨芸劇 伐 鯨芸継 鯨芸継 噺 デ岫決捲葡沈岻態 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 30 de 130 consegue! Será que você consegue pensar em um jeito de dizer, em termos percentuais, o quanto uma regressão consegue explicar de uma série de dados, ou seja, o quanto a regressão estimada se aproxima do real processo gerador de dados (equação (1))? Beleza! A resposta é fácil mesmo e é dada por: Este é o famoso R² ou coeficiente de determinação. Ele determina “o quanto a regressão está conseguindo refazer da série original a partir de valores estimados”. Assim, a regressão será bem ajustada quanto mais próximo este coeficiente se aproximar de 1. Ou seja, um valor de 0,97 indica que a regressão estimada 97% da variância de y é explicada por x. Lembram-se do coeficiente de correlação amostral nas aulas de estatística? Então, pode-se demonstrar que: 紐迎態 噺 】潔剣結血件潔件結券建結 穴結 潔剣堅堅結健欠çã剣】 噺 罰貢 Esta é, somente, uma das formas de se encontrar o R². Mas, ela já caiu várias vezes, então, meus amigos, vou simplificar para vocês: decorem! Agora podemos partir para a análise da tabela ANOVA. A partir da definição de SRT, SQT e SQE, iremos construir uma tabela que indica como as parcelas decompostas variam ao redor da média da regressão como um todo e se todos os coeficientes em conjunto tem capacidade de explicar a regressão, conforme veremos a seguir. Esta tabela é chamada de ANOVA e tem o seguinte formato: ど 判 迎態 噺 鯨芸継鯨芸劇 噺 な 伐 鯨芸迎鯨芸劇 判 な Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 31 de 130 Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F SQE K 鯨芸継倦 SQR N – k – 1 鯨芸迎券 伐 倦 伐 な SQT N – 1 鯨芸劇券 伐 な Sendo N o número de observações da amostra e k o número de variáveis explicativas na regressão, assim, no caso da regressão simples, k = 1. Novamente pessoal, vamos nos lembrar das aulas de Estatística. Sendo SQR a soma dos quadrados dos resíduos e sua média igual a zero, se nós dividirmos tal expressão pelos seus graus de liberdade, o que teríamos? 購に 噺 鯨芸迎軽 伐 倦 伐 な O que é isso? Não é a variância? Exatamente! Trata-se de uma medida não tendenciosa da variância dos erros. Portanto, o quadrado médio dos resíduos iguala a variância dos erros. O mesmo pode ser dito com relação ao coeficiente SQE/k, haja vista o mesmo medir também uma variância, mas a variância explicada. Bom, nós já temos a variância dos erros e a variância explicada pela regressão, dada por 鯨芸継倦 , portanto cabe questionar: será que a esta regressão faz sentido? Não entendeu? Vamos lá. Nós poderíamos encontrar uma regressão na qual os quadrados médios dos resíduos (variância dos erros) representam a maior parte da variabilidade da regressão, invalidando a representatividade da regressão como um processo que poderia ter gerado aquelas variáveis explicadas. Assim, a parte que se Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 32 de 130 constitui como uma reta (bx) só explicou alguma parte da variável explicada “por coincidência”, isto é, sem significância estatística. Como nós podemos verificar isso? Por meio do teste F. O teste F é um teste estatístico que visa comparar variâncias e se a diferença entre ambas é estatisticamente significante. Analiticamente, sob a hipótese nula, o quociente entre dois quadrados médios, isso é, entre duas variâncias, segue uma distribuição F. A título de ilustração vamos nos utilizar da tabela ANOVA que nós construímos. Portanto: 繋倦┸軽伐倦伐な 噺 鯨芸継倦鯨芸迎軽 伐 倦 伐 な Sob a hipótese nula de que estas duas variâncias são iguais, a estatística de teste segue uma distribuição F com k graus de liberdade no numerador e N - k – 1 graus de liberdade no denominador. O que você está buscando? Bom, quando você estima uma regressão, você busca encontrar uma relação estatisticamente significante que explique o fenômeno que está em estudo. Assim, se você concluir que não há como rejeitar a hipótese nula de que a variância explicada pela sua regressão é igual à variância dos resíduos, na verdade, você não encontrou nada! Isso deriva do fato de que, se isso aconteceu, é muito provável que toda parcela que você conseguiu explicar da variável dependente foi por acaso, o que deve ter acontecido somente em virtude da variação dos erros e não de uma especificação correta de uma reta. Ou seja, toda sua regressão não tem grande validade em termos de explicar a dinâmica da variável dependente em estudo. Portanto, o teste F aplicado ao estudo de regressão é equivalente a um teste de hipóteses conjunto de que todos, ou parte de todos, os coeficientes têm valor igual a zero. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 33 de 130 Antes de encerrarmos o assunto sobre o teste F, temos de ressaltar uma coisa importante. A teoria estatística por detrás da derivação do teste exige que a variável y seja normalmente distribuída. Todo mundo se lembra da distribuição normal das aulas de estatística, certo? Trata- se de uma distribuição de probabilidade, que associa determinado valor a determinada probabilidade da seguinte forma: Já que y é composto de uma parte fixa (reta) e de uma parte aleatória (erro), a variância da variável explicada é igual à variância do erro. Assim, a hipótese de normalidade de y é equivalente a se afirmar que o erro tem de ser normalmente distribuído. Portanto, esta será nossa segunda hipótese sobre o modelo de regressão. Umexercício para testar o seu conhecimento. 2º Hipótese sobre o modelo de regressão Os erros são normalmente distribuídos Alessandra Máquina de escrever 25/04/2019 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 34 de 130 Exercício 3. (FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples. Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa: デ桁件 噺 などど デ隙件 噺 はど デ桁件隙件 噺 はのど デ隙沈態 噺 ねどど デ桁沈態 噺 などぱど Montando o quadro de análise de variância (ANOVA), tem-se que: a) a variação total apresenta um valor de 62,5. b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80. c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²). d) o valor da estatística F necessária para o teste da existência da regressão é igual ao quociente da divisão da variação explicada pela variação residual. e) a variação residual apresenta um valor igual a 17,5. Resolução Vamos começar definindo SQT, SQE e SQR: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 35 de 130 鯨芸劇 噺 デ桁沈態 伐 岫デ桁沈岻態など 噺 などぱど 伐 などどど 噺 ぱど 鯨芸継 噺 デ岫決捲葡沈岻態 噺 決態 茅 デ捲葡沈態 噺 な┸のはにの 茅 ねど 噺 はに┸の 鯨芸迎 噺 鯨芸劇 伐 鯨芸継 噺 ぱど 伐 はに┸の 噺 なば┸の Assim, chega-se ao gabarito (e). Sabe-se que a alternativa (c) está incorreta porque o R² surge da divisão da variação explicada pela total, enquanto que a alternativa (d) advém da divisão dos quadrados médios explicados e dos resíduos e não somente da variação. 8. Teste de hipóteses sobre os coeficientes Na última seção nós vimos como o teste F avalia a hipótese conjunta de que todos os coeficientes têm valor igual a zero. Agora vamos avaliar a significância estatística dos coeficientes, um por um. Com efeito, vamos avaliar a significância estatística de b isoladamente, tal como na equação (2) - “Peraí professor, mas você acabou de ensinar a aplicação do teste F na regressão simples e disse que ele avalia a hipótese nula de que todos os coeficientes são iguais a zero, ou seja, b é igual a zero. Então qual a diferença deste teste de hipóteses para o teste F?” Se você pensou isso, parabéns! Já está a caminho de passar em concurso. Pois é, realmente, no caso da regressão linear simples não há diferença. Mas, a regressão simples não é a única forma de regressão possível. Existe o caso da regressão múltipla, que, no caso, depende de mais de um x. Por exemplo: 検件 噺 欠 髪 決な捲な 髪 決に捲に 髪 橋 決券捲券 髪 結件 Assim, por exemplo, as vendas de uma empresa podem ser função não somente dos gastos em propaganda, mas também do investimento em treinamento de pessoal, da Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 36 de 130 parcela do mercado dominada por ela, etc. Este é um caso de Regressão Linear Múltipla. Neste caso, é fácil perceber que o resultado do teste F não é equivalente ao encontrado nos testes de hipótese sobre b. O teste de hipóteses sobre os coeficientes analisa a significância estatística de cada coeficiente isoladamente, enquanto que o teste F analisa a significância estatística conjunta de todos os coeficientes ao mesmo tempo. Então meus amigos, agora que vocês entenderam o porquê do teste de hipóteses, além do teste F, vamos entender como operacionalizá-lo. A idéia básica do teste de hipóteses é afirmar se a ocorrência de um evento tem uma probabilidade estatística significante, dado um valor de significância, ou seja, um valor que seria considerado “muita coincidência”. Vamos para um exemplo prático de nossa aula. Com base na nossa amostra e na regressão estimada, será que os gastos em propaganda realmente afetam as vendas da empresa? Isso seria equivalente a estipular duas hipóteses, uma hipótese nula 岫茎ど岻 e outra alternativa 岫茎な岻 de tal forma que: 茎ど┺ 決 噺 ど 茎な┺ 決 塙 ど A estatística de teste deve ser calculada da seguinte forma: 建 噺 決 伐 ど嫌 Alessandra Destacar Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 37 de 130 Sendo s o valor estimado para o desvio padrão do parâmetro, que, por se tratar de uma amostra, é desconhecida.2 A estimativa para a variância de b é dada por: Ao calcular a estatística de teste, cabe compará-la com o valor tabelado da distribuição t de Student, distribuição esta que é utilizada para os casos em que a variância populacional não é conhecida. Assim, é preciso fazer o cálculo acima e consultar tabela t com N-k-1 graus de liberdade e com a significância estatística que você achar conveniente.3 Olhe o gráfico abaixo. Caso o valor calculado seja inferior ao valor tabelado, isto significa que não é possível rejeitar a hipótese nula de que o coeficiente da reta é igual a zero, situando-se dentro da área branca do gráfico acima. Olha pessoal, o que se está dizendo com isso é que, 2 Lembrem-se, o desvio padrão é igual à raiz quadrada da variância. 3 A consulta na tabela irá depender dos graus de liberdade dos quadrados médios dos resíduos e da significância estatística que o pesquisador achar relevante, como 5%, por exemplo, o que se escreve como t(N-k-1, 5%). 嫌に 噺 鯨芸迎軽 伐 倦 伐 なデ岫捲葡件岻に Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 38 de 130 dado um valor considerado improvável (área cinza), a estatística nos permite dizer se este valor está dentro destes padrões esperados. Caso o valor calculado supere o valor tabelado (área cinza gráfico), rejeita-se a hipótese nula de que o coeficiente é igual a zero. Ou seja, como aquele “cantinho” é improvável no caso de a hipótese nula ser verdadeira e como a estatística de teste nos diz que o valor encontrado está lá, a hipótese nula deve estar errada. Entenderam? A idéia básica deste teste de hipóteses sobre os parâmetros da regressão é avaliar se estes últimos apresentam significância estatística. Se o teste de hipóteses indicar que o parâmetro da equação (2) tem valor igual a zero, deve-se pensar em outra forma funcional, com outra(s) variável(is) explicativa(s), para explicar a variável y. Em outras palavras, uma conclusão deste tipo indica que os gastos em propaganda não afetam as vendas, devendo-se excluir tal variável. Uma coisinha: tal como no caso do teste F, a avaliação destes coeficientes por meio de testes de hipóteses exige que os erros sejam normalmente distribuídos. 9. Eficiência do estimador de Mínimos Quadrados Ordinários (MQO) Vamos lá, lembram-se das 2 hipóteses que dissemos ser necessárias para a atividade de análise de regressão? Então, vamos lá! As hipóteses do modelo de regressão linear já estipuladas são: 1º Hipótese sobre o modelo de regressão linear 継岫綱沈岻 噺 ど 2º Hipótese sobre o modelo de regressãolinear Os erros são normalmente distribuídos Alessandra Destacar Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 39 de 130 Veja, tudo que nós discutimos na seção anterior tem a ver com o estimador MQO. Uma característica importante para um estimador é a sua ausência de viés. Quando eu digo “viés” é exatamente isso que vocês estão pensando. Ao afirmar que a opinião de uma pessoa sobre determinado assunto é “enviesada”, você está dizendo que ela está se distanciando dos fatos da realidade e “puxando a sardinha” para uma determinada conclusão. Se eu digo para vocês que um estimador não é viesado, eu estou dizendo que, na média, ele “acerta”, ou seja, dá o valor real do parâmetro. Vou repetir um pouquinho da seção anterior, só para vocês lembrarem. Um exemplo para vocês entenderem, suponha um fenômeno que se comporte conforme a regressão múltipla abaixo: 検件 噺 糠 髪 紅な捲な 髪 紅に捲に 髪 橋 紅券捲券 髪 結件 Esta equação pode representar o fenômeno de vendas de uma empresa (y) explicadas pelo seu gasto com propaganda (捲) por cada uma de suas filiais (件). Porém, dado que nós só temos uma amostra dos dados que compõem esta relação, nós iremos estimar esta reta por meio de MQO, tal como na seção anterior, o que nos levará à seguinte relação: 検件 噺 欠 髪 決な捲な 髪 決に捲に 髪 橋 決券捲券 髪 結件 Perceba que 欠 e 決 são as estimativas de 糠 e 紅 para uma dada amostra de dados da população. Algo intuitivo, mas que é importante destacar é que b mede a alteração em y para uma dada variação em x, mantido tudo mais constante, ou como os economistas chamam coeteris paribus. Agora, a pergunta é: será que, na média, estes estimadores se aproximam do valor real do parâmetro? Pronto, agora você vai entender o que é viés de um estimador. Meus amigos, 決 será não viesado se: 撮岫産岻 噺 試 Alessandra Destacar Alessandra Destacar Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 40 de 130 Isto quer dizer, a “esperança do estimador é igual ao seu correspondente parâmetro populacional”. Só para lembrá-los das aulas de Estatística, quando você falar em esperança de uma variável, tire a sua média e pronto! Vocês não precisam saber mais do que isso para sua prova. Bom, falamos um monte para chegarmos à seguinte pergunta: quais as condições necessárias para que o estimador de MQO seja não viesado? A resposta para esta pergunta depende de uma demonstração matemática que se utiliza do operador esperança. -“Professor, esta demonstração cai na prova?” Quem pensou assim é um verdadeiro concurseiro, com meio caminho andado para sua aprovação. Você tem que ser objetivo e focar em resultados e não em perfumarias. Se você gostar muito de Estatística e quiser aprender isso, passe no concurso e vá fazer um Mestrado ou Doutorado depois, agora, pense no concurso. Mas, quem quiser dar uma olhada na demonstração, dê uma olhada no livro do meu orientador de doutorado, Rodolfo Hoffmann, “Análise de Regressão: uma introdução à Econometria”. Então, vamos direto ao ponto. Para garantir o não viés de um estimador de uma regressão linear, assuma a 1ª “hipótese” do modelo de regressão linear e acrescente: 3º Hipótese sobre o modelo de regressão linear 継岫綱沈捲沈岻 噺 ど Ou seja, os 捲沈 não são correlacionados com os erros Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 41 de 130 Obs. Pessoal, eu já vi autores dizendo por aí que a normalidade dos erros é condição necessária para que o estimador MQO seja não viesado. Cuidado! No caso da ESAF, a mesma considera que tal hipótese não é necessária. De acordo com as provas da banca, podemos perceber que eles consideram que a não normalidade dos erros só afeta os testes de hipóteses. O que nós estamos dizendo aqui? Vejamos, vamos ao exemplo dos gastos em propaganda. Os erros na equação original poderiam representar a fatia de mercado já dominada pela empresa. Se os gastos em propaganda forem uma parcela fixa do total que a empresa vende, estes gastos seriam cada vez maiores quanto maiores fossem as vendas. Neste sentido, o que poderia estar afetando as vendas seria a fatia de mercado já dominada pela empresa e não os gastos em propaganda. Assim, o efeito b encontrado para os gastos em propaganda poderia estar contaminado e ser espúrio (isso é, não representar nada), dado que quanto maior a fatia de mercado, maior seriam os gastos em propaganda e, por conseqüência do aumento na fatia de mercado e não dos gastos em propaganda, maiores seriam as vendas. Assim, aquelas 2 condições são necessárias para se concluir que o estimador MQO seja não viesado. Bom, mas isso não basta para provar que um estimador é eficiente. - “Professor, o que é um estimador eficiente?” É aquele que possui a menor a menor variância dentre todos os estimadores lineares não viesados. O que é bastante óbvio, dado que se seu estimador é não viesado, o que você busca é que o mesmo possua variância mínima, de modo a se aproximar ao máximo do parâmetro populacional. Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 42 de 130 Você garante que um estimador é o melhor estimador linear não viesado, ou, como é conhecido na literatura especializada, BLUE (best linear unbiased estimator) por meio da satisfação das condições do Teorema de Gauss Markov. Novamente, vocês não têm que saber como derivar tal teorema (no livro do Prof. Hoffmann você também encontra tal demonstração), então vamos direto ao que interessa. As pressuposições são as mesmas necessárias para garantir o não viés e mais estas duas: Pessoal, todas estas hipóteses e suas violações não precisam ser aprofundadas para sua prova, apenas decore! Só para explicar melhor, no caso da 4ª hipótese, o que se quer é garantir que os erros tem variância constante ao longo da amostra. Por exemplo, pode-se encontrar um erro que se comporte de tal forma que: 撃欠堅岫綱沈岻 噺 購 ゲ 捲沈 Se isso ocorrer, você concorda que a variância será função do valor da variável explicativa e, portanto, não constante? Se isso ocorrer, surgirão problemas na análise de regressão, conforme será discutido mais adiante. Quando a variância dos erros não é constante, chamamos a este problema de heterocedasticidade. Quanto à 5ª hipótese, espera-se que os erros do período presente não guardem relação com os erros do período passado. Com efeito, os erros observados nas estimativas MQO no período t não podem influenciar os erros de estimativa no período t+1. Para entender melhor, substitua t por um determinado ano, 2010, por 4ª hipótese sobre o modelo de regressão linear: 撃欠堅岫綱沈岻 噺 購態 噺 潔剣券嫌建欠券建結 5ª hipótese sobre o modelo de regressão linear: 継盤綱沈綱珍匪 噺 ど┸ 件 塙 倹 Ou seja, os erros não são autocorrelacionados. Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 43 de 130 exemplo, e pense sobre isso. Caso isso não ocorra, dizemos queo modelo possui autocorrelação. Vocês lembram de que eu disse que, por enquanto, estamos trabalhando com dados em cortes transversais, ou seja, com observações para diferentes unidades no mesmo período de tempo (como no caso dos gastos com propaganda, que avaliamos diferentes empresas em um único ponto do tempo, um ano, por exemplo)? Então, a hipótese 5ª, na maior parte dos casos, só é violada quando estamos trabalhando com séries de tempo, ou seja, observações para uma mesma unidade em diferentes períodos do tempo (seria o equivalente a avaliar a questão dos gastos com propaganda em uma única empresa, mas ao longo do tempo). Então, se estas hipóteses estiverem valendo, você pode dizer que sua Regressão Linear Simples é BLUE. Ufa! Falamos para burro ao longo deste curso, portanto chega de conversa e vamos fazer exercícios. Alessandra Destacar Alessandra Destacar Alessandra Destacar Alessandra Destacar Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 44 de 130 Exercício 4 (SUSEP 2010 – Atuária) A partir de uma amostra aleatória [x(1), y(1)], [x(2), y(2)]...[x(20), y(20)] foram obtidas as estatísticas: Média de X = 12,5 Média de Y = 19 Variância de X = 30 Variância de Y = 54 Covariância entre X e Y = 36 Calcule a reta de regressão estimada de Y contra X. a) Y = 19 + 0,667*X b) Y = 12,5 + 1,2*X c) Y = 4 + 1,2 X d) Y = 19 + 1,2 X e) Y = 80 + 22,8X Resolução Vamos lá! 紅 噺 系剣懸岫捲┸ 検岻撃欠堅岫捲岻 噺 ぬはぬど 噺 な┸に Com base neste resultado: 糠 噺 検博 伐 紅捲違 噺 なひ 伐 岫な┸に岻 ゲ 岫なに┸の岻 噺 ね Assim: 検 噺 ね 髪 な┸に ゲ 捲 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 45 de 130 Exercício 5 (SUSEP 2010 – Atuária) Com os dados da questão anterior, determine o valor da estatística F para testar a hipótese nula de que o coeficiente angular da reta do modelo de regressão linear simples de Y contra X é igual a zero. a) 144 b) 18 c) 36 d) 72 e) 48 Resolução Bom, essa é complicada. Agora vamos ter que para pensar um pouquinho. Vamos nos relembrar de como é calculada a estatística F: 繋倦┸軽伐倦伐な 噺 鯨芸継倦鯨芸迎軽 伐 倦 伐 な Se nós dividirmos o numerador e o denominador pelo mesmo número, o total da fração permanece a mesma. Assim, vamos dividir os dois membros por SQT: 繋倦┸軽伐倦伐な 糾 磐鯨芸劇鯨芸劇卑 噺 岾 鯨芸継鯨芸劇峇倦岾鯨芸迎鯨芸劇峇軽 伐 倦 伐 な 噺 岫迎ふ岻倦岫な 伐 迎ふ岻軽 伐 倦 伐 な Viram? Esta é uma forma muito importante de se definir o cálculo do R². Decorem! Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 46 de 130 Com base nas variâncias de x e y e na estimativa do parâmetro b, é possível encontrar o R². Vejamos: 迎ふ 噺 鯨芸継鯨芸劇 噺 デ岫決捲葡沈岻態デ岫検葡沈岻態 噺 決ふデ岫捲葡沈岻態デ岫検葡沈岻態 O que pode ser obtido pela seguinte propriedade estatística: 撃欠堅岫欠 ゲ 捲岻 噺 欠ふ撃欠堅岫捲岻 Se 欠 噺 潔剣券嫌建欠券建結. Pense comigo, vamos explicitar a função em termos das variáveis centradas na média: 迎ふ 噺 決ふデ岫捲葡沈岻態デ岫検葡沈岻態 噺 決ふ岫捲沈 伐 捲違岻態岫検沈 伐 検博岻態 O que acontece se nós dividirmos o numerador e o denominador por (N-1), sendo N o número de observações da regressão (deixando o resultado final inalterado)? É isso! Você terá a variância de x e y, pois (N-1)é o número de graus de liberdade da variância destas variáveis. Assim: 迎ふ 噺 決ふ 岫捲沈 伐 捲違岻態軽 伐 な岫検沈 伐 検博岻態軽 伐 な 噺 産ふ惨珊司岫姉岻惨珊司岫姿岻 Decore isso! Agora é fácil: 迎態 噺 岫な┸に岻態 磐ぬどのね卑 噺 ど┸ぱ な 伐 迎ふ 噺 ど┸に Calculando a estatística F, chega-se a: 繋 噺 ど┸ぱなど┸になぱ 噺 ばに Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 47 de 130 Exercício 6 (ESAF – AFRFB 2009) Na análise de regressão linear simples, as estimativas e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra de n pares de valores com (i = 1, 2,....,n), obtendo-se: , onde é a estimativa de . Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado por - entre a reta de regressão e sua estimativa . Sabe- se que o Método de Mínimos Quadrados consiste em adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por: a) b) c) d) e) Resolução Pessoal, o que faz o método do MQO? Isso mesmo! Ele minimiza a soma dos quadrados dos resíduos. Portanto, é fácil perceber que a expressão que mostra isso, dada a notação usada na questão, é: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 48 de 130 デ範桟餐 伐 盤詩赴 髪 試撫散餐匪飯匝 噺 鮮盤桟餐 伐 桟撫餐匪 O gabarito é (a), mas está incorreto, pois deveria haver um sinal de “+” antes de 試. Portanto, foi anulada. Poderia ser a (b), mas não foi considerado. Exercício 7 (EPE – ECONOMIA DA ENERGIA/2007) Qual das afirmações abaixo faz referência correta ao modelo de regressão linear simples? a) Toda regressão apresenta heterocedasticidade b) Se a variância dos erros é constante, os dados são homocedásticos c) O intercepto g representa a inclinação da reta d) Os erros do modelo não são aleatórios, com esperança igual a 1 e) A constante g é sempre positiva Resolução Essa é bem fácil. A alternativa (b) é a definição de homocedasticidade. Só para destacar, g, o intercepto, não é a inclinação da reta, mas somente o valor no qual a reta tangencia o eixo vertical. A inclinação é dada por く. Exercício 8 (ESAF – ATRFB/2009) O modelo de Regressão Linear Múltipla Y = g + くX + そZ + i é ajustado às observações (Y, X, Z) que constituem uma amostra aleatória simples de tamanho 23. Considerando que o coeficiente de determinação foi R² = 0,80, obtenha o valor mais próximo da estatística F para testar a hipótese nula de não existência da regressão: a) 84 b) 44 c) 40 d) 42 e) 80 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 49 de 130 Resolução Vamos aplicar a fórmula do teste F: 繋 噺 迎ふ倦な 伐 迎ふ券 伐 倦 伐 な 噺 ど┸ぱにど┸ににど 噺 ねど Alternativa (c). (ANPEC – 2010) Julgue as afirmativas Exercício 9 Os estimadores de MQO são eficientes, mesmo se os erros não forem normalmente distribuídos. Resolução Verdadeira! Como eu disse, controvérsias à parte, mesmo que os erros não sejam normalmente distribuídos, a eficiência do estimador não é afetada. Exercício 10 Sob heterocedasticidade os estimadores de MQO são viesados. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 50 de 130 Resolução Incorreta. Conforme vimos, a homocedasticidade é hipótese necessária para garantir eficiência e confiabilidade nos testes de hipóteses, não afetando o viés. Exercício 11 Sob autocorrelação o estimador de MQO não é mais eficiente. Resolução Perfeito. Esta é uma das condições necessárias impostas pelo Teorema de Gauss- Markov, que demonstra que o estimador MQO é BLUE. (ANAC – NCE/2007 – ADAPTADA) Considerando o modelo abaixo, estimado pelo método de mínimos quadrados ordinários,com uma amostra de 300 observações, com: R²= 0,39 P = 30,0 + 20,0Q + 10,0V + u (3,0) (2,2) (0,9) P é o preço de venda dos apartamentos em uma determinada cidade (em mil reais), Q o número de quartos do apartamento, V o número de varandas, u o erro e os valores entre parêntesis são os desvios-padrão dos coeficientes estimados. Com base nisso, julgue os itens a seguir. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 51 de 130 Questão 12 O preço esperado de um apartamento com 2 quartos e uma varanda será maior que R$ 80.000, pois não conhecemos o valor esperado de u. Resolução Pessoal, substituam: 撮岫皿岻 噺 惣宋 髪 匝宋 ゲ 匝 髪 層宋 ゲ 層 噺 掻宋 O preço não é maior que 80. Alternativa falsa. Questão 13 Segundo o coeficiente de determinação, mais da metade da variação dos preços dos apartamentos pode ser explicada. Resolução Gente, a alternativa está falando do R². No caso, ele é de 39%, portanto não explica mais da metade da variação dos preços. Alternativa Falsa. Questão 14 Através da observação do valor do R2, podemos concluir que a regressão é estatisticamente não-significante. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 52 de 130 Resolução Já discutimos isso. O R² é tão somente um coeficiente de determinação e não nos diz nada sobre a significância de uma regressão. Isso é para o teste F. Alternativa falsa. Exercício 15 (AFRFB – ESAF/2013) A expectância de uma variável aleatória x ⦆ média ou esperança matemática como também é chamada ⦆ é igual a 2, ou seja: E(x) = 2. Sabendo-se que a média dos quadrados de x é igual a 9, então os valores da variância e do coeficiente de variação de x são, respectivamente, iguais a: a) b) c) d) e) Resolução Para resolvermos esta questão precisamos nos lembrar de que: 撃欠堅件�券潔件欠 噺 兼é穴件欠 穴剣嫌 圏憲欠穴堅欠穴剣嫌 伐 圏憲欠穴堅欠穴剣 穴欠 兼é穴件欠 噺 継岫捲態岻 伐 岷継岫捲岻峅ふ Assim: 撃欠堅岫捲岻 噺 ひ 伐 岫に岻態 噺 捜 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 53 de 130 Agora, fica fácil achar o coeficiente de variação: 系撃 噺 紐撃欠堅岫捲岻継岫捲岻 噺 ヂ捜匝 Alternativa (a) Exercício 16 (AFRFB – ESAF/2013) Um modelo de regressão linear múltipla foi estimado pelo método de Mínimos Quadrados, obtendo-se, com um nível de confiança de 95%, os seguintes resultados: I. ┪ = 10 + 2,5*x1 + 0,3*x2 + 2*x3 II. o coeficiente de determinação R2 é igual a 0,9532 III. o valor-p = 0,003 Desse modo, pode-se afirmar que: a) se a variável x1 for acrescida de uma unidade, então Y terá um acréscimo de 2,5 %. b) 0,003 é o mais baixo nível de significância ao qual a hipótese nula pode ser rejeitada. c) x3 explica 95,32% das variações de Y em torno de sua média. d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II são, respectivamente, iguais a 5% e 95%. e) se no teste de hipóteses individual para く2 se rejeitar a hipótese nula (H0), então tem-se fortes razões para acreditar que x2 não explica Y. Resolução Vamos analisar uma a uma: A – se a variável x1 for acrescida em uma unidade Y aumentará em 2,5, não em percentual. B – Perfeito, esta é a definição de p-valor. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 54 de 130 C – O R² não é ó para x3, mas para a regressão toda. D – Alternativa sem sentido E – Errado, a rejeição da hipótese nula indica a significância do respectivo coeficiente. Exercício 17 (FINEP – CESGRANRIO/2011) O modelo de regressão linear Y = gX + erro, onde (X, Y) são pares de dados observados e g é um parâmetro a ser estimado, foi ajustado aos dados (X, Y) mostrados na figura abaixo. Foi usada a técnica de minimizar a soma dos erros quadráticos para ajustar a reta de regressão, a qual a) passa por (散拍┸ 桟拍), onde 散拍 e 桟拍 são as médias de X e de Y. b) passa pela origem (0, 0). c) não é a única reta que minimiza a soma dos erros quadráticos. d) tem variância esperada nula. e) tem coeficiente angular necessariamente negativo. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 55 de 130 Resolução Vamos analisar cada uma das alternativas: A – Deveria estar certa! Vamos discutir isso abaixo. B – Correto. Devido ao fato de o modelo ser dado por 桁 噺 糠隙 髪 結堅堅剣, não há intercepto, portanto, quando 隙 噺 ど, 桁 será igual à zero também. C – Errado, estamos estudando o caso em que só há uma reta que minimiza a soma dos quadrados dos erros. D – Nada garante isso. E – O coeficiente angular tem o mesmo sinal da associação entre as variáveis, então, no presente caso, o mesmo é positivo. Olhe no gráfico! Pessoal, uma das propriedades da regressão linear é que ela passa pelo ponto composto pelos valores médios de X e Y, no caso de uma regressão de Y contra X. Ou seja, essa é uma propriedade verdadeira, o que torna a alternativa correta! Mas, a banca não considerou! Exercício 18 (FINEP – CESGRANRIO/2011) Se o coeficiente de correlação entre duas variáveis X e Y for nulo, então a(s) a) covariância entre X e Y é nula. b) média de X é nula. c) média de Y é nula. d) médias de X e Y são iguais. e) variâncias de X e de Y são não correlacionadas. Resolução Essa é muito fácil! Lembre-se da fórmula do coeficiente de correlação: 貢掴┸槻 噺 系剣懸岫捲┸ 検岻穴喧岫捲岻 糾 穴喧岫検岻 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 56 de 130 Portanto, quando a correlação for nula, a covariância também o será. Alternativa (a). Exercício 19 (TRT 19ª região – FCC\2014 - modificada) Sejam duas variáveis X e Y representando os salários dos empregados nas empresas Alfa e Beta, respectivamente, com 100 empregados cada uma. Em um censo realizado nas duas empresas apurou-se que a média, em milhares de reais, de X foi igual a 2,5 e a média de Y foi igual a 3,2. A soma dos valores dos quadrados, em (R$ 1.000,00)², de todos os valores de X foi igual a 650 e de todos os valores de Y foi igual a 1.047,04. Assim, o coeficiente de variação de: a) X é igual a 10% e o de Y igual a 20%. b) X é igual a 20% e o de Y igual a 15%. c) X é igual ao coeficiente de variação de Y. d) Y é igual à metade do coeficiente de variação de X. e) Y não é menor que o coeficiente de variação de X. Resolução Bom, o coeficiente de variação (cv) tem a seguinte fórmula: 潔懸 噺 穴結嫌懸件剣 喧欠穴堅ã剣兼é穴件欠 噺 購隙博 A média nós já temos, portanto temos que calcular a variância com base na seguinte fórmula: 撃欠堅件�券潔件欠 噺 兼é穴件欠 穴剣嫌 圏憲欠穴堅欠穴剣嫌 伐 圏憲欠穴堅欠穴剣 穴欠 兼é穴件欠 Vamos encontrar a variância para X e Y: 撃欠堅件欠券潔件欠 隙 噺 はのどなどど 伐 岫に┸の岻態 噺 は┸の 伐 は┸にの 噺 宋┸ 匝捜 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 57 de 130 撃欠堅件欠券潔件欠 桁 噺 などねば┸どねなどど 伐 岫ぬ┸に岻態 噺 など┸ねばどね 伐 など┸にね 噺 宋┸ 匝惣宋想 Assim, os coeficientes de variação são: 潔懸岫隙岻 噺 紐ど┸にのに┸の 噺 ど┸のに┸の 噺 ど┸に 潔懸岫桁岻 噺 ヂど┸にぬどねぬ┸に 噺 ど┸ねぱぬ┸に 噺 ど┸なの Esta última conta é meio complicada, mas não tem jeito! A melhor forma de encontrar a resposta é utilizar 紐ど┸にの. Como os númerossão bem próximos, você consegue perceber que o coeficiente de variação de Y será menor do que o de X, eliminando a maior parte das alternativas. A alternativa (d), também não seria possível, pois cv(Y) não chegaria a ser metade do de X. Alternativa (b). Exercício 20 (SEFAZ-SP – 2013/FCC) Considere: I. O coeficiente de variação de uma variável é uma medida de dispersão absoluta que é o resultado da divisão entre a média e o desvio padrão da variável em questão. II. Um dispositivo útil quando se deseja verificar se existe correlação linear entre duas variáveis é o gráfico de colunas justapostas. III. O desvio padrão é mais apropriado do que o coeficiente de variação quando se deseja comparar a variabilidade de duas variáveis. IV. Na amostragem aleatória estratificada, a população é dividida em estratos, usualmente, de acordo com os valores ou categorias de uma variável, e, depois, uma amostragem aleatória simples é utilizada na seleção de uma amostra de cada estrato. Está correto o que se afirma APENAS em a) I. b) II. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 58 de 130 c) III. d) I e IV. e) IV. Resolução Vamos analisar cada item: I.O conceito está incorreto, o conceito de coeficiente de variação é uma medida de dispersão relativa, que decorre da divisão do desvio padrão pela média e não o contrário. II.Essa utilização gráfica não é adequada para encontrar correlação linear, há vários métodos, conforme descritos na aula de correlação e regressão. III.O coeficiente de variação permite uma comparação mais adequada entre as dispersões de duas variáveis diferentes, essa é sua principal utilidade! IV.Definição perfeita. Alternativa (e). Exercício 21 (TRT 12ª – FCC\2013) Um modelo de regressão linear múltipla, com intercepto, consiste de uma variável dependente, 3 variáveis explicativas e com base em 12 observações. As estimativas dos parâmetros do modelo foram obtidas pelo método dos mínimos quadrados e o valor encontrado da estatística F (F calculado) utilizado para testar a existência da regressão foi igual a 14. O coeficiente de explicação (R2), definido como sendo o resultado da divisão da variação explicada pela variação total, é, em %, igual a a) 80,0. b) 76,8. c) 78,0. d) 72,0. e) 84,0. Resolução Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 59 de 130 Vamos inverter um raciocínio que já fizemos a fim de encontrar o R²! Veja a fórmula que já usamos: 繋 噺 迎ふ倦な 伐 迎ふ券 伐 倦 伐 な Agora, a nossa incógnita é o R²! A quantidade de observações é 12, há 3 variáveis explicativas e o F calculado é de 14. Assim: なね 噺 迎ふぬな 伐 迎ふなに 伐 ぬ 伐 な 蝦 なね 噺 迎ふぬな 伐 迎ふぱ Vamos multiplicar invertido: なね 抜 峭な 伐 迎ふぱ 嶌 噺 迎ふぬ 蝦 なね 伐 なね迎ふぱ 噺 迎態ぬ Multiplicando invertido novamente: 岫なね 伐 なね迎ふ岻 抜 ぬ 噺 ぱ迎ふ 蝦 ねに 伐 ねに迎態 噺 ぱ迎態 蝦 迎態 噺 ねにのど 噺 ど┸ぱね 噺 ぱねガ Alternativa (e). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 60 de 130 Exercício 22 (SUDECO – FUNCAB\2013\alterada) Utilizando dados regionais para um período de 18 anos, os analistas de uma agência de desenvolvimento estimaram a seguinte equação de regressão relacionando poupança e renda onde Y é a poupança no ano t, X é a renda no ano t, D é uma dummy que separa os anos em dois subperíodos e os valores entre parênteses são os p-valores dos coeficientes. Considerando esses dados, pode-se afirmar que: A) nenhum coeficiente é significativo. B) a dummy de intercepto não é significativa. C) a variável X é significativa. D) o produto DX é significativo. E) todos os coeficientes são significativos Resolução Pessoal, vocês nem precisam saber o que é uma variável dummy para responder esta questão. Só para vocês saberem, variável dummy é uma binária, ou seja, só assume valores iguais a 1 ou zero, ok? Ela é muito utilizada para incorporar aspectos qualitativos, já que 1 pode significar “sim” e 0 “não”. Por exemplo, no caso em comento, quando a dummy assume valor igual a 1, define-se que as variáveis estão relacionados a um determinado período. Mas, você não precisa saber isso. Os estatísticos costumam considerar vários níveis de significância, mas, em geral, valores de p-valor superiores a 0,10 (10%) tendem a Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 61 de 130 ser considerados sem significância estatística. Assim, a única variável significativa é a variável X. Alternativa (c). Exercício 23 (SEDAM – FUNCAB\2014) Resolução Se os resíduos são iguais a zero isso significa que a soma dos quadrados dos resíduos também será, ou seja, a soma dos quadrados explicados é igual a soma dos quadrados totais: 鯨芸継 噺 鯨芸劇 蝦 迎ふ 噺 鯨芸継鯨芸劇 噺 な Alternativa (c). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 62 de 130 Exercício 24 (SEDAM – FUNCAB\2014) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 63 de 130 Resolução Isso demanda que vocês lembrem-se um pouquinho do seu 2º grau. Bom, em primeiro lugar, percebemos que, quanto maior o X, maior o Y, portanto, não é alternativa (a) nem (e), pois estas não explicam Y com X. No caso da (c) e da (d), percebemos pelo gráfico que a relação entre ambas as variáveis parece ser linear, ou seja, representada por uma reta. No caso destas alternativas, a figura seria algo mais ou menos assim: Assim, é o “feijão com arroz” mesmo. Alternativa (b). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 64 de 130 Exercício 25 (SEDAM – FUNCAB\2014) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 65 de 130 Resolução Você percebe pelo gráfico que, quanto maior o valor de Y, aumenta a variância dos resíduos, o que pode ser percebido pelo fato de que os mesmo ficam “mais espalhados” com o aumento de Y. Esse é um problema estatístico chamado heterocedasticidade, o que podemos depreender desta gráfico é que os mesmos têm um comportamento heterogêneo, pois a sua variância tende a ser maior quanto maior Y. Alternativa (e). Exercício 26 (SESAU – FUNCAB\2009\alterada) A partir de uma tabela de analise da variância, podemos obter uma estatística que representa a proporção de variação explicada pelo modelo. Como se chama esta estatística? A) Soma de quadrados dos erros; B) Fonte de variação; C) Soma dos Quadrados Explicados; D) Soma de quadrados dos resíduos; E) Graus de liberdade. Resolução Questão extremamente fácil. Trata-se da soma dos quadrados explicados. Alternativa (c). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br66 de 130 Exercício 27 (SESAU – FUNCAB\2009\alterada) A tabela a seguir apresenta, parcialmente, os resultados de um determinado teste de analise de variância. Fonte de variação SQ GL QM F Valor-p SQE 10897,09 11 990,65 183,7 0 SQR 485,35 x 5,393 SQT 11382,44 y O valor de y é: A) 102; B) 90; C) 101; D) 91; E) 95. Resolução Primeira coisa a fazer é encontrar o x. Nós sabemos que o valor do quadrado médio é igual a soma dos quadrados divida pelos seus graus de liberdade. Assim: 芸警 噺 鯨芸迎罫詣 蝦 罫詣 噺 捲 噺 ねぱの┸ぬのの┸ぬひぬ 簡 ひど Assim, o GL de SQT é: 罫詣 噺 検 噺 ひど 髪 なな 噺 などな Alternativa (c). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 67 de 130 Exercício 28 Resolução Nós aprendemos essa propriedade na aula 01, lembra-se? “Obs. Relação entre as médias Uma das coisas mais cobradas com relação aos tipos de médias é a relação entre elas no que se refere à magnitude de cada resultado. Pode-se provar que, para um determinado rol de valores: 警é穴件欠 畦堅件建兼é建件潔欠 半 警é穴件欠 罫結剣兼é建堅件潔欠 半 警é穴件欠 茎欠堅兼ô券件潔欠” Alternativa (a). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 68 de 130 Exercício 29 (SEMAD – FUNCAB\2013) A tabela a seguir apresenta o resultado de uma análise de regressão múltipla. Considerando-se qual a opção correta? A) Apenas as variáveis X1 e X3 são significativas e o valor do coeficiente de determinação indica um bom ajuste. B) As variáveis X1 e X2 são significativas e o modelo deve ser outra vez avaliado, retirando a variável X3. C) As variáveis X1, X2 e X3 são significativas e o valor do coeficiente de determinação indica um bom ajuste. D) As variáveis independentes não são significativas. Resolução Questão muito semelhante à questão 22, mas, agora, o exercício te dá o nível de significância que você deve utilizar (0,05=5%). Ou seja, toda variável só será significante se for possível rejeitar a hipótese nula de que ela é igual a zero a 5% de significância. Com base no p-valor das variáveis, percebe-se que a constante e as variáveis X1 e X2 são significantes, mas X3 não. Alternativa (b). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 69 de 130 Exercício 30 (Analista de Controle Interno – FGV/2014) A seguinte amostra de idades foi obtida: 19; 25; 39; 20; 16; 27; 40; 38; 28; 32; 30. Assinale a opção que indica a mediana dessas idades. (A) 27 (B) 28 (C) 29 (D) 30 (E) 31 Resolução Questão simples, basta ordenar: 16;19;20;25;27;28;30;32;38;39;40 Dado que há um número ímpar de elementos, a mediana será o elemento que coincide com o seguinte: 券 髪 なに 噺 なにに 噺 は O sexto elemento é o 28. Alternativa (b). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 70 de 130 Exercício 31 (Analista de Controle Interno – FGV/2014) Uma variável aleatória X é normalmente distribuída com média 12 e variância 4. A probabilidade de que X seja maior do que 10 é igual a (A) 0,3085. (B) 0,3587. (C) 0,6915. (D) 0,8413. (E) 0,9772. Resolução Basta padronizar a variável. Chamando a média amostral de X拍, a média populacional de づ e o desvio padrão de ぴ, tem-se que: 権 噺 隙博 伐 航購 噺 など 伐 なにに 噺 伐な Procure “1,00” na tabela da banca. Este é o z que faz com 84,13% das observações sejam menores do que este valor z. Como a distribuição normal é simétrica, esta também é a probabilidade de que os valore encontrados na amostra sejam maiores do que -1, ou seja, 10. Alternativa (d). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 71 de 130 Exercício 32 (Analista de Controle Interno – FGV/2014) Numa regressão linear simples, obteve-se um coeficiente de correlação igual a 0,78. O coeficiente de determinação é aproximadamente igual a (A) 0,36. (B) 0,48. (C) 0,50. (D) 0,61. (E) 0,69. Resolução Para este exercício, você deveria ter decorado que: 岫潔剣結血件潔件結券建結 穴結 潔剣堅堅結健欠çã剣岻態 噺 潔剣結血件潔件結券建結 穴結 穴結建結堅兼件券欠çã剣岫迎態岻 Assim: ど┸ばぱ態 噺 ど┸はどぱね 簡 ど┸はな Alternativa (d). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 72 de 130 Exercício 33 (ICMS-RJ – FCC\2013) Considere o modelo 姿餐 噺 詩 髪 試餐 髪 蚕餐, i = 1,2,3,... onde: I. yi e xi representam, respectivamente, o tempo de reação a certo estímulo, em segundos, e a idade, em anos, do indivíduo i. II. 詩 e 試 representam os parâmetros desconhecidos do modelo. III. 蚕餐 representa o erro aleatório com as respectivas hipóteses para a regressão linear simples. IV. As estimativas de 詩 e 試 foram obtidas pelo método de mínimos quadrados por meio de 10 observações, utilizando-se as seguintes informações: Nessas condições, a soma de quadrados residuais do modelo é igual a a) 785 b) 810 c) 515 d) 920 e) 460 Resolução Para resolver esta questão precisamos encontrar a estimativa para o parâmetro 紅 do modelo de regressão. Isso será feito por: デ検葡沈捲葡沈 噺 デ隙桁 伐 デ隙デ桁券 デ捲葡沈態 噺 デ隙態 伐 岫デ隙岻態券 デ検葡沈態 噺 デ桁態 伐 岫デ桁岻態券 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 73 de 130 Assim, o estimador será dado por: 紅 噺 デ検葡件捲葡件デ捲葡件に 噺 峙デ隙桁 伐 デ隙デ桁券 峩釆デ隙に 伐 岫デ隙岻に券 挽 噺 岾ねどにどど 伐 ぬどど ゲ などにどなど 峇磐なぬどどど 伐 ぬどどふなど 卑 噺 ひはどどねどどど 噺 に┸ね Assim, a soma dos quadrados explicados: 鯨芸継 噺 デ岫紅捲葡沈岻態 噺 紅態デ岫捲葡沈岻態 噺 に┸ね態 ゲ ねどどど 噺 にぬどねど E a soma dos quadrados totais: デ検葡沈態 噺 デ桁態 伐 岫デ桁岻態券 噺 なにぱどどど 伐 などにどになど 噺 にぬひはど Portanto, a soma dos quadrados dos resíduos é: 鯨芸劇 噺 鯨芸継 髪 鯨芸迎 蝦 にぬひはど 伐 ぬにどねど 噺 傘晒三 噺 操匝宋 Alternativa (d). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 74 de 130 Exercício 34 (ICMS-RJ – FCC\2013) Sabe-se que: I . X é uma variável aleatória com distribuição binomial com média 2p e variância (2p-2p2). II . Y é uma variável aleatória com distribuição binomial com média 5p e variância (5p-5p2). III . A probabilidade de X ser inferior a 2 é igual a 15/16. Nessas condições, a probabilidade de Y ser superior a 3 é igual a a) 3/1024 b) 1/64 c) 5/512 d) 15/1024 e) 7/512 Resolução Eu optei pela resolução mais fácil e rápida desta questão, já que dá para ser mais formal, mas não é o que um concurseiro precisa! Vamos começar com a variável X, nós sabemos que a esperança e a variância de uma distribuição binomial são dadas por: 継岫隙岻 噺 券喧 撃欠堅岫隙岻 噺 券喧 伐 券喧ふ Ora, olhe o que o exercício deu: 継岫隙岻 噺 に喧 撃欠堅岫隙岻 噺 に喧 伐 に喧ふ Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 75 de 130 Portanto, fica fácil ver que: 券 噺 に O exercício fala que a probabilidade do valor de X ser inferiora 2 é de 15/16. No caso, ど 判 隙 判 に, pois trata-se de uma distribuição binomial com parâmetro 券 噺 に. Assim: 喧ふ 噺 鶏岫隙 噺 に岻 噺 な 伐 鶏岫隙 隼 に岻 噺 な 伐 なのなは 噺 ななは 喧ふ 噺 ななは 蝦 使 噺 層想 Com base nisso, podemos achar o valor pedido para Y. Fica fácil ver que, com base no enunciado: 継岫隙岻 噺 の喧 撃欠堅岫隙岻 噺 の喧 伐 の喧ふ Então: 券 噺 の A probabilidade de sucesso é a mesma, pois ambas as variáveis referem-se a “喧”. Agora, basta realizarmos nosso usual exercício de distribuição binomial para resolvermos a questão. Como 券 噺 の e o exercício quer saber qual a probabilidade de Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 76 de 130 que Y assuma valores maiores do que 3, temos que encontrar a probabilidade de que Y seja igual à 4 e 5. Assim: 鶏岫桁 噺 ね岻 噺 系泰┸替 抜 喧替 抜 岫な 伐 喧岻怠 噺 の┿な┿ ね┿ 抜 磐なね卑替 抜 ぬね 噺 の 抜 なね替 抜 ぬね 噺 なのね泰 鶏岫桁 噺 の岻 噺 系泰┸泰 抜 喧泰 抜 岫な 伐 喧岻待 噺 な 抜 磐なね卑泰 噺 なね泰 Portanto: 鶏岫桁 噺 ね岻 髪 鶏岫桁 噺 の岻 噺 なのね泰 髪 なね泰 噺 なはね泰 噺 ね 抜 ねね 抜 ね 抜 ね 抜 ね 抜 ね 噺 なね戴 噺 なはね Alternativa (b). Exercício 35 (BNDES – CESGRANRIO/2011) Para estudar o consumo de refrigerante em função do preço, da temperatura e da renda familiar, ajustou-se o seguinte modelo de regressão linear múltipla y = く0 + く1x1 + く2x2 + く3x3 + i, onde y representa o consumo de refrigerante em litros, por semana, x1, o preço do refrigerante em reais, x2, a temperatura em ºC e, x3, a renda familiar em reais, por semana. Os resultados obtidos considerando três casas decimais foram: Analisando-se os resultados acima, conclui-se que Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 77 de 130 (A) rejeitam-se as hipóteses H0 : く0 = 0 e H0 : く1 = 0 ao nível de 5% (B) rejeitam-se as hipóteses H0 : く0 = 0 , H0 : く1 = 0 e H0 : く2 = 0 ao nível de 1% (C) não se rejeitam as hipóteses H0 : く0 = 0 , H0 : く1 = 0 e H0 : く3 = 0 ao nível de 5% (D) não se rejeitam as hipóteses H0 : く1 = 0 , H0 : く2 = 0 e H0 : く3 = 0 ao nível de 5% (E) os coeficientes estimados são todos significativos ao nível de 10% Resolução Pessoal, hora de lembrar o que é o p-valor! O p-valor é o menor nível de significância ao qual a hipótese nula pode ser rejeitada. Vejamos, se você obtém um valor de 0,04 para seu p-valor, isso significa que a hipótese nula pode ser rejeitada a 4% de significância. Mas, se você escolheu 5% como seu nível de significância, ou seja, você definiu que 5% é muita coincidência, você deve rejeitar a hipótese nula. Qual é a hipótese nula que estamos testando com os coeficientes? Que o mesmo é igual a zero! Vamos pensar. No caso do coeficiente da temperatura, 紅態, o p-valor associado a hipótese de que o mesmo é igual a zero é de 0,011. Isso quer dizer que não é possível rejeitar esta hipótese nula a 1%! Isso porque o p-valor é maior do que 1% (0,01). Todos os outros coeficientes tem um p-valor que nos permite inferir que não é possível rejeitar a hipótese nula a 10%! Assim, pode-se perceber que a única alternativa que se adequa a isso é a (c). Alternativa (c). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 78 de 130 (TJ-SE – CESPE\2014) Julgue os itens a seguir. Exercício 36 A homocedasticidade é a propriedade conforme a qual o resíduo de um modelo de regressão tem media 0. Resolução Pessoal, um modelo homocedático é aquele que não tem heterocedasticidade! Essa propriedade tem a ver com o fato de os resíduos terem variância constante! Portanto, homocedasticidade não tem a ver com o fato de o resíduo ter média igual à zero. Alternativa errada. Exercício 37 Em um modelo de regressão linear simples, o coeficiente de determinação cresce à medida que a correlação entre a variável resposta e a variável regressora aumenta. Resolução Nós já estudamos isso na aula 00. Lembrem-se de que: 紐迎態 噺 】潔剣結血件潔件結券建結 穴結 潔剣堅堅結健欠çã剣】 噺 罰貢 Ou seja, o R² é diretamente proporcional ao coeficiente de correlação entre as variáveis dependente e independente. Alternativa verdadeira. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 79 de 130 Exercício 38 Resolução Pessoal, esta questão é idêntica à questão 17 da aula 01. Vou repetir a explicação. Pessoal, toda a ideia de regressão é encontrar “médias”. Veja, a regressão minimiza a soma do quadrado dos resíduos, portanto: A alternativa verdadeira é a (d), que, na verdade, expressa uma importante propriedade do método de regressão. A demonstração desta propriedade está fora do escopo deste curso, portanto, vamos analisar intuitivamente. Não tenho intenção de ser formal, ok? É para ser intuitivo mesmo! Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 80 de 130 Dada uma regressão: 検沈 噺 欠 髪 決捲沈 髪 結 Suponha que esta relação seja verdade: 検博 噺 欠 髪 決捲違 髪 結 Ou seja, que a regressão passe por estes pontos médios. Diminua a primeira equação da segunda: 岫検沈 伐 検博岻 噺 岫欠 伐 欠岻 髪 岫決捲沈 伐 決捲違岻 髪 岫結 伐 結岻 検徹蕪 噺 決捲葡沈 Como na aula anterior, o chapéu demonstra o desvio com relação à média. Rearranjando: 検徹蕪捲葡沈 噺 決 Multiplicando o numerador e o denominador por 捲葡沈, o que deixa o total inalterado, e somando esta expressão para todas as unidades seccionais: 決 噺 デ捲葡沈検葡沈デ捲葡沈態 Que é o próprio estimador de MQO. Ou seja, o ponto médio é compatível com esta fórmula. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 81 de 130 Ou seja, a regressão irá passar pelo ponto 岫捲違┸ 検博岻. Alternativa correta. Exercício 39 Resolução Bom, nós vimos em uma questão anterior que: 紐迎態 噺 】潔剣結血件潔件結券建結 穴結 潔剣堅堅結健欠çã剣】 噺 罰貢 Isso nos diz que, se as variáveis não forem correlacionadas, o coeficiente de correlação está diretamente correlacionado com o R². Portanto, se as variáveis não forem correlacionadas, o R² será próximo de zero. Entretanto, se o R² for próximo de zero, isso não significa que as variáveis são independentes. Hora de lembrar-se de Estatística (como eu falei, às vezes isso acontece)! O fato de duas variáveis apresentarem correlação baixa não implica que as variáveis são independentes! Se duas variáveis forem independentes, aí sim, isso implica que o coeficiente de correlação será zero. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 82 de 130 Alternativa falsa. Exercício 40 (CAPES – CESGRANRIO/2009) Resolução Pessoal, nós já sabemos que o teste de hipóteses sempre se baseia em uma igualdade na hipótese nula! No caso do teste de hipóteses dos coeficientes de uma regressão, temos de testar se o coeficiente é igual a zero contra a hipótese alternativa de que o mesmo seja diferente de zero, afinal o memso pode ser negativo ou positivo! Portanto, a alternativa condizente com isso é a (e). Alternativa (e). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br83 de 130 (IBGE – CESGRANRIO/2011) Com base no enunciado abaixo, resolva a questão de número 41. Exercício 41 Resolução Vamos analisar alternativa por alternativa! Letra (a) – A regressão tem os coeficientes na primeira coluna da tabela! Assim, a regressão seria: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 84 de 130 桁 噺 に┸には 髪 に┸ばね隙な 髪 ど┸どなに隙に Letra (b) – O intercepto tem p-valor maior do que 0,01, não sendo significante a 1%. Letra (c) – Com base na letra anterior, pode-se inferir que o coeficiente não é significante a 1%. Letra (d) – 2-e-16 significa que o número 2 ocupa o 16º lugar depois da vírgula, sendo 0,0000000000000002. Portanto, rejeita-se a hipótese nula a 1%. Letra (e) - o p-valor é menor do que 0,01, o que permite rejeitar a hipótese nula a 5%. Alternativa (d). Exercício 42 (TRANSPETRO – CESGRANRIO/2012) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 85 de 130 Resolução A definição de um estimador não viesado é: aquele que apresenta a propriedade de que, na média, seu valor seja igual ao parâmetro populacional a ser estimado.Em outras palavras, a esperança do mesmo tem de ser igual ao parâmetro populacional. Esta é a própria definição no enunciado. Alternativa (b). (TJ-ES – CESPE/2012) Exercício 43 Resolução Errado! A soma dos quadrados totais é igual à soma dos quadrados residuais com os explicados. Porém, o coeficiente de determinação, (R²) é dado por: 迎態 噺 鯨芸継鯨芸迎 噺 鯨芸迎結訣鯨芸劇剣建 Alternativa errada. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 86 de 130 Exercício 44 (TJ-AM – FGV/2014) Resolução Vamos avaliar as alternativas: I)Não! Ela tem a mesma dimensão da variável em análise. Por exemplo, o desvio padrão da altura (medida em centímetros) dos indivíduos é medido em centímetros! II)Perfeito, pois o desvio padrão mostra o desvio das observações com relação à média: III)Correto. Como o desvio das observações é sempre elevado ao quadrado, a medida nunca será negativa. Alternativa (c). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 87 de 130 Exercício 45 (TJ-AM – FGV/2014) Resolução Decoreba! Basta lembrar de uma propriedade que eu ensinei na aula 03 (página 14): Alternativa (b). (ANATEL – CESPE/2015) Exercício 46 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 88 de 130 Resolução Esta questão é um pouco mais complexa, sendo que vamos resolvê-la por meio de uma forma mais simples. A definição de eventos independentes é que a probabilidade condicional é igual à probabilidade incondicional, portanto: 鶏岫畦】稽岻 噺 鶏岫畦岻 E: 鶏岫稽】畦岻 噺 鶏岫稽岻 A relação exposta pelo exercício implica que: 鶏岫畦】稽岻 噺 鶏岫稽】畦岻 蝦 鶏岫畦 結 稽岻鶏岫稽岻 噺 鶏岫畦 結 稽岻鶏岫畦岻 Dividindo ambos os lados pela probabilidade de intersecção: な鶏岫稽岻 噺 な鶏岫畦岻 蝦 鶏岫畦岻 噺 鶏岫稽岻 Ou seja, não implica em independência. Alternativa errada. Exercício 47 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 89 de 130 Resolução Nós já conhecemos esta fórmula de probabilidade condicional: 鶏岫畦】稽岻 噺 鶏岫畦 結 稽岻鶏岫稽岻 噺 ど Se P(B)>0, então isso implica que: 鶏岫畦 結 稽岻 噺 ど Ou seja, são eventos disjuntos. Alternativa correta. (TCU – CESPE/2015) Exercício 48 Resolução Qual é a variância da operação de diminuição de duas variáveis? 撃欠堅岫隙 伐 桁岻 噺 撃欠堅岫隙岻 髪 撃欠堅岫桁岻 伐 に系剣懸岫隙┸ 桁岻 As variáveis são independentes, portanto: 系剣懸岫隙┸ 桁岻 噺 ど Assim: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 90 de 130 撃欠堅岫隙 伐 桁岻 噺 撃欠堅岫隙岻 髪 撃欠堅岫桁岻 Qual é o valor da variância destas variáveis? Tratam-se de variáveis normais padronizadas, portanto sabemos que este é um caso em que as variáveis tem média zero e variância igual a 1. Portanto: 撃欠堅岫隙 伐 桁岻 噺 撃欠堅岫隙岻 髪 撃欠堅岫桁岻 噺 な 髪 な 噺 に Alternativa falsa. (TELEBRAS – CESPE/2015) Exercício 49 Resolução Pessoal, o que o exercício quer é: 鶏岫嫌結堅 潔健件結券建結 穴結 系】結嫌建� 件券嫌欠建件嫌血結件建剣岻 Portanto, sabemos que: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 91 de 130 鶏岫嫌結堅 潔健件結券建結 穴結 系】結嫌建� 件券嫌欠建件嫌血結件建剣岻 噺 鶏岫潔健件結券建結 穴結 系 結 件券嫌欠建件嫌血結件建剣岻鶏岫件券嫌欠建件嫌血結件建剣岻 Para resolver esta questão iremos nos utilizar de uma “velha tática” nossa, vamos supor que o total de clientes na economia é 100. Portanto, vamos encontrar o total de pessoas insatisfeitas multiplicando o total de clientes de cada companhia pela quantidade de pessoas insatisfeitas em cada uma: 荊券嫌欠建件嫌血結件建剣嫌 噺 ねど 抜 ど┸な 髪 ぬの 抜 ど┸なの 髪 にの 抜 ど┸どぱ 噺 ね 髪 の┸にの 髪 に 噺 なな┸にの Não se preocupe com a quantidade não inteira, ok? Continue com a solução! Agora, sabendo que há 11,25 pessoas, em um total de 100, que estão insatisfeitas, trata-se de 11,25%! Qual a probabilidade de um cliente de C insatisfeito? Não é 0,08, pois esta é a probabilidade de um cliente dentro de C estar insatisfeito. O que você quer é saber é, quantas pessoas de C estão insatisfeitas. ど┸どぱ 抜 にの 噺 に Portanto: 鶏岫嫌結堅 潔健件結券建結 穴結 系】結嫌建� 件券嫌欠建件嫌血結件建剣岻 噺 鶏岫潔健件結券建結 穴結 系 結 件券嫌欠建件嫌血結件建剣岻鶏岫件券嫌欠建件嫌血結件建剣岻 噺 岾 になどど峇岾なな┸にのなどど 峇簡 ど┸なばぱ Alternativa falsa. Exercício 50 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 92 de 130 Resolução Já calculamos isso! A probabilidade de estar insatisfeito é de: なな┸にのなどど 噺 ど┸ななにの 噺 なな┸にのガ Alternativa correta. Exercício 51 (IBGE – FGV/2016) Resolução Veja, o total de observações é a soma de frequências: の 髪 ひ 髪 など 髪 ぬ 噺 にば Portanto, a mediana é observação de número: にば 髪 なに 噺 なねぇ Portanto, a 14ª observação é a de número 5. A moda é a observação de maior frequência, ou seja, a de número 9. A média, esperança, é dada por: 継岫捲岻 噺 ぬ 抜 の 髪 の 抜 ひ 髪 ひ 抜 など 髪 なぬ 抜 ぬにば 噺 ば Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 93 de 130 Alternativa (e). Exercício 52 (IBGE – FGV/2016) Resolução Quais são as possibilidades? 継嫌喧欠ç剣 欠兼剣嫌建堅欠健 噺 岶岫潔欠堅欠┸ 潔欠堅欠岻┹ 岫潔欠堅欠┸ 潔剣堅剣欠岻┹ 岫潔剣堅剣欠┸ 潔欠堅欠岻┸ 岫潔剣堅剣欠┸ 潔剣堅剣欠岻岼 Há dois casos de resultados iguais e dois diferentes em 4 jogadas, portanto, probabilidade de ½ para cada caso. Alternativa (d). Exercício 53 (IBGE – FGV/2016) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 94 de 130 Resolução Neste caso, temos de encontrar o limite que separa todas as observaçõesdos 10 maiores valores! Assim, fica fácil, pois temos de encontrar o valor que acumula 90% das probabilidades, ou seja, 1,3, conforme valores dados no enunciado. Assim: 権 噺 隙 伐 航購 馨 な┸ぬ 噺 隙 伐 は┸のに 馨 隙 噺 は┸の 髪 に┸は 噺 ひ┸な Este é o valor que separa as 90% menores observações das maiores. Ou seja, esta é nota mínima para ser aprovado. Alternativa (a). Resolva esta comigo primeiro! Tem coisa nova aqui! Exercício 54 (TRE – SP – FCC/2013) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 95 de 130 Resolução Vamos avaliar uma por uma. a)A distância interquartil é dada pela diferença entre o 3º e o 1º quartil, que correspondem, respectivamente, à parte de baixo e de cima de cada caixa. Por exemplo, no grupo 2, o primeiro quartil corresponde a 3.000, enquanto que no segundo a 5.000. Perceba que no grupo 1 a distância interquartil vai de 3.000 até um número maior do que 5.000, implicando em uma distância diferente do que no primeiro grupo. Alternativa errada. b)O menor valor, segundo o box-plot apresentado, é aquela “perninha” abaixo de cada caixa. Veja que a perninha do grupo 1 começa em 2.000, enquanto que a do grupo 2 está um pouco abaixo disso. Alternativa errada. c) O grande objetivo do Box-Plot é verificar a distribuição dos dados. Assim, as conclusões que tiramos ao analisar um box plot são: centro dos dados (a média ou mediana), a amplitude dos dados (máximo – mínimo), a simetria ou assimetria do conjunto de dados e a presença de outliers. No caso, o centro da distribuição é indicado pela linha da mediana, no centro do quadrado. Veja, o retângulo contém 50% dos valores do conjunto de dados. A posição Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 96 de 130 da linha mediana no retângulo informa sobre a assimetria da distribuição. Uma distribuição simétrica teria a mediana no centro do retângulo. Se a mediana é próxima do primeiro quartil, então, os dados são positivamente assimétricos. Se a mediana é próxima de terceiro quartil, os dados são negativamente assimétricos. O grupo 2 aparenta ter distribuição simétrica, o que não ocorre no grupo 1 (negativamente assimétricos). Alternativa errada. d)A maior amplitude é do grupo 2, pois, contando as “perninhas”, ela vai de alguma valor abaixo de 2.000, que é o menor valor do grupo 1, até 6.000, o maior valor de 1. Alternativa errada. e)Esta é a correta. Veja, a diferença entre as duas medianas deve ser algum valor inferior à 1.000. Isso porque: Ou seja, a diferença está dentro do intervalo entre a mediana e o terceiro quartil do segundo grupo, que é de 1000. A mediana do grupo 2 é de 4.000. Portanto, 25% disso é equivalente à 1.000. Ora, o módulo da diferença entre as medianas é inferior à 1.000, como mostramos. Alternativa (e). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 97 de 130 Exercício 55 (TRE – SP – FCC/2013) Resolução O que o exercício quer saber é qual o valor da média populacional necessário para que 98,8% (0,988) dos frascos produzidos possuam valores maiores ou iguais a 200mL. Com base na normal padronizada, sabemos que: 権 噺 隙 伐 航購 Graficamente, o que estamos procurando é o valor populacional compatível com isso: Com base no enunciado, sabemos que o valor z que acumula 98,8% das observações é 2,88. Assim, nós sabemos que este valor padronizado de 2,88 para o valor de 200 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 98 de 130 mL equivale a dizer, “a probabilidade de encontrarmos valor inferior a 200 Ml é de 98,8%, para uma dada média e desvio padrão populacionais”. Portanto, substituindo os valores do enunciado na normal padronizada: に┸ぱぱ 噺 にどど 伐 航ど┸の な┸ねね 噺 にどど 伐 航 航 噺 にどど 伐 な┸ねね 航 噺 なひぱ┸のは Alternativa (d). Resolva esta comigo primeiro! Tem coisa nova aqui! Exercício 56 (TRE – SP – FCC/2013) Resolução O conceito novo é o seguinte, sabe o que significa: 捲沈┺ 軽岫など┸ね岻 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 99 de 130 Veja, isso está te falando que a variável x tem observações que seguem uma distribuição normal (“N”), com média 10 e variância 4. No caso, i=1,2,3,4, indicando que há 4 variáveis. Genericamente, para uma variável que segue uma distribuição normal, podemos escrever: 捲沈┺ 軽岫航┸ 購ふ岻 Entendeu? Portanto o enunciado te deu os valores populacionais! Mas, o que ele quer saber é, qual a probabilidade da média amostral (隙博, definida no enunciado) possuir valor superior a uma constante “a” com probabilidade de 90%. Ora, o enunciado nos mostra o valor de z que acumula 90% do total de observações! Ou seja, para este valor z (1,28), um determinado valor X acumula 90% do total de observações. Portanto: Mas, nós não queremos isso! Queremos um valor que esteja na parte esquerda do gráfico, e que os valores superiores a ele acumulem 90%. Como a distribuição normal é simétrica: Assim, basta encontrarmos o valor de média amostral que corresponda a este gráfico! Com base na fórmula da normal padronizada para testes sobre média amostral: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 100 de 130 権 噺 隙 伐 航購ヂ券 Substituindo os valores populacionais: 伐な┸にぱ 噺 隙 伐 などにヂね 噺 隙 伐 などな 隙 伐 など 噺 伐な┸にぱ 隙 噺 ぱ┸ばに Alternativa (e). Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 101 de 130 Lista de Exercícios Resolvidos Exercício 4 (SUSEP 2010 – Atuária) A partir de uma amostra aleatória [x(1), y(1)], [x(2), y(2)]...[x(20), y(20)] foram obtidas as estatísticas: Média de X = 12,5 Média de Y = 19 Variância de X = 30 Variância de Y = 54 Covariância entre X e Y = 36 Calcule a reta de regressão estimada de Y contra X. a) Y = 19 + 0,667*X b) Y = 12,5 + 1,2*X c) Y = 4 + 1,2 X d) Y = 19 + 1,2 X e) Y = 80 + 22,8X Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 102 de 130 Exercício 5 (SUSEP 2010 – Atuária) Com os dados da questão anterior, determine o valor da estatística F para testar a hipótese nula de que o coeficiente angular da reta do modelo de regressão linear simples de Y contra X é igual a zero. a) 144 b) 18 c) 36 d) 72 e) 48 Exercício 6 (ESAF – AFRFB 2009) Na análise de regressão linear simples, as estimativas e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra de n pares de valores com (i = 1, 2,....,n), obtendo-se: , onde é a estimativa de . Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado por - entre a reta de regressão e sua estimativa .Sabe- se que o Método de Mínimos Quadrados consiste em adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 103 de 130 a) b) c) d) e) Exercício 7 (EPE – ECONOMIA DA ENERGIA/2007) Qual das afirmações abaixo faz referência correta ao modelo de regressão linear simples? a) Toda regressão apresenta heterocedasticidade b) Se a variância dos erros é constante, os dados são homocedásticos c) O intercepto g representa a inclinação da reta d) Os erros do modelo não são aleatórios, com esperança igual a 1 e) A constante g é sempre positiva Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 104 de 130 Exercício 8 (ESAF – ATRFB/2009) O modelo de Regressão Linear Múltipla Y = g + くX + そZ + i é ajustado às observações (Y, X, Z) que constituem uma amostra aleatória simples de tamanho 23. Considerando que o coeficiente de determinação foi R² = 0,80, obtenha o valor mais próximo da estatística F para testar a hipótese nula de não existência da regressão: a) 84 b) 44 c) 40 d) 42 e) 80 (ANPEC – 2010) Julgue as afirmativas Exercício 9 Os estimadores de MQO são eficientes, mesmo se os erros não forem normalmente distribuídos. Exercício 10 Sob heterocedasticidade os estimadores de MQO são viesados. Exercício 11 Sob autocorrelação o estimador de MQO não é mais eficiente. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 105 de 130 (ANAC – NCE/2007 – ADAPTADA) Considerando o modelo abaixo, estimado pelo método de mínimos quadrados ordinários, com uma amostra de 300 observações, com: R²= 0,39 P = 30,0 + 20,0Q + 10,0V + u (3,0) (2,2) (0,9) P é o preço de venda dos apartamentos em uma determinada cidade (em mil reais), Q o número de quartos do apartamento, V o número de varandas, u o erro e os valores entre parêntesis são os desvios-padrão dos coeficientes estimados. Com base nisso, julgue os itens a seguir. Questão 12 O preço esperado de um apartamento com 2 quartos e uma varanda será maior que R$ 80.000, pois não conhecemos o valor esperado de u. Questão 13 Segundo o coeficiente de determinação, mais da metade da variação dos preços dos apartamentos pode ser explicada. Questão 14 Através da observação do valor do R2, podemos concluir que a regressão é estatisticamente não-significante. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 106 de 130 Exercício 15 (AFRFB – ESAF/2013) A expectância de uma variável aleatória x ⦆ média ou esperança matemática como também é chamada ⦆ é igual a 2, ou seja: E(x) = 2. Sabendo-se que a média dos quadrados de x é igual a 9, então os valores da variância e do coeficiente de variação de x são, respectivamente, iguais a: a) b) c) d) e) Exercício 16 (AFRFB – ESAF/2013) Um modelo de regressão linear múltipla foi estimado pelo método de Mínimos Quadrados, obtendo-se, com um nível de confiança de 95%, os seguintes resultados: I. ┪ = 10 + 2,5*x1 + 0,3*x2 + 2*x3 II. o coeficiente de determinação R2 é igual a 0,9532 III. o valor-p = 0,003 Desse modo, pode-se afirmar que: a) se a variável x1 for acrescida de uma unidade, então Y terá um acréscimo de 2,5 %. b) 0,003 é o mais baixo nível de significância ao qual a hipótese nula pode ser rejeitada. c) x3 explica 95,32% das variações de Y em torno de sua média. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 107 de 130 d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II são, respectivamente, iguais a 5% e 95%. e) se no teste de hipóteses individual para く2 se rejeitar a hipótese nula (H0), então tem-se fortes razões para acreditar que x2 não explica Y. Exercício 17 (FINEP – CESGRANRIO/2011) O modelo de regressão linear Y = gX + erro, onde (X, Y) são pares de dados observados e g é um parâmetro a ser estimado, foi ajustado aos dados (X, Y) mostrados na figura abaixo. Foi usada a técnica de minimizar a soma dos erros quadráticos para ajustar a reta de regressão, a qual a) passa por (散拍┸ 桟拍), onde 散拍 e 桟拍 são as médias de X e de Y. b) passa pela origem (0, 0). c) não é a única reta que minimiza a soma dos erros quadráticos. d) tem variância esperada nula. e) tem coeficiente angular necessariamente negativo. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 108 de 130 Exercício 18 (FINEP – CESGRANRIO/2011) Se o coeficiente de correlação entre duas variáveis X e Y for nulo, então a(s) a) covariância entre X e Y é nula. b) média de X é nula. c) média de Y é nula. d) médias de X e Y são iguais. e) variâncias de X e de Y são não correlacionadas. Exercício 19 (TRT 19ª região – FCC\2014 - modificada) Sejam duas variáveis X e Y representando os salários dos empregados nas empresas Alfa e Beta, respectivamente, com 100 empregados cada uma. Em um censo realizado nas duas empresas apurou-se que a média, em milhares de reais, de X foi igual a 2,5 e a média de Y foi igual a 3,2. A soma dos valores dos quadrados, em (R$ 1.000,00)², de todos os valores de X foi igual a 650 e de todos os valores de Y foi igual a 1.047,04. Assim, o coeficiente de variação de: a) X é igual a 10% e o de Y igual a 20%. b) X é igual a 20% e o de Y igual a 15%. c) X é igual ao coeficiente de variação de Y. d) Y é igual à metade do coeficiente de variação de X. e) Y não é menor que o coeficiente de variação de X. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 109 de 130 Exercício 20 (SEFAZ-SP – 2013/FCC) Considere: I. O coeficiente de variação de uma variável é uma medida de dispersão absoluta que é o resultado da divisão entre a média e o desvio padrão da variável em questão. II. Um dispositivo útil quando se deseja verificar se existe correlação linear entre duas variáveis é o gráfico de colunas justapostas. III. O desvio padrão é mais apropriado do que o coeficiente de variação quando se deseja comparar a variabilidade de duas variáveis. IV. Na amostragem aleatória estratificada, a população é dividida em estratos, usualmente, de acordo com os valores ou categorias de uma variável, e, depois, uma amostragem aleatória simples é utilizada na seleção de uma amostra de cada estrato. Está correto o que se afirma APENAS em a) I. b) II. c) III. d) I e IV. e) IV. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 110 de 130 Exercício 21 (TRT 12ª – FCC\2013) Um modelo de regressão linear múltipla, com intercepto, consiste deuma variável dependente, 3 variáveis explicativas e com base em 12 observações. As estimativas dos parâmetros do modelo foram obtidas pelo método dos mínimos quadrados e o valor encontrado da estatística F (F calculado) utilizado para testar a existência da regressão foi igual a 14. O coeficiente de explicação (R2), definido como sendo o resultado da divisão da variação explicada pela variação total, é, em %, igual a a) 80,0. b) 76,8. c) 78,0. d) 72,0. e) 84,0. Exercício 22 (SUDECO – FUNCAB\2013\alterada) Utilizando dados regionais para um período de 18 anos, os analistas de uma agência de desenvolvimento estimaram a seguinte equação de regressão relacionando poupança e renda onde Y é a poupança no ano t, X é a renda no ano t, D é uma dummy que separa os anos em dois subperíodos e os valores entre parênteses são os p-valores dos coeficientes. Considerando esses dados, pode-se afirmar que: A) nenhum coeficiente é significativo. B) a dummy de intercepto não é significativa. C) a variável X é significativa. D) o produto DX é significativo. E) todos os coeficientes são significativos Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 111 de 130 Exercício 23 (SEDAM – FUNCAB\2014) ==9e8c== Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 112 de 130 Exercício 24 (SEDAM – FUNCAB\2014) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 113 de 130 Exercício 25 (SEDAM – FUNCAB\2014) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 114 de 130 Exercício 26 (SESAU – FUNCAB\2009\alterada) A partir de uma tabela de analise da variância, podemos obter uma estatística que representa a proporção de variação explicada pelo modelo. Como se chama esta estatística? A) Soma de quadrados dos erros; B) Fonte de variação; C) Soma dos Quadrados Explicados; D) Soma de quadrados dos resíduos; E) Graus de liberdade. Exercício 27 (SESAU – FUNCAB\2009\alterada) A tabela a seguir apresenta, parcialmente, os resultados de um determinado teste de analise de variância. Fonte de variação SQ GL QM F Valor-p SQE 10897,09 11 990,65 183,7 0 SQR 485,35 x 5,393 SQT 11382,44 y O valor de y é: A) 102; B) 90; C) 101; D) 91; E) 95. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 115 de 130 Exercício 28 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 116 de 130 Exercício 29 (SEMAD – FUNCAB\2013) A tabela a seguir apresenta o resultado de uma análise de regressão múltipla. Considerando-se qual a opção correta? A) Apenas as variáveis X1 e X3 são significativas e o valor do coeficiente de determinação indica um bom ajuste. B) As variáveis X1 e X2 são significativas e o modelo deve ser outra vez avaliado, retirando a variável X3. C) As variáveis X1, X2 e X3 são significativas e o valor do coeficiente de determinação indica um bom ajuste. D) As variáveis independentes não são significativas. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 117 de 130 Exercício 30 (Analista de Controle Interno – FGV/2014) A seguinte amostra de idades foi obtida: 19; 25; 39; 20; 16; 27; 40; 38; 28; 32; 30. Assinale a opção que indica a mediana dessas idades. (A) 27 (B) 28 (C) 29 (D) 30 (E) 31 Exercício 31 (Analista de Controle Interno – FGV/2014) Uma variável aleatória X é normalmente distribuída com média 12 e variância 4. A probabilidade de que X seja maior do que 10 é igual a (A) 0,3085. (B) 0,3587. (C) 0,6915. (D) 0,8413. (E) 0,9772. Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 118 de 130 Exercício 32 (Analista de Controle Interno – FGV/2014) Numa regressão linear simples, obteve-se um coeficiente de correlação igual a 0,78. O coeficiente de determinação é aproximadamente igual a (A) 0,36. (B) 0,48. (C) 0,50. (D) 0,61. (E) 0,69. Exercício 33 (ICMS-RJ – FCC\2013) Considere o modelo 姿餐 噺 詩 髪 試餐 髪 蚕餐, i = 1,2,3,... onde: I. yi e xi representam, respectivamente, o tempo de reação a certo estímulo, em segundos, e a idade, em anos, do indivíduo i. II. 詩 e 試 representam os parâmetros desconhecidos do modelo. III. 蚕餐 representa o erro aleatório com as respectivas hipóteses para a regressão linear simples. IV. As estimativas de 詩 e 試 foram obtidas pelo método de mínimos quadrados por meio de 10 observações, utilizando-se as seguintes informações: Nessas condições, a soma de quadrados residuais do modelo é igual a a) 785 b) 810 c) 515 d) 920 e) 460 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 119 de 130 Exercício 34 (ICMS-RJ – FCC\2013) Sabe-se que: I . X é uma variável aleatória com distribuição binomial com média 2p e variância (2p-2p2). II . Y é uma variável aleatória com distribuição binomial com média 5p e variância (5p-5p2). III . A probabilidade de X ser inferior a 2 é igual a 15/16. Nessas condições, a probabilidade de Y ser superior a 3 é igual a a) 3/1024 b) 1/64 c) 5/512 d) 15/1024 e) 7/512 Exercício 35 (BNDES – CESGRANRIO/2011) Para estudar o consumo de refrigerante em função do preço, da temperatura e da renda familiar, ajustou-se o seguinte modelo de regressão linear múltipla y = く0 + く1x1 + く2x2 + く3x3 + i, onde y representa o consumo de refrigerante em litros, por semana, x1, o preço do refrigerante em reais, x2, a temperatura em ºC e, x3, a renda familiar em reais, por semana. Os resultados obtidos considerando três casas decimais foram: Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 120 de 130 Analisando-se os resultados acima, conclui-se que (A) rejeitam-se as hipóteses H0 : く0 = 0 e H0 : く1 = 0 ao nível de 5% (B) rejeitam-se as hipóteses H0 : く0 = 0 , H0 : く1 = 0 e H0 : く2 = 0 ao nível de 1% (C) não se rejeitam as hipóteses H0 : く0 = 0 , H0 : く1 = 0 e H0 : く3 = 0 ao nível de 5% (D) não se rejeitam as hipóteses H0 : く1 = 0 , H0 : く2 = 0 e H0 : く3 = 0 ao nível de 5% (E) os coeficientes estimados são todos significativos ao nível de 10% (TJ-SE – CESPE\2014) Julgue os itens a seguir. Exercício 36 A homocedasticidade é a propriedade conforme a qual o resíduo de um modelo de regressão tem media 0. Exercício 37 Em um modelo de regressão linear simples, o coeficiente de determinaçãocresce à medida que a correlação entre a variável resposta e a variável regressora aumenta. Exercício 38 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 121 de 130 Exercício 39 Exercício 40 (CAPES – CESGRANRIO/2009) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 122 de 130 (IBGE – CESGRANRIO/2011) Com base no enunciado abaixo, resolva a questão de número 41. Exercício 41 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 123 de 130 Exercício 42 (TRANSPETRO – CESGRANRIO/2012) (TJ-ES – CESPE/2012) Exercício 43 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 124 de 130 Exercício 44 (TJ-AM – FGV/2014) Exercício 45 (TJ-AM – FGV/2014) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 125 de 130 (ANATEL – CESPE/2015) Exercício 46 Exercício 47 (TCU – CESPE/2015) Exercício 48 (TELEBRAS – CESPE/2015) Exercício 49 Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 126 de 130 Exercício 50 Exercício 51 (IBGE – FGV/2016) Exercício 52 (IBGE – FGV/2016) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 127 de 130 Exercício 53 (IBGE – FGV/2016) Resolva esta comigo primeiro! Tem coisa nova aqui! Exercício 54 (TRE – SP – FCC/2013) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 128 de 130 Exercício 55 (TRE – SP – FCC/2013) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 129 de 130 Resolva esta comigo primeiro! Tem coisa nova aqui! Exercício 56 (TRE – SP – FCC/2013) Estatística p/TCU 2017 Teoria e exercícios comentados Prof. Jeronymo Marcondes ʹ Aula 09 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 130 de 130 2-d 35-c 3-e 36-F 4-c 37-V 5-d 38-V 6-anulada 39-F 7-b 40-e 8-c 41-d 9-Certo 42-b 10-Errado 43-F 11-Certo 44-c 12-Errado 45-b 13-Errado 46-F 14-Errado 47-V 15-a 48-F 16-b 49-F 17-b 50-V 18-a 51-e 19-b 52-d 20-e 53-a 21-e 54-e 22-c 55-d 23-c 56-e 24-b 25-e 26-c 27-c 28-a 29-b 30-b 31-d 32-d 33-d 34-b Boa pessoal! Continuem estudando. Só mais um pouquinho e a recompensa vai chegar! Mandem dúvidas! Forte abraço.