Prévia do material em texto
· Pergunta 1 0,5 em 0,5 pontos Assinale a alternativa incorreta: Resposta Selecionada: e. Ciência de Dados se refere ao volume de dados tão grande e/ou complexo para ser efetivo e/ou eficientemente tratado por teorias tradicionais sobre os dados relacionados, as tecnologias e as ferramentas. · Pergunta 2 0,5 em 0,5 pontos Em Aprendizado de Máquina, os dispositivos computacionais empregam um princípio de inferência denominado de __________, que permite extrair as conclusões genéricas a partir de um conjunto particular de exemplos. A palavra que completa o texto é: Resposta Selecionada: d. Indução. · Pergunta 3 0,5 em 0,5 pontos Quando um modelo apresenta baixa capacidade de generalização, o modelo memorizou ou se especializou nos dados de treinamento. Diz-se que a regra está: Resposta Selecionada: a. Superajustada. · Pergunta 4 0,5 em 0,5 pontos Considere as seguintes afirmações: I - A classificação visa identificar a qual classe determinado registro pertence. Nessa tarefa, o modelo analisa o conjunto de registros fornecidos, com cada registro já contendo a indicação à qual classe pertence, a fim de “aprender” como classificar um novo registro (aprendizado supervisionado). Porque II - No aprendizado não supervisionado, apenas as entradas são fornecidas, sendo que, nesse caso, o padrão de saída deve ser deduzido pelo próprio sistema de aprendizado. Pode-se afirmar que: Resposta Selecionada: b. I e II são asserções verdadeiras, mas II não justifica I. · Pergunta 5 0,5 em 0,5 pontos Considere as seguintes afirmações. I - O conceito central do algoritmo k-means é o centroide. II - No clustering de dados, o centroide de um conjunto de tuplas de dados é a tupla que mais representa o grupo. III - Sejam três tuplas de peso-altura a saber: (McCaffrey) [a] (61.0, 100.0) [b] (64.0, 150.0) [c] (70.0, 140.0). A tupla [c] é o centroide das três tuplas. Está correta a alternativa: Resposta Selecionada: d. I, II e III. · Pergunta 6 0,5 em 0,5 pontos Durante o processo de aprendizado, um algoritmo de AM procura por um modelo, no espaço de possíveis modelos, capaz de modelar a relação entre os atributos preditivos e o atributo-alvo. Assinale a alternativa que cita um algoritmo não concernente ao Aprendizado de Máquina. Resposta Selecionada: e. Smallest Job First. · Pergunta 7 0,5 em 0,5 pontos Os termos: classificação e agrupamento dizem respeito a: Resposta Selecionada: d. Aprendizado supervisionado e modelo discriminativo, respectivamente. · Pergunta 8 0,5 em 0,5 pontos Considere as seguintes asserções: I - O método usado pelo ID3 para determinar quais características usar, a cada estágio da Árvore de Decisão, é selecionar, em cada estágio, a característica que oferece o maior ganho de informação. Ganho de informação é definido como a redução em entropia. A entropia de um conjunto de dados de treinamento, S, é definida por: H(S) = –p1 log 2 p1 – p0 log 2 p0, em que: p1 é a proporção dos dados de treinamento que inclui exemplos positivos; p0 é definido como a proporção que inclui exemplos negativos. II - A entropia de S será zero quando todos os exemplos forem positivos ou quando todos os exemplos forem negativos. III - A entropia alcançará o seu valor máximo de 1 quando exatamente a metade dos exemplos for positiva e a outra metade for negativa. Está correta a alternativa: Resposta Selecionada: d. I, II e III. · Pergunta 9 0,5 em 0,5 pontos A forma como um algoritmo de Aprendizado de Máquina procura pelo melhor modelo em um espaço de possíveis modelos define um viés de busca. Considere as duas asserções: I - O viés é necessário para restringir os modelos a serem avaliados no espaço de busca. Porque II- Sem viés não haveria aprendizado/generalização. Pode-se afirmar que: Resposta Selecionada: a. As afirmações I e II são verdadeiras e II justifica I. · Pergunta 10 0,5 em 0,5 pontos Considere as seguintes afirmações: I - O profissional cientista de dados deve apresentar, entre outras características, sólidos conhecimentos em Estatística. PORQUE II – Ciência de Dados foca no impacto e na relevância dos dados, e na manipulação de dados de diferentes tipos. Pode-se afirmar que: Resposta Selecionada: a. As afirmações I e II são verdadeiras e II justifica I. Segunda-feira, 3 de Outubro de 2022 23h15min40s GMT-03:00 OK