Buscar

Análise de Dados Usando Dashboards (17321)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina 
Disciplina: Análise de Dados Usando Dashboards (17321) 
Nota: 8 
Prova: 38618344
O mercado de gestão de dados – chamado pelo jargão de "big data & analytics" – deve movimentar US$ 4,2 bilhões, em 2019, no Brasil, o que representa um
crescimento de "um dígito alto", segundo a International Data Corporation. A IDC avaliou que as empresas têm mostrado di�culdade para fazer uma gestão de
dados e�ciente e tirar proveito de ferramentas como acompanhamento de performance ou alerta de produtividade, por exemplo.
 
 Sobre BIG DATA assinale a alternativa CORRETA:
A)  São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O Big Data é responsável por fazer a interface entre os
dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade.
B)  São fatos e números que transmitem algo especí�co, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se
dizer que dados são a informação de uma maneira bruta. 

C)  Big Data é um termo que tem como tradução literal mais próxima “grandes quantidades de dados” e é também o termo instituído pela IBM para
determinar a grande quantidade de dados gerados pelos sistemas de informação. Geralmente, utiliza-se a combinação de volume, velocidade e variedade
para chegar em Big Data.
D)  São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por
aplicações de tomada de decisão. 
PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante destaque nos últimos anos, como o banco de dados que mais cresce no mercado.
No encontro, ele mostrou as vantagens e desvantagens de utilizar o banco de dados Open Source, que ele considera o mais avançado do mundo. O
PostgreSQL é um sistema gerenciador de banco de dados objeto relacional (SGBD), desenvolvido como projeto de código aberto.
 
Assinale a alternativa CORRETA, que contenha a de�nição correta de SGBD:
A)  Para que os SGBDS se tornem informação , eles devem ser contextualizados, categorizados, calculados e condensados, deste modo a informação são
os dados organizados. De um modo geral, pode-se dizer que o conhecimento é quando se traz um sentido ao dado.
B)  São fatos e números que transmitem algo especí�co, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se
dizer que dados são a informação de uma maneira bruta. 

C)  Sistemas Gerenciadores de Bancos de Dados, ou Sistemas Gerenciadores de Bancos de Dados Relacionais são, de maneira simples, um software que é
responsável por gerenciar o acesso aos dados. O SGBD é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os,
garantindo sua segurança e integridade. 
D)  São documentos XML utilizados para armazenar informação. 
A arquitetura de um Data Warehouse é composta pela estratégia de coleta, pré-processamento e análise dos dados. São diversas as arquiteturas propostas na
literatura, as variações acontecem principalmente pelo fato de existirem variações nas formas e formatos de dados. As arquiteturas de Data Warehouse
geralmente são compostas por: fontes provedoras, área de trabalho, área de apresentação de dados e ferramentas de acesso aos dados.
 
Selecione a alternativa CORRETA sobre a área de trabalho de um ambiente de Data Warehouse. 
A)  Um ambiente de Data Warehouse tem como características a integração entre os dados, ou seja, eles são oriundos de diversas fontes. Esta camada
contém todos os dados possíveis de serem armazenados no Data Warehouse (relacional, orientado a objetos, não estruturados, textual, web etc.) que
possam ajudar a cumprir as tarefas de análise. 
B)  Esta é a camada em que as ferramentas de visualização fazendo uso do servidor OLAP submetem requisições de acesso aos dados armazenados. No
que se refere ao objetivo do nosso livro, será nesta camada que os dados estarão prontos e as ferramentas de construção de Dashboards serão conectadas
aos dados, permitindo a exploração e análises multidimensionais.

C)  Nesta camada são realizados os processos de integração das fontes de dados, bem como as transformações necessárias para armazenar os dados de
acordo com o modelo de�nido para Data Warehouse. Nesta camada são realizados os principais procedimentos da chamada ETL (Extract, Transform and
Load). 
D)  Esta trata de um Data Warehouse em si, em que os dados já coletados e transformados serão armazenados em um banco de dados projetado a partir de
um modelo multidimensional.
Alterar modo de visualização
1
2
3
4
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
O data warehouse deve ser desenhado para transpor os limites de cada um dos sistemas transacionais. Ele é construído para responder questões que não
estão limitadas às transações ou aos sistemas individuais, apresentando, desta forma, uma visão integrada e completa dos negócios. Uma das técnicas
utilizadas para se obter um modelo para o data warehouse que identi�que e represente as informações importantes para o modelo de negócios é a
modelagem dimensional ou multidimensional.
 
Na abordagem da literatura existem duas estratégias de modelagem multidimensional, assinale a alternativa CORRETA que contenha essas estratégias.
A)  SQL e SGBD. 
B)  Data Warehouse e Data Marts.
C)  Star Schema e Snow�ake. 
D)  1FN, 2FN e 3FN. 
Segundo Date (2004), “Data Warehouse é um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo.
 
No contexto de tal de�nição, assinale a alternativa correta sobre o que signi�ca integrado.

A)  Um Data Warehouse pode integrar vários sistemas internos que usam SGBD e ao mesmo tempo integrar com redes sociais via JSON, fazendo dessa
dinâmica nas fontes de dados sua principal característica, bem como um dos principais desa�os. 
B)  O Termo integrado l se refere às fontes de dados diversas e com baixa volatilidade.
C)  O termo integrado l se refere a não poder haver alteração nas fontes de dados utilizadas para alimentar um data warehouse. 
D)  O termo integrado se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo.
Em caso de exclusões na fonte, o mesmo não acontece em um Data Warehouse. 
O Pentaho é um software patenteado nos EUA: os fundadores da empresa queriam desenvolver um pacote Java que pudesse ser usado para construir
qualquer solução de BI. Eles queriam isso porque achavam que nenhuma ferramenta era �exível e poderosa o bastante para atender a qualquer necessidade,
de qualquer empresa. Eles acreditavam que devia haver uma maneira melhor de montar soluções de BI, e que seria possível fundar uma empresa sobre essa
"maneira melhor". E foi o que eles �zeram.
 
Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o SPOON:
A)  Um Spoon é uma sequência operações. Ao contrário de uma transformação, que opera sobre as linhas de dados em paralelo, um spoon realiza
operações completas, uma por uma. 
B)  O Spoon é o programa que executa transformações. 
C)  O Spoon pode executar uma transformação a partir de qualquer uma destas origens.
D)  O Spoon é a interface grá�ca do Pentaho Data Integration, que facilita na concepção de rotinas e lógica ETL. 
Segundo INMON (2005), um Data Warehouse é uma coleção de dados, orientado a um assunto, integrado, com tempo variável e não volátil; este banco de
dados é desenvolvido para suporte ao gerenciamento dos processos de tomada de decisão. 
 
No contexto de tal de�nição, assinale a alternativa correta sobre o que signi�ca não volátil. 

A)  O termo não volátil se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo.
Em caso de exclusões na fonte o mesmo não acontece em um Data Warehouse. 
B)  O termo não volátil se refere a não poder haver alteração nas fontes de dados utilizadaspara alimentar um data warehouse. 
C)  O termo não volátil se refere ao fato de que sempre há mudanças nos dados e isso deve ser considerado em um Data Warehouse. 
D)  O termo não volátil se refere porque as fontes de dados são diversas e com baixa volatilidade.
Segundo Farobi (2017), o dashboard é um painel de bordo com as principais informações �nanceiras, comerciais, recursos humanos, logísticas e processos de
manutenção da sua empresa. Ou seja: é uma consolidação dos dados mais relevantes para o seu negócio. As informações mais importantes da sua
organização devem estar sempre disponíveis de forma rápida e prática. Com uma boa ferramenta de business intelligence, é possível visualizar claramente as
demandas problemáticas para o seu negócio.
 
Selecione a alternativa correta que contenha os tipos de Dashboards. 
A)  Dashboards operacionais, dashboards estratégicos, dashboards analíticos. 
B)  Dashboards OLAP e dashboards OLTP. 
C)  Dashboards de extração, dashboards de transformação, dashboards de carga. 
D)  Business intelligence dashboards e data warehouse dashboards.
5
6
7
8
O mundo em que vivemos está a mudar de forma drástica e constante. Novas tecnologias como a Inteligência Arti�cial (IA), a Internet das Coisas (IoT), ou a
análise de dados, estão a transformar a forma como as organizações gerem os seus negócios, o modo como se relacionam com os seus clientes e gerem o
aumento dos seus níveis de produtividade para gerar lucro.
 
 Assinale a alternativa CORRETA que contenha o outro nome para o Analista de Dados:
 A)  Analista de Data Lake.
B)  Analista de Sistemas.
C)  Analista de Data Centers. 
D)  Analista de Business Intelligence. 
As tecnologias em cloud têm dominado a rotina de todos nós. Tais plataformas que antes serviam apenas para armazenar arquivos na internet, permitem o
armazenamento de dados e principalmente um conjunto de recursos para analisá-los.
 
Selecione a alternativa correta que contenha as ferramentas de cloud computing que permitem a criação de dashboards. 
A)  Pentaho Business, Tableau, Power Bi, Qlik. 
B)  IBM Cognos Analytics, Amazon QuickSight, Google Data Studio. 
C)  Pentaho Data Integration, Tableau, Power Bi, ETL. 
D)  Pentaho Business, Pentaho Data Integration e PostgreSQL.
Os Data Warehouses têm sido amplamente utilizados para armazenamento de dados em larga escala, principalmente quando oriundos de diversas fontes. O
conceito de Data Warehouse permeia o meio acadêmico desde os anos 80, sendo um dos principais elementos na análise de dados. O conceito de Data
Warehouse tem a paternidade dividida entre Ralph Kimball e Bill Imnon.
 
Sobre o conceito de Data Warehouse selecione a alternativa correta: 
A)  Não há diferença entre um Data Warehouse e um banco de dados transacional. 
B)  Um Data Warehouse é um banco de dados NoSQL. 
C)  Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em transação, alimentado por diversas fontes.
D)  Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em análise, alimentado por diversas fontes.
O software Pentaho é uma plataforma para criação de soluções de Business Intelligence (BI), que inclui recursos de geração de relatórios, integração e
armazenamento de dados (datawarehousing), análise de informações (OLAP), painéis (dashboards) para controle gerencial e mineração de dados (Data
Mining), constituindo o mais popular e poderoso sistema de BI software livre mundial. 
  
Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o PAN:
A)  O Pan é a biblioteca grá�ca responsável por plotar os grá�cos em um Dashboard.
B)  O Pan é o programa que executa transformações. O Pan pode executar uma transformação a partir de qualquer uma destas origens. 
 C)  O Pan é a interface grá�ca do Pentaho Data Integration, que facilita na concepção de rotinas e lógica ETL. 
D)  Um Pan é uma sequência operações. Ao contrário de uma transformação, que opera sobre as linhas de dados em paralelo, um spoon realiza operações
completas, uma por uma. 
O Data Warehouse (DW) se trata da mais importante tecnologia existente no desenvolvimento de soluções de Business Intelligence (BI). Ela é a base para o
armazenamento das informações necessárias para a utilização por gestores e analistas na tomada de decisão. O DW possui estrutura e características que
suportam análise de grandes volumes de dados.
 
Em um Data Warehouse a modelagem multidimensional se torna muito importante. Assinale a alternativa CORRETA sobre modelagem multidimensional. 
A)  A modelagem multidimensional tem como objetivo melhorar a integridade, sendo mais e�ciente do que o emprego das formas normais. 

B)  A modelagem multidimensional é uma técnica de modelagem de bancos de dados que se destina a apoiar as consultas realizadas pelo usuário �nal em
um Data Warehouse. 
C)  A modelagem multidimensional tem como objetivo diminuir o espaço em disco ao máximo. 
D)  A modelagem multidimensional tem como objetivo otimizar as transações em banco de dados .
9
10
11
12
13
Modelagem dimensional é uma das técnicas e conhecimentos mais utilizadas e mais importantes para modelar o Data Warehouse. Até para utilizar
ferramentas, na parte de modelar os metadados ou cubos OLAP, você vai precisar entender de modelagem dimensional, a não ser que você utilize outro tipo de
arquitetura de modelo de dados. Existem dois tipos de metodologias de modelagem de dados usadas no Data Warehouse, a Snow�ake e a Star Schema, que é
a mais utilizada.
 
Selecione a alternativa CORRETA que contenha os principais componentes do modelo multidimensional. 
 A)  SGBD e SQL. 
B)  Corpus data e data lake.
C)  Tabelas de fato, as tabelas com dimensões e as métricas. 
D)  Data Warehouse e Data Marts.
Em ambientes de Data Warehouse, nos quais se têm as análises como principal objetivo, serão realizadas operações OLAP (Online Analytical Processing –
Processamento Analítico On-line). De maneira simples, OLAP é a capacidade do sistema processar os dados analiticamente, explorando a
multidimensionalidade do banco de dados em que os dados estão armazenados. O foco da realização de operações OLAP é o processamento on-line de
dados com foco em análise para tarefas de tomada de decisão.
 
No que se refere a estas implementações, elas podem ser ROLAP, MOLAP e HOLAP. Selecione a alternativa CORRETA sobre o HOLAP. 
A)  Esse tipo de OLAP não se refere à implementação do armazenamento, mas à distribuição de dados. Essa abordagem tem como objetivo otimizar as
consultas através do armazenamento no computador do usuário. 
B)  Nessa implementação especí�ca para a multidimensionalidade, para este �m e para isto armazenam e executam operações diretamente sobre uma
matriz de dados. 
C)  Partindo do nome, nessa implementação, o servidor para manipular os dados será implementado utilizando um sistema gerenciador de banco de dados
relacional.

D)  Os servidores HOLAP adotam uma forma de armazenamento em dois níveis, um para dados densos, que são colocados em matrizes e outro para dados
esparsos, que são alocados em tabelas. Ou seja, torna-se uma aplicação robusta integrando tanto matrizes quanto tabelas armazenando o modelo
multidimensional, o que demanda um maior requisito de equipe para desenvolvê-lo. 
Quando tratamos de análise de dados, é muito difícil que o termo business intelligence não apareça, a�nal, faz parte do coração da análise de informações.
 
No que se refere ao business intelligence, assinale a alternativa correta: 
A)  Business Intelligence, ou Inteligência de Negócio, é uma ferramenta que tem origem na administração de empresas a partir de análise SWOT.

B)  Business Intelligence é uma metodologia pela qual se estabelecem ferramentas para obter, organizar, analisar e prover acesso às informações
necessárias aos tomadores de decisão das empresas para analisarem os fenômenos acerca de seus negócios 
C)  Business Intelligence é uma ferramenta, um software utilizado para que gestores tomem decisões baseado em tomadade decisão. 
D)  Business Intelligence compõe a etapa de ETL de um Data Warehouse, sendo uma importante ferramenta para isso. 
A startup do Data Warehouse, Yellowbrick Data, levantou US $ 81 milhões em uma série C de �nanciamento liderado pela DFJ Growth, com a participação do
braço de VC da Alphabet, Menlo Ventures, Third Point Ventures, DFJ Growth, BMW i Ventures, IVP, Next47 e Threshold Ventures. O mercado mundial de data
warehousing teria gerado mais de US $ 18 bilhões em 2017, um número que deve crescer para quase US $ 35 bilhões até 2025, segundo a Allied Market
Research. Isso parece estar impulsionando o recente aumento nos investimentos em data warehousing.
 
Sobre Data Warehouse, selecione a alternativa CORRETA: 
A)  São fatos e números que transmitem algo especí�co, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se
dizer que dados são a informação de uma maneira bruta. 

B)  São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por
aplicações de tomada de decisão. 
C)  São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O DW é responsável por fazer a interface entre os dados
com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade.
D)  Surgiram nos anos 2000, a partir da ascensão de grandes empresas da internet como Amazon e Google, que cada vez mais produziam dados
gradativamente, tendo a necessidade de escalabilidade em escrita e principalmente leitura de dados após o aumento de tecnologias voltadas à nuvem. 
Em um cenário de análise de dados a primeira etapa é a coleta, a segunda é a preparação e por último o armazenamento que permite futuras análises. A última
camada é composta geralmente por ferramentas de Dashboard.
14
15
16
17
18
Uniasselvi © 2021
 
Sobre Dashboards, selecione a alternativa correta: 

A)  Sua tradução literal, painel, trata exatamente do que é. Por exemplo, em um cenário corporativo um Dashboard tem o mesmo objetivo de um painel de
voo: mostrar tudo que está acontecendo em uma organização. 
B)  Dashboard são ferramentas utilizadas para armazenar dados em ambientes de Data Warehouse. 
C)  Dashboards são ferramentas de mineração de dados que não dependem de um Data Warehouse para serem utilizadas.
D)  Dashboard é onde acontece o L (Load) de uma etapa de ETL. 
As métricas são as medidas brutas, atômicas e de simples composição. Em uma estrutura de data warehouse são armazenados na tabela Fato e medem os
descritivos salvos nas dimensões. Valores e quantidades são exemplos de formatos das métricas. Os indicadores de desempenho são medidas calculadas e
são compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade observada. 
 
Selecione a alternativa correta que contenha um exemplo de indicador de desempenho 
A)  Quantidade de itens X.
B)  Percentual de itens. 
C)  Percentual de itens X vendidos em março de 2014.
D)  Quantidade de Vendas. 
O estudo “A Universe of Opportunities and Challenges”, desenvolvido pela Consultoria EMC, aponta que de 2006 a 2010 o volume de dados digitais gerado
cresceu de 166 exabytes para 988 exabytes. Assim, existe a perspectiva de que o volume de dados alcance a casa dos 40.000 exabytes, ou 40 zettabytes (ou
40 trilhões de gigabytes). Sendo a maioria desses dados não estruturados e semiestruturados.
 
No que se refere aos tipos de dados, as imagens são: 
 A)  Dados semiestruturados. 
B)  Dados do tipo NoSQL.
C)  Dados estruturados. 
D)  Dados não estruturados. 
19
20
Voltar

Mais conteúdos dessa disciplina