Buscar

Prévia do material em texto

Modelagem
Dimensional
Aspectos Gerais 
Modelos multidimensionais tiram proveito dos relacio-
namentos inerentes aos dados p/ preenchê-los em
matrizes multidimensionais. 
3 dimensões = cubo 
de dados agregados.
Oferece diversas maneiras de realizar 
consultas em um Data Warehouse.
Os dados podem ser consultados diretamente 
em qualquer combinação de dimensões.
Muito mais simples do que 
seria necessário em um 
modelo de dados relacional.
A técnica do giro ou rotação 
permite que o usuário mude a 
hierarquia ou orientação de um 
cubo de dados facilmente.
A redundância no BD dimensional ajuda a 
melhorar o desempenho das consultas.
OBS: a representação do cubo é apenas uma metáfora visual.
As dimensões coexistem e são independentes.
Não precisam ter 
o mesmo tamanho.
+ de 3 dimensões = hipercubo.
Modelagem Relacional Modelagem Multidimensional 
Normalizado
Baixa redundância
Suporta mais atualizações
Desnormalizado
Alta redundância
Suporta menos atualizações
https://t.me/kakashi_copiador
Modelagem Dimensional
Tabelas
Fato
Dimensao
Armazenam informações quantitativas p/ análise 
de dados.
Medidas, métricas, fatos sobre um 
processo de negócio.
Exemplo:
Valor arrecadado com vendas de um produto 
X no RJ durante o mês de janeiro.
Armazenam atributos ou dimensões de objetos contidos em uma Tabela Fato.
Podem ser desnormalizadas e com hierarquia.
Apresentam atributos qualitativos ou textuais (ex: nome, sexo, data de nascimento).
Possuem chave primária que identificam unicamente seus registros.
Exemplo:
P/ que uma Tabela Fato armazene o valor arrecadado com vendas de um 
produto X no RJ durante o mês de janeiro, ela precisa ser “alimentada”
por dados do produto, da localização e do período.
Esses dados são armazenados em Tabelas Dimensões.
Quando? O que? Onde? Quem?
São normalizadas e sem hierarquia.
Contém chaves estrangeiras que correspondem às 
chaves primárias das Tabelas Dimensão.
Tem chave primária composta.
Em geral, têm relacionamentos 1:N com as Tabelas 
Dimensão.
O que está sendo medido 
nesse processo de negócio?
Tabela Fato
Tabela Dimensão 1
Chave Primária
Atributo 1
Atributo 2
Atributo 3
Tabela Dimensão 2
Chave Primária
Atributo 1
Atributo 2
Atributo 3
Tabela Dimensão 4
Chave Primária
Atributo 1
Atributo 2
Atributo 3
Tabela Dimensão 3
Chave Primária
Atributo 1
Atributo 2
Atributo 3
Dimensão 1
Dimensão 2
Dimensão 3
Dimensão 4
Fatos, dimensões e medidas são os 3 elementos 
básicos do modelo multidimensional.
Medidas/Fatos aditivos: passíveis 
de serem somados em todas as 
dimensões.
Medidas/Fatos Não-aditivos: não 
são passíveis de serem somados 
em nenhuma dimensão.
Medidas/Fatos Semi-aditivos: 
passíveis de serem somados em 
apenas algumas dimensões.
~
De.no
ME.-
RJ.-
RJ.-
RJ.-
LO.na
JO.na
qq.no
https://t.me/kakashi_copiador
FATO_VENDAS
[FK] PRODUTO
[FK] PERÍODO
[FK] LOCALIZAÇÃO 
QUANTIDADE
DIM_PRODUTO
[PK] PRODUTO
NOME
DESCRIÇÃO
CATEGORIA
FABRICANTE
DIM_LOCALIZAÇÃO
[PK] LOCALIZAÇÃO
PAÍS
ESTADO
CIDADE
BAIRRO
RUA
DIM_PERÍODO
[PK] PERÍODO
DIARIO
SEMANAL
MENSAL
TRIMESTRAL
As chaves estrangeiras [FK] 
correspondem às chaves primárias 
das Tabelas Dimensão.
A Chave Primária da Tabela Fato é 
COMPOSTA e a dimensão tempo 
sempre é parte integrante.
As Chaves Primárias [PK] 
das Tabelas Dimensão 
compõem a Chave Primária 
da Tabela Fato.
Modelagem Dimensional
Tabelas Fato e Dimensao
PK = Primary Key (Chave Primária): identifica e 
garante a unicidade do registro de 
uma tabela.
FK = Foreign Key (Chave Estrangeira): usada 
p/ relacionamento com outra tabela. Consiste na 
Chave Primária da tabela referen
ciada.
Esclarecendo:÷
https://t.me/kakashi_copiador
Modelagem Dimensional
Esquemas
Estrela
Floco de Neve (Snowflake)
Uma Tabela de Fato central conectada diretamente a 
várias Tabelas de Dimensão em um relacionamento 1:N.
Uma única tabela p/ cada dimensão.
Tabelas de Dimensão desnormalizadas.
Tabelas de Fato normalizadas.
Consultas mais simples e mais rápidas.
Manutenção mais difícil.
Uma Tabela de Fato central conectada a várias Tabelas de Dimensão, 
sendo possível haver várias tabelas para cada dimensão.
Quando uma ou + tabelas são decompostas p/ 
evitar redundância (são normalizadas).
Nem todas as Tabelas de Dimensão estão ligadas diretamente à Tabela de Fato.
Consultas mais complexas e mais lentas.
Manutenção mais fácil.
Nem todas 
precisam ser.
Se normalizadas, ocupam menos espaço 
e são hierarquizadas.
FATO_VENDAS
DIM_LOCALIZAÇÃO
[PK] LOCALIZAÇÃO
ESTADO
CIDADE
BAIRRO
DIM_PRODUTO
[PK] PRODUTO
NOME
FABRICANTE
CNPJ_FABRICANTE
DIM_PERÍODO
[PK] PERÍODO
DIARIO
MENSAL
SEMESTRAL
DIM_CLIENTE
[PK] CLIENTE
NOME
TELEFONE
EMAIL[PK] PRODUTO
[PK] CLIENTE
[PK] LOCALIZAÇÃO
[PK] PERÍODO
FATO_VENDAS
DIM_LOCALIZAÇÃO
[PK] LOCALIZAÇÃO
ESTADO
CIDADE
BAIRRO
DIM_PRODUTO
[PK] PRODUTO
NOME
[FK]FABRICANTECNPJ_FABRICANTE
DIM_PERÍODO
[PK] PERÍODO
DIARIO
MENSAL
SEMESTRAL
DIM_CLIENTE
[PK] CLIENTE
NOME
TELEFONE
EMAIL[PK] PRODUTO
[PK] CLIENTE
[PK] LOCALIZAÇÃO
[PK] PERÍODO
DIM_PRODUTO
[PK] FABRICANTE
NOME
TIPO
Se.no SO.no VO-mo
Je
.net.-
LO.no Ele.
-14.-
1H.-
AH.no AH
.no/H.mkEe.m-
Ele.no Lo.
-14.-
LO.no Do.no
https://t.me/kakashi_copiador
Modelagem Dimensional
OLAP
Online Analytical 
Processing
Conceito
Conjunto de ferramentas de software que auxilia 
na tomada de decisões de gerentes e diretores de 
empresas, permitindo:
acesso dinâmico a informações armazenadas 
nos sistemas corporativos.
realizar cruzamento e análise de informações.
em tempo real; e
sob diversas perspectivas. 
consultas ad-hoc.
Tudo isso sem complexidade, p/ que qualquer 
pessoa consiga manipular a ferramenta.
Foco no nível estratégico.
Lidam com BD Dimensionais, em geral 
estruturados em modelo dimensional.
Dados sumarizados (alta glanularidade).
Otimizado p/ quantidade massiva de dados.
Dados históricos e não-voláteis.
Executado de forma mais lenta. 
Características
Tipos de Armazenamento
ROLAP Relational OLAP
Dados armazenados em um BD relacional 
são apresentados ao usuário em uma visão 
multidimensional.
Uma camada intermediária “traduzirá” as 
operações. 
MOLAP
Vantagem: alta escalabilidade.
Desvantagens: baixo desempenho e é limi-
tado às operações possíveis com SQL.
Multidimensional OLAP
Dados armazenados em um BD multidimen-
sional otimizado (MDDB) são apresentados 
ao usuário em uma visão multidimensional.
Não necessita de tradução.
HOLAP Hybrid OLAP
P/ informações mais sintéticas, utiliza cu-
bos dimensionais p/ desempenho + rápido.
P/ informações mais detalhadas, utiliza o 
banco de dados relacional p/ permitir alta 
escalabilidade. 
Vantagem: alto desempenho.
Desvantagens: exige alto investimento e 
possui baixa escalabilidade.
Combina características do MOLAP e do 
ROLAP.
https://t.me/kakashi_copiador
Modelagem Dimensional
OLAP
Online Analytical 
Processing
Operações
Drill Down
Pivot
Slice-and-Dice
Drill Through
Roll Up
Drill Across
Permite descer na hierarquia das 
dimensões, aumentando o nível de 
detalhes (reduzindo a glanularidade). 
Permite subir na hierarquia das dimensões, 
reduzindo o nível de detalhes (aumentando 
a glanularidade).
Permite pular um nível intermediário 
dentro de uma mesma dimensão.
Bairro Cidade Estado País
Definição 1: Permite atravessar de uma informação contida 
em uma dimensão para uma contida em outra dimensão.
Definição 2: Permite que o usuário exiba, em tempo de 
consulta, os detalhes dos dados não sumarizados a partir 
do modelo multidimensional.
P/ Kimball: permite realizar consultas 
que envolvem + de 1 tabela fato.
Slice = fatiar uma matriz multidimensional, 
fixando/selecionando o valor de apenas
uma de suas dimensões.
Dice = Extrair um subconjunto de uma matriz 
multidimensional, fixando/selecionando valores 
de mais de uma dimensão.
Em geral, mantém a mesma pers-
pectiva de visualização de dados.
Em geral, muda a perspectiva 
de visualização de dados.
Rotação
Permite alterar uma hierarquia ou 
orientaçãodimensional p/ outra.
https://t.me/kakashi_copiador

Mais conteúdos dessa disciplina