Prévia do material em texto
Modelagem Dimensional Aspectos Gerais Modelos multidimensionais tiram proveito dos relacio- namentos inerentes aos dados p/ preenchê-los em matrizes multidimensionais. 3 dimensões = cubo de dados agregados. Oferece diversas maneiras de realizar consultas em um Data Warehouse. Os dados podem ser consultados diretamente em qualquer combinação de dimensões. Muito mais simples do que seria necessário em um modelo de dados relacional. A técnica do giro ou rotação permite que o usuário mude a hierarquia ou orientação de um cubo de dados facilmente. A redundância no BD dimensional ajuda a melhorar o desempenho das consultas. OBS: a representação do cubo é apenas uma metáfora visual. As dimensões coexistem e são independentes. Não precisam ter o mesmo tamanho. + de 3 dimensões = hipercubo. Modelagem Relacional Modelagem Multidimensional Normalizado Baixa redundância Suporta mais atualizações Desnormalizado Alta redundância Suporta menos atualizações https://t.me/kakashi_copiador Modelagem Dimensional Tabelas Fato Dimensao Armazenam informações quantitativas p/ análise de dados. Medidas, métricas, fatos sobre um processo de negócio. Exemplo: Valor arrecadado com vendas de um produto X no RJ durante o mês de janeiro. Armazenam atributos ou dimensões de objetos contidos em uma Tabela Fato. Podem ser desnormalizadas e com hierarquia. Apresentam atributos qualitativos ou textuais (ex: nome, sexo, data de nascimento). Possuem chave primária que identificam unicamente seus registros. Exemplo: P/ que uma Tabela Fato armazene o valor arrecadado com vendas de um produto X no RJ durante o mês de janeiro, ela precisa ser “alimentada” por dados do produto, da localização e do período. Esses dados são armazenados em Tabelas Dimensões. Quando? O que? Onde? Quem? São normalizadas e sem hierarquia. Contém chaves estrangeiras que correspondem às chaves primárias das Tabelas Dimensão. Tem chave primária composta. Em geral, têm relacionamentos 1:N com as Tabelas Dimensão. O que está sendo medido nesse processo de negócio? Tabela Fato Tabela Dimensão 1 Chave Primária Atributo 1 Atributo 2 Atributo 3 Tabela Dimensão 2 Chave Primária Atributo 1 Atributo 2 Atributo 3 Tabela Dimensão 4 Chave Primária Atributo 1 Atributo 2 Atributo 3 Tabela Dimensão 3 Chave Primária Atributo 1 Atributo 2 Atributo 3 Dimensão 1 Dimensão 2 Dimensão 3 Dimensão 4 Fatos, dimensões e medidas são os 3 elementos básicos do modelo multidimensional. Medidas/Fatos aditivos: passíveis de serem somados em todas as dimensões. Medidas/Fatos Não-aditivos: não são passíveis de serem somados em nenhuma dimensão. Medidas/Fatos Semi-aditivos: passíveis de serem somados em apenas algumas dimensões. ~ De.no ME.- RJ.- RJ.- RJ.- LO.na JO.na qq.no https://t.me/kakashi_copiador FATO_VENDAS [FK] PRODUTO [FK] PERÍODO [FK] LOCALIZAÇÃO QUANTIDADE DIM_PRODUTO [PK] PRODUTO NOME DESCRIÇÃO CATEGORIA FABRICANTE DIM_LOCALIZAÇÃO [PK] LOCALIZAÇÃO PAÍS ESTADO CIDADE BAIRRO RUA DIM_PERÍODO [PK] PERÍODO DIARIO SEMANAL MENSAL TRIMESTRAL As chaves estrangeiras [FK] correspondem às chaves primárias das Tabelas Dimensão. A Chave Primária da Tabela Fato é COMPOSTA e a dimensão tempo sempre é parte integrante. As Chaves Primárias [PK] das Tabelas Dimensão compõem a Chave Primária da Tabela Fato. Modelagem Dimensional Tabelas Fato e Dimensao PK = Primary Key (Chave Primária): identifica e garante a unicidade do registro de uma tabela. FK = Foreign Key (Chave Estrangeira): usada p/ relacionamento com outra tabela. Consiste na Chave Primária da tabela referen ciada. Esclarecendo:÷ https://t.me/kakashi_copiador Modelagem Dimensional Esquemas Estrela Floco de Neve (Snowflake) Uma Tabela de Fato central conectada diretamente a várias Tabelas de Dimensão em um relacionamento 1:N. Uma única tabela p/ cada dimensão. Tabelas de Dimensão desnormalizadas. Tabelas de Fato normalizadas. Consultas mais simples e mais rápidas. Manutenção mais difícil. Uma Tabela de Fato central conectada a várias Tabelas de Dimensão, sendo possível haver várias tabelas para cada dimensão. Quando uma ou + tabelas são decompostas p/ evitar redundância (são normalizadas). Nem todas as Tabelas de Dimensão estão ligadas diretamente à Tabela de Fato. Consultas mais complexas e mais lentas. Manutenção mais fácil. Nem todas precisam ser. Se normalizadas, ocupam menos espaço e são hierarquizadas. FATO_VENDAS DIM_LOCALIZAÇÃO [PK] LOCALIZAÇÃO ESTADO CIDADE BAIRRO DIM_PRODUTO [PK] PRODUTO NOME FABRICANTE CNPJ_FABRICANTE DIM_PERÍODO [PK] PERÍODO DIARIO MENSAL SEMESTRAL DIM_CLIENTE [PK] CLIENTE NOME TELEFONE EMAIL[PK] PRODUTO [PK] CLIENTE [PK] LOCALIZAÇÃO [PK] PERÍODO FATO_VENDAS DIM_LOCALIZAÇÃO [PK] LOCALIZAÇÃO ESTADO CIDADE BAIRRO DIM_PRODUTO [PK] PRODUTO NOME [FK]FABRICANTECNPJ_FABRICANTE DIM_PERÍODO [PK] PERÍODO DIARIO MENSAL SEMESTRAL DIM_CLIENTE [PK] CLIENTE NOME TELEFONE EMAIL[PK] PRODUTO [PK] CLIENTE [PK] LOCALIZAÇÃO [PK] PERÍODO DIM_PRODUTO [PK] FABRICANTE NOME TIPO Se.no SO.no VO-mo Je .net.- LO.no Ele. -14.- 1H.- AH.no AH .no/H.mkEe.m- Ele.no Lo. -14.- LO.no Do.no https://t.me/kakashi_copiador Modelagem Dimensional OLAP Online Analytical Processing Conceito Conjunto de ferramentas de software que auxilia na tomada de decisões de gerentes e diretores de empresas, permitindo: acesso dinâmico a informações armazenadas nos sistemas corporativos. realizar cruzamento e análise de informações. em tempo real; e sob diversas perspectivas. consultas ad-hoc. Tudo isso sem complexidade, p/ que qualquer pessoa consiga manipular a ferramenta. Foco no nível estratégico. Lidam com BD Dimensionais, em geral estruturados em modelo dimensional. Dados sumarizados (alta glanularidade). Otimizado p/ quantidade massiva de dados. Dados históricos e não-voláteis. Executado de forma mais lenta. Características Tipos de Armazenamento ROLAP Relational OLAP Dados armazenados em um BD relacional são apresentados ao usuário em uma visão multidimensional. Uma camada intermediária “traduzirá” as operações. MOLAP Vantagem: alta escalabilidade. Desvantagens: baixo desempenho e é limi- tado às operações possíveis com SQL. Multidimensional OLAP Dados armazenados em um BD multidimen- sional otimizado (MDDB) são apresentados ao usuário em uma visão multidimensional. Não necessita de tradução. HOLAP Hybrid OLAP P/ informações mais sintéticas, utiliza cu- bos dimensionais p/ desempenho + rápido. P/ informações mais detalhadas, utiliza o banco de dados relacional p/ permitir alta escalabilidade. Vantagem: alto desempenho. Desvantagens: exige alto investimento e possui baixa escalabilidade. Combina características do MOLAP e do ROLAP. https://t.me/kakashi_copiador Modelagem Dimensional OLAP Online Analytical Processing Operações Drill Down Pivot Slice-and-Dice Drill Through Roll Up Drill Across Permite descer na hierarquia das dimensões, aumentando o nível de detalhes (reduzindo a glanularidade). Permite subir na hierarquia das dimensões, reduzindo o nível de detalhes (aumentando a glanularidade). Permite pular um nível intermediário dentro de uma mesma dimensão. Bairro Cidade Estado País Definição 1: Permite atravessar de uma informação contida em uma dimensão para uma contida em outra dimensão. Definição 2: Permite que o usuário exiba, em tempo de consulta, os detalhes dos dados não sumarizados a partir do modelo multidimensional. P/ Kimball: permite realizar consultas que envolvem + de 1 tabela fato. Slice = fatiar uma matriz multidimensional, fixando/selecionando o valor de apenas uma de suas dimensões. Dice = Extrair um subconjunto de uma matriz multidimensional, fixando/selecionando valores de mais de uma dimensão. Em geral, mantém a mesma pers- pectiva de visualização de dados. Em geral, muda a perspectiva de visualização de dados. Rotação Permite alterar uma hierarquia ou orientaçãodimensional p/ outra. https://t.me/kakashi_copiador