Cubo de Dados

Data warehouses e OLAP são baseados em um modelo de dados multidimensional. Este modelo visualiza os dados na forma de um Cubo de Dados, permitindo que os dados sejam modelados e visualizados em múltiplas dimensões \cite{Han:2005:DMC:1076797}. Dimensões são as perspectivas em relação a como os dados são armazenados. Por exemplo, uma loja de instrumentos musicais pode criar um data warehouse afim de manter de manter os registro de venda em relação as dimensões tempo, produto, filial e localização. Essas dimensões permitem manter o controle das vendas mensais dos produtos e os locais em que foram vendidos. Cada dimensão pode conter uma tabela que a descreve, chamada tabela de dimensão. Para a dimensão produto, por exemplo, a tabela pode conter os atributos produto, marca e tipo.

Um modelo de dados multidimensional é normalmente organizado em torno de um tema central. Este tema é representado por uma tabela de fatos, que são medidas numéricas que mapeiam as relações entre as dimensões. A tabela de fatos contém os nomes dos fatos , ou medidas, bem como as chaves para cada uma das tabelas de dimensões relacionadas. Um cubo de dados em data warehouse não se prende em apenas 3 dimensões (3-D), ele pode assumir um caráter n-dimensional. Para melhor entendimento, suponha um cubo de dados simples 2-D, que na verdade não passa de uma tabela de representação dos dados. Em particular, considere os produtos vendidos pela loja de música na cidade de Ouro Preto, mostrados na Tabela \ref{proutosMusicais1} onde a quantidade de produtos está representado em milhares de reais. Nesta representação 2-D os dados estão representados de acordo com as dimensões tempo e produto. O fato ou medida exibido é a quantidade de produtos vendidos (em reais). Supondo a adição de uma nova dimensão onde os dados serão representados pelas dimensões, tempo, produto e localização (para as cidades de São Paulo, Rio de Janeiro, Salvador e Belo Horizonte). Essa nova representação pode ser expressa como uma série de tabelas 2-D, como mostrado na Tabela \ref{proutosMusicais2}. Conceitualmente a representação dos dados no formato 3-D é dada por um cubo. Ao adicionar uma quarta dimensão, visualização de uma estrutura correspondente começa a ficar inviável, porém, essa representação pode ser pensada como uma série de cubos 3-D. Seguindo esse raciocínio, a exibição de dados n-dimensionais pode ser expressa como uma série de cubos (n-1)-dimensionais.

|c|c|c|c|c|
tempo & Guitarra & Gaita & Teclado & Percussão
Trimetre1 & 45 & 1,6 & 23 & 33
Trimestre2 & 23 & 2 & 13 & 19
Trimestre3 & 27 & 1 & 16 & 11
Trimestre4 & 73 & 1,7 & 38 & 40

\label{proutosMusicais1}

Legenda da Imagem

Legenda da Imagem