Screenshot da introdução do The DW Toolkit, 2a. Edição.
Screenshot da introdução do The DW Toolkit, 2a. Edição. Os destaques em amarelo são meus.

Repararam nos destaques em amarelo na figura acima? Eu demorei uns anos para entender o que estava escrito. Se você entendeu, vai ler algo mais ou menos assim:

Modelagem Dimensional é o padrão de facto para APRESENTAÇÃO de dados para o cliente. E também é a única arquitetura para sistemas de DW DISTRIBUÍDOS.

Que raios é distribuído? Como eu levei uns dois anos para perceber isso? Kimball nunca disse que Modelagem Dimensional era a melhor ferramenta para desenhar DWs. Ele disse muitas coisas, mas essa ele nunca disse! Nem escreveu (espertinhos…)

Como foi que eu nunca notei? Acho que eu não estava querendo ver o óbvio.

Desde que comecei a ler o livro do Hans Hultgren, Modeling the Agile Data Warehouse with Data Vault, aprendi algumas coisas. Primeiro, hub pode ter chave de negócio composta – nem fazia idéia. Segundo, link precisa relacionar coisas no menor grão possívl (grosso modo, é mais complexo que isso.) Mas o mais importante, de longe, foi a prova definitiva da necessidade do Data Vault.

Eu sempre me debati com a idéia – sempre há o risco de ser só uma moda, o mais novo brinquedo etc. Eu nunca dormi tranquilo. E se eu estiver errado? E se eu levar outros a cometer o mesmo erro? Seria ruim estar errado, mas causar a ruína de outrem, levar uma empresa a um caminho furado, bom, seria o meu fim como profissional.

Eu acreditava estar certo, mas sempre foi uma aposta com riscos calculados.

Não mais – agora eu tenho certeza que DV é uma peça importante, central. E por um motivo óbvio, que eu mesmo já havia destacado aqui. Eu só não tinha um argumento mais sofisticado para apresentar, tinha apenas minha própria intuição.

O argumento do Hultgren tem a simplicidade dos gênios: cada necessidade tem uma solução adequada.

  • Para atender a necessidade de sistemas transacionais de realizar muitas transações pequenas, em pouco tempo, usamos a 3NF (Terceira Forma Normal);
  • Apresentar dados para o usuário final explorá-los, de maneira fácil e intuitiva, é melhor feito com um Modelo Dimensional;
  • Acumular os dados da empresa ao longo do tempo, para poder recuperar qualquer campo, de qualquer assunto, a qualquer momento – construir um EDW – não pode ser bem resolvido usando-se soluções que são boas para outros casos.

Isso mesmo: se a 3NF resolve bem os transacionais, e o Modelo Dimensional resolve bem a exploração analítica, como esperar que qualquer uma destas técnicas resolva um problema diferente destes dois?

É preciso um modelo de dados específico para a criação de EDW (DW Corporativo.) Uma das opções que cobre esse nicho é justamente o Data Vault.

E por isso, sem sombra de dúvidas, Data Vault é uma boa opção para EDW, enquanto que nem Modelagem Dimensional nem 3NF são adequadas para isso. Data Vault foi pensado para ser um modelo de dados de Data Warehouses – acúmulo de dados, não análise, nem transações.)

Paz, afinal.

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s