data center

Data Warehouse: Cruzamento de Dados e Inteligência.

A quantidade de dados que uma empresa produz, nos dias de hoje, é imensa. Pense em cada processo, a quantidade de informações geradas: sobre movimentos, acontecimentos, resultados, números, entre outros.

O que ocorre é que muitos desses dados são perdidos no dia a dia. Se hoje a informação é um ativo da empresa, um bem, não utilizá-la ou mesmo ignorar a existência dela, é um grande desperdício.

Problemática dos vários sistemas que não se conversam.

Uma empresa é um organismo vivo, onde cada área atua como um órgão independente, tendo os seus próprios sistemas, metodologias e tentando integrar a sua operação com as outras áreas da companhia. O problema é que, às vezes, as características desses sistemas e informações não se conversam.

Quando uma organização pensa em desenvolver um novo sistema, geralmente: faz uma entrevista com os usuários, para determinar pontos importantes do processo; elabora um levantamento e análise de requisitos, para o futuro banco de dados, do que será esse novo software.

“Durante essa etapa, o projetista entrevista o possível usuário do banco de dados para entender e documentar seus requisitos de dados. O resultado dessa etapa é o registro conciso dos requisitos do usuário. Esses requisitos deveriam ser especificados em um formulário, da forma mais detalhada e completa possível. Em paralelo à especificação dos requisitos de dados, é útil definir os requisitos funcionais conhecidos da aplicação. Esses requisitos consistem em operações (ou transações) definidas pelo usuário que serão empregadas no banco de dados, incluindo as recuperações e atualizações.”

(ELMASRI; NAVATHE, 2018, p. 54)

O próximo passo é modelar esse banco de dados que receberá as informações passadas pelos usuários. Para um primeiro momento, pode ser representado por meio de notações gráficas (ELMASRI; NAVATHE, 2018, p. 56), diagramas de entidade e relacionamento. 

Através desse banco de dados será possível:

  1. Controlar as informações;
  2. Procurar padrões;
  3. Verificar possíveis anomalias; e
  4. Buscar informações sobre toda a movimentação mensal.

Esse é o modelo mais tradicional, estruturado, rígido.

Nem todos os dados têm a mesma estrutura.

Muitos vezes os dados oriundos de uma organização, não têm a mesma formalidade estrutural quanto outros. Por exemplo, projeta-se um sistema para controlar parte da operação (como apresentei anteriormente), mas em um âmbito mais aberto, informações estão sendo geradas em outras áreas, através de outros sistemas. Pense que dispositivos, cartões, parque tecnológico, processos, geram insumos (muitas vezes) não estruturados em um sistema.

Como muitas dessas informações não são estruturadas teriam que passar por um processo de ETL (extração, transformação, carregamento), antes de serem armazenadas ou cruzadas com outras informações da empresa. 

Onde entram os Data Warehouse nisso?

Um Data Warehouse é uma espécie de armazém de dados, eles podem guardar informações diferentes de várias fontes de dados da empresa, sejam elas estruturadas (banco de dados relacionais, etc) ou não (planilhas, documentos, etc). Eles possibilitam a análise de um grande volume de informações, cruzando os dados importantes para as tomadas de decisões.

Data warehouse
Data Warehouse recebendo informações de diversas origens diferentes.

Segundo Alves (018, p. 132), trata-se de um banco de dados especializado, que pode trabalhar com dados massivos, internos e externos. Eles também podem processar informações, e fazer parte dos sistemas de apoio à decisão da organização.

Com ele é possível cruzar informações financeiras, de marketing, operacional e outras que serão utilizadas para mineração, e assim, serão usados no business intelligence da empresa, para aproveitar todo o potencial ativo de conhecimento, gerado em suas operações. Será possível a descoberta de padrões, associações, mudanças e anomalias nos dados existentes (Yanaze, 2011, p. 281).

A mineração dos dados em conjunto com a análise histórica deles, mais algoritmos elaborados em R ou Python, elevará a capacidade preditiva para: o aumento de operação, faturamento, encontrabilidade de padrões e consequentemente possíveis problemas, resolvendo-os, mesmo antes que eles aconteçam.

Muitas vezes, nós olhamos para os indicadores como se estivéssemos observando um retrovisor. Essa mudança de paradigma possibilita olhar para o futuro, através de previsões estatísticas.

Por onde posso começar?

  • Para que dados sejam cruzados com informações de outras partes de uma empresa, será necessário utilizar uma arquitetura com base em uma tecnologia não estruturada (NoSQL, MongoDB, por exemplo), para enxergar a organização por meio de um prisma multidimensional: cruzar os dados, tirar informações estratégicas;
  • Organize os dados da sua empresa. Procure fazer um mapeamento de todo o “big data” gerado e saber onde estão os maiores ativos de dados, sistemas e processos que os controlam, informações importantes;
  • Você não precisa de um Data Warehouse para começar a produzir análises preditivas. Pode-se começar usando ferramentas como a linguagem R, por exemplo. Ela possui bibliotecas específicas para análise de dados e certamente algumas das suas fontes podem ser cruzadas por intermédio das rotinas e das bibliotecas do R; 
  • O resultado das suas pesquisa podem ser mostrados pelos dashboards em ferramentas como o PowerBI, da Microsoft, um ótimo programa para construção de relatórios e visualização de dados ou no Google Data Studio;
  • Procure por soluções prontas para começar a organizar seu armazém de dados. Microsoft, Oracle, IBM, entre outros, possuem excelentes serviços que poderão ajudar o seu projeto.

Referências.

ALEXANDRE, J.; CAVIQUE, L. NoSQL no suporte à análise de grande volume de dados. Revista de Ciências da Computação, n. 8, 2013. Disponível em: https://core.ac.uk/download/pdf/61423439.pdf.

ALVES, E. B. Sistemas de informações em marketing: uma visão 360º das informações mercadológicas. Curitiba: Intersaberes, 2018.

CARDOSO, V.; CARDOSO, G. Sistema de banco de dados. São Paulo: Saraiva, 2012.

ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. 7. ed. São Paulo: Pearson Education do Brasil, 2018.

LAUDON, K. C.; LAUDON, J. P. Sistemas de informações gerenciais. 7. ed. São Paulo: Prentice Hall, 2007.

SNOWDEN, D. J.; BOONE, M. E. A Leader’s Framework for Decision Making. Harvard Business Review, nov. 2007. Disponível em: https://hbr.org/2007/11/a-leaders-framework-for-decision-making.

YANAZE, M. H. Gestão de marketing e comunicação: avanços e aplicações. 2. ed. São Paulo: Saraiva, 2011. 

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *