A utilização de dados, para a tomada de decisões, não é uma novidade no mundo dos negócios. Usamos esse recurso para avaliar o desempenho e projetar estratégias, de modo que produtos e serviços tenham sucesso. O que mudou recentemente foi o fato de acelerarmos a forma e a velocidade de como as análises preditivas são feitas.
O que é a análise preditiva?
Trata-se de uma série de técnicas, com base em cálculos estatísticos, como de regressão linear, entre outros modelos, que existem antes da utilização das tecnologias que temos à disposição hoje. A junção dessas fórmulas, com linguagens de programação, bibliotecas de inteligência de dados e teorias computacionais importantes, levou-nos a outro patamar, pois é possível a utilização do aprendizado de máquina e mineração de dados, para analisar, de modo mais eficiente, dados históricos e realizar previsões de eventos futuros.
Hoje, você pode captar os dados de acessos do seu site e jogá-los em um dashboard no Google Data Studio, por exemplo. Ao realizar a análise desses números, certamente você encontrará padrões, tendências, sazonalidades e muito mais. Aliás, essa ferramenta é ótima para isso. Mas como eu faço para ir além?
Na verdade, quando olhamos para os números do passado, é como se olhássemos para o retrovisor. É lógico que esses números podem nos dizer sobre os padrões do nosso negócio – e as análises preditivas partem disso – e sobre as decisões que precisamos tomar. Contudo, uma previsão matemática, com base em nossa realidade, também é importante.
Python e R para ciência de dados
Hoje é comum, na comunidade de Data Science, os profissionais falarem muito sobre duas grandes ferramentas para a realização de previsões: o Python e o R. Duas linguagens de programação poderosas, com recursos excelentes para a construção de modelos e obtenção de tendências.
Eu uso muito o Python, pois já conhecia e estudava a linguagem; e também sempre achei que seria mais fácil integrar as aplicações de dados com outras, uma vez que cresce, cada vez mais, o número de pessoas que programam em Python no Brasil.
Com frequência, eu uso algumas bibliotecas como: Matplotlib, IPython, NumPy, SimPy, Pandas, Scikit-learn e Beautiful Soup. O Matplotlib, por exemplo, é uma excelente biblioteca, com diversos recursos e funções prontas, que ajuda na criação de variados tipos de gráficos. Assim, depois de cálculos e comparativos, é muito simples visualizar os dados em histogramas, gráficos de dispersão, entre outros.
Também uso muito o R, uma vez que, suas características voltadas para matemática e estatística ajudam muito na hora de realizar previsões.
Algoritmos para análise preditiva.
Em modelos temporais, — dias, meses e anos — um recurso que utilizo muito são os modelos treinados com ARIMA. Nesse caso, o modelo é ajustado aos dados da série temporal para entender seus dados e prever pontos futuros em sua série. Por meio desse modelo, é possível prever pontos em uma série temporal e fazer ajustes em sua estratégia. Também podemos usar o holt-winters e outros algoritmos de regressão linear, para obter previsões.
A grande sacada aqui não é a previsão, mas sim a revisão. Treinar uma máquina por intermédio de modelos e suas previsões. Pense que você precisa construir um sistema de feedback para avaliar a eficiência das previsões, de modo que a inteligência possa melhorar o modelo.
A análise preditiva pode ser usada também para a classificação, pois através de algoritmos preditivos é possível determinar, por exemplo, informações sobre amostras para o controle de qualidade de um produto.
O sistema deve ser baseado em três princípios: captação de dados, análise preditiva, e aprendizado supervisionado; um trabalho de classificação dos dados, em que serão analisados e categorizados, para que exista o aprendizado.
Quais os setores do mercado podem se beneficiar da análise preditiva?
Previsões estatísticas podem ser aplicadas, com seus devidos ajustes e customizações de modelos, para todos os cenários necessários. Atualmente, existem algumas áreas de negócios se beneficiando e aproveitando muito bem das tecnologias disponíveis.
- Marketing — a análise preditiva é muito usada para análise de mercado, ainda mais, naqueles onde a competição é maior. Segundo o professor Marcus (2021, p.103) em seu livro “Simplificando big data em 7 capítulos“, podem surgir perguntas sobre o que os clientes gostam, quais os concorrentes, as tendências, entre outras. Através dos dados de marketing é possível responder estas perguntas, além disso, também prever cenários para diversos mercados, por exemplo: tendências de preço, de vendas e quais as melhores épocas para realizar promoções.
- Varejo — direcionamento de campanhas, melhores locais para venda, quais os preços mais praticados, entre outras informações importantíssimas para o gestor.
- Setor público — informações sobre população, distribuição de recursos, acima de tudo, a antecipação de problemas (precisamos evoluir muito nessa parte ainda).
- Saúde — informações sobre onde será necessária a maior distribuição de insumos, vacinas, remédios, previsão de epidemias, e nesse sentido, os locais onde ocorrerão.
- Segurança — previsões acerca do índice de criminalidade, locais e prevenção.
- Indústria — controle de qualidade, engenharia, aumento de produção, previsão de vendas.
Conclusões.
Todo negócio tem suas particularidades. É importante considerar suas ocorrências – sazonais, aleatórias, etc – em seus estudos. Um modelo que avalie só a série temporal, com seus padrões, mas sem recorrer a outros dados, pode incorrer em grandes erros. O que eu quero dizer aqui? Que ao analisar uma variável, entender a correlação de outras e quais os eventos que podem influenciar as mudanças, é necessário realizar um treinamento do sistema, para considerar eventualidades e características do recorte que está sendo analisado.
Ao partir para uma lógica, em que você capta os dados, analisa e prevê, as chances, de algumas decisões se transformarem em sucesso no futuro, aumentam, pois ao olhar para os números, você não toma mais decisões baseadas em intuições, mas sim em fatos e em modelos consolidados de análises.
Referências.
ALVES, E. B. Sistemas de informações em marketing: uma visão 360º das informações mercadológicas. Curitiba: Intersaberes, 2018.
CARDOSO, V.; CARDOSO, G. Sistema de banco de dados. São Paulo: Saraiva, 2012.
ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. 7. ed. São Paulo: Pearson Education do Brasil, 2018.
LAUDON, K. C.; LAUDON, J. P. Sistemas de informações gerenciais. 7. ed. São Paulo: Prentice Hall, 2007.
PINTO, Marcus Vinícius. Simplificando big data em 7 capítulos. 2021. Acessado em: junho de 2022.
SNOWDEN, D. J.; BOONE, M. E. A Leader’s Framework for Decision Making. Harvard Business Review, nov. 2007. Disponível em: https://hbr.org/2007/11/a-leaders-framework-for-decision-making.
YANAZE, M. H. Gestão de marketing e comunicação: avanços e aplicações. 2. ed. São Paulo: Saraiva, 2011.