Conheça os principais tipos de análise de dados através de exemplos práticos

Conheça os principais tipos de análise de dados através de exemplos práticos

A escolha entre os tipos de análise de dados pode ser o fator decisivo para que eles realmente cumpram o seu papel - ativos valiosos às empresas.

Neste universo, nem todas as análises são iguais e a mais adequada é a que trará realmente valor, dentro de uma estratégia de negócios.

Neste artigo, nosso coordenador dos cursos de Dados, Ivan Pagnossin explica cada uma delas, com exemplos práticos. Acompanhe!

Análises de dados - a motivação primordial

De modo geral, entende-se que analisar dados é empregar o raciocínio crítico, idealmente sem vieses, sobre um conjunto de dados, com o objetivo de extrair conhecimento. Esse "conhecimento", que refere a uma representação abstrata (mental, por exemplo) do fenômeno que deu origem a esses dados.

Para ficar mais fácil de assimilar, um exemplo: o astrofísico analisa o movimento dos astros e generaliza suas descobertas num conjunto de leis da natureza. Já o engenheiro submete suas criações a cenários controlados e cria uma representação computacional que lhe permita identificar o regime de atuação delas.

Finalmente, o empreendedor avalia o desempenho do seu negócio e apreende as relações já consumadas entre investimento e receita para planejar sua estratégia.

Em cada caso, as motivações são diferentes. O astrofísico visa compreender o universo; o engenheiro, prever o comportamento da sua criação; e o empreendedor quer tomar decisões que garantam o sucesso do negócio.

Ou seja, nem todas as análises são iguais. É comum classificá-las em quatro tipos de metodologia: descritiva, diagnóstica, preditiva e prescritiva.

Conheça os tipos e como fazer uma boa análise de dados

Abaixo, acompanhe as quatro formas de análises de dados, mas lembre-se: essa ordem não é arbitrária. Ela compreende a complexidade e, num cenário econômico, o valor de cada uma.

Análise descritiva

Como o nome diz, essa análise descreve os dados observados, de forma que eles “digam” o que aconteceu. Por vezes, é chamada de "estatística descritiva", já que é comum utilizar métodos da estatística nesse tipo.

Por exemplo, você pode descrever os acessos ao seu site de vendas, no intervalo de uma hora, pela média de usuários que visitaram o site nesse mesmo intervalo de tempo. A média é um conceito emprestado da estatística, bastante útil para descrever dados.

A análise descritiva é, portanto, o tipo de análise mais simples e rápida de executar, pois emprega apenas cálculos padronizados (que podem ser automatizados), como a média, variância, entre outros, além de gráficos, diagramas etc.

Essas visualizações, originadas da análise descritiva, são a principal matéria-prima dos dashboards de indicadores-chave de desempenho (em Inglês, Key Performance Indicator ou apenas KPI).

Análise diagnóstica

Conhecidas as características dos dados, imediatamente vem a pergunta: qual a causa desses dados? A resposta a essa pergunta é justamente o objetivo da análise diagnóstica.

Porém, realizar esse passo extra não é simples, pois ele se relaciona com a dinâmica subjacente aos dados, frequentemente não acessível. Por exemplo, o fato de você observar 1000 usuários, em média, acessando seu site no intervalo de uma hora, pode estar relacionado com a depreciação média do produto que você vende, com a quantidade de concorrentes, com seu programa de fidelidade, fenômenos sociais etc.

Para mensurar esses “possíveis” relacionamentos, precisamos novamente emprestar métodos da estatística, como os testes de hipótese, além do método científico. O teste A/B, por exemplo, é bastante conhecido: consiste em expor a dinâmica subjacente aos dados a cenários controlados.

Por exemplo, você pode oferecer o programa de fidelidade para alguns usuários (cenário A), mas não para outros (cenário B), e comparar a média de acessos. Além de ser trabalhoso fazer isso, há situações que não podem ser controladas, como a quantidade de concorrentes e a depreciação média do produto.

É nesse cenário que surge o bordão "correlação não implica causalidade": correlação é uma característica dos dados (uma métrica de associação, por assim dizer). Mas ela não pode ser imediatamente associada a uma causa, sem uma análise diagnóstica adequada, que envolve a manipulação de cenários controlados.

Não obstante, essa análise requer conhecimento do domínio em questão. Por exemplo, uma análise cega quanto ao domínio (um e-commerce, nesse exemplo) pode deixar passar o fato de que as visitas ao site dependem do clima.

Análise preditiva

Se entendemos a dinâmica subjacente aos dados, possivelmente seremos também capazes de fazer previsões. E esse é o objetivo da análise preditiva.

Para isso, precisamos abstrair do que aconteceu e pensar no que poderia acontecer, relacionando as causas e os efeitos (dados). Chamamos isso de "modelo" e ao processo de encontrá-lo, "modelagem".

Suponha, por exemplo, que seus dados permitam a afirmação de que a quantidade média de visitantes do site, no período de uma hora, depende linearmente do custo de cada ponto do programa de fidelidade. A palavra-chave, nesse exemplo, é o termo "linearmente" (nesse caso, se diz que o modelo é linear).

Ele indica que um acréscimo de, digamos 30% no custo de um ponto, implica decréscimo de 30% na quantidade média de visitantes, no mesmo intervalo de tempo.

Perceba que essa afirmação não se refere mais ao conjunto de dados originais, mas sim a uma situação hipotética genérica. Assim, é essa qualidade que nos permite fazer previsões.

Um exemplo bem conhecido de análise preditiva é aquela que os bancos fazem ao identificar riscos de investimento, quando o empréstimo efetivamente não foi feito, mas o modelo desenvolvido pelo banco é capaz de prever o resultado.

Contudo, essa previsão nem sempre se concretiza. Grande parte do trabalho do analista de dados é justamente otimizar essa incerteza.

Análise prescritiva

Agora que sabemos descrever os dados, entendemos o porquê de eles apresentarem essas características, criarmos uma representação abstrata deles, capaz de prever um cenário hipotético, podemos então pensar no processo inverso e introduzir objetivos a serem alcançados.

Suponha que estejamos no final de uma campanha de marketing, na qual é preciso aumentar 15% a quantidade média de visitas no site. Como sabemos que essa quantidade se relaciona linearmente com o custo de um ponto de fidelidade, podemos optar por reduzir o custo em 15%. Isso é uma prescrição do que fazer, com base na modelagem e nos objetivos a serem atingidos.

Outro exemplo, fora do mundo dos negócios, é o dos sistemas de controle da SpaceX, que analisam continuamente o movimento do foguete, para prescrever ações de seu motor. Este trabalho tem o objetivo de trazê-lo em segurança para o solo.

Essa é a análise prescritiva e, como você já deduziu, é a etapa mais complexa, pois demanda conhecimento profundo sobre o sistema.

Análise de dados: curso

Neste texto, nosso professor deixa claro como as análises descritiva, diagnóstica, preditiva e prescritiva evoluem, nessa ordem, em complexidade e valor, e dependente uma da outra.

O que evidencia: nesta área, não há atalho. O primeiro e mais certeiro passo é aderir à cultura de dados. Depois, ser capaz de descrevê-los através do storytelling com dados.

Somente assim, é possível passar para a análise diagnóstica e, daí, para as demais etapas, na sequência. Lembrando que a implementação dessa cadeia de valor deve ser guiada por uma estratégia que segue o caminho inverso.

Neste sentido, as perguntas pertinentes são:

Que conhecimento (relações de causa e efeito) preciso ter dos meus dados, para prescrever ações (tomar decisões)?

Que abstrações (modelagem) eu tenho de desenvolver para fazer previsões? Que cenários devem ser promovidos para entender a dinâmica subjacente aos meus dados? Que características desses dados eu necessito avaliar?

Quer compreender mais sobre o assunto e se aprofundar sobre as possibilidades que os dados podem projetar a sua carreira? Conheça os cursos para ser um profissional de Dados, oferecidos pela Digital House, no qual Ivan Pagnossin coordena.