Data Science, Machine Learning e Taxa de Churn
A monetização de dados, regulada por termos e condições de privacidade bem definidos, é uma prática essencial para qualquer empresa que queira ser – ou continuar a ser – relevante no seu mercado. A interpretação de dados gerados pelas atividades diárias da empresa pode ser uma das formas menos dispendiosas de analisar ineficiências e problemas de performance. De facto, utilizar dados, e atuar sobre eles, deveria ser um procedimento habitual para qualquer empresa, que se queira manter à frente da concorrência. Muito provavelmente, tudo isto é um dado adquirido para todos os que trabalhem com dados. No entanto, admite-se que a importância deste tópico não seja tão evidente para alguém que não trabalhe nesta área. Para o evidenciar bastará uma contagem rápida do número de artigos publicados pela Forbes, ou pela Harvard Business Review, sobre monetização de dados e a sua importância para que se comprove que é uma tendência adquirida dentro do panorama empresarial.
Neste blogpost, iremos analisar um caso específico de como dados, combinados com técnicas de Data Science (DS) e algoritmos de Machine Learning (ML), podem ajudar uma equipa de gestão a compreender melhor o seu negócio e o comportamento dos seus clientes, ao estarem providos com mais e melhor informação no seu processo de tomada de decisões. Como o título desta publicação sugere, o seu âmbito será o churn de clientes e a forma como dados produzidos pela atividade de clientes o pode avaliar e detetar.
É por isso pertinente definir o que é o churn de clientes, como é medido, porque poderá ocorrer e o seu impacto numa empresa.
De acordo com a Investopedia, a taxa de churn de clientes é a taxa a que os clientes deixam de ter atividade com uma entidade. É frequentemente expressa como a percentagem de cancelamento de subscrições num determinado período de tempo. A associação mais óbvia deste conceito é a um modelo de negócio baseado em subscrições (SaaS), em que o cliente deixa de pagar uma subscrição recorrente. Contudo, o conceito também pode ser aplicado a outros modelos de negócio, quando um cliente frequente deixa de o ser.
É possível elaborar algumas razões óbvias para a cessação de atividade por parte de clientes: uma modificação drástica na situação financeira respetiva, melhores produtos concorrentes, uma costumer experience fraca (CX) ou expectativas não cumpridas. Tendo em consideração a atual pandemia, outra causa facilmente identificável é a falta de serviços online, especialmente relevantes durante o confinamento que alguns países experienciaram este ano.
Tendo tudo isto em consideração, é expectável que uma taxa de churn de clientes mais baixa beneficie todas as partes envolvidas numa transação: a empresa verá os seus lucros crescerem e a satisfação dos clientes será maior. Para além disso, é sabido que o custo de aquisição de novos clientes é tipicamente elevado, reforçando a necessidade que existe de se manter a taxa de churn o mais baixo possível.
A empresa Xyz, cujo modelo de negócio é baseado em subscrições, tem 5000 clientes subscritos ativos. A empresa define um cliente subscrito ativo como um cliente que tem mais do que uma transação mensal consecutiva. No mês passado, a empresa Xyz registou 125 cancelamento, ou seja uma taxa de churn de 2.5%
Uma equipa de gestão poderá querer ver respondidas várias questões quando é confrontado com altas taxas de churn. Algumas mais óbvias serão: qual foi o trigger? ou qual é o perfil típico dos clientes que estão a abandonar o serviço? O uso de técnicas analíticas avançadas provou que o churn de clientes resulta não de um, ou dois, eventos negativos, mas sim de uma sucessão de ocorrências num período de tempo. Como a Bain & Company confirma, é essencial perceber quais foram as root causes do abandono e qual a série de eventos representativa do percurso dos clientes a abandonar um serviço ou produto.
Presumivelmente a razão pela qual um cliente cessa atividade com uma empresa está implícita nos dados que descrevem a sua relação com a mesma. Algoritmos de Machine Learning são capazes de interpretar conjuntos de dados, distinguindo padrões relevantes de acordo com o objectivo pretendido. Neste caso para detectar um padrão relacionado com churn, poder-se-ia usar dados resultantes de transações, contratos, rentabilidade ou mesmo características demográficas de clientes. Uma das principais vantagens de utilizar algoritmos é o facto de revelar padrões sem vieses ou preconceitos pré-adquiridos. Padrões estes que poderão ser dificilmente detetados por product owners ou indivíduos com consideráveis conhecimentos de negócio.
Machine Learning é uma área da ciência da computação que recorre a modelos matemáticos avançados para identificar padrões e prever eventos. Genericamente, estes modelos são alimentados com dados para o efeito.
É possível traduzir o resultado destes modelos matemáticos em métricas interpretáveis através de diferentes abordagens algorítmicas, para que seja possível responder a perguntas especificas, como as em cima mencionadas.
Por exemplo, poder-se-ia computar uma probabilidade de churn para cada cliente. Este tipo de métrica aproxima-se de uma medida de similitude entre o cliente ativo X e o perfil típico de clientes inativos. Outra abordagem, focada em responder às duas ultimas perguntas referidas, passaria por construir um algoritmo capaz de identificar qual a série de eventos que leva ao churn de clientes.
É importante referir que estes dois exemplos de abordagens não precisam de ser desenvolvidos ou utilizados de modo disjunto. Poderá ter sentido usar mais do que uma métrica ou ter indicadores mais direcionados para o tipo de mercado em que uma empresa se insere, o tipo de dados que possui e gera e o próprio tipo de organização.
O objetivo de qualquer metodologia de Machine Learning usada neste contexto será sempre produzir informação relevante e acionável. Esta terá de ser específica, relativa a populações bem definidas e capaz de ser traduzida em ações financeiramente eficientes e eficazes. Este blogpost não tenciona debater maneiras de acionar esta informação, mas existem iniciativas simples de o fazer. É o caso de campanhas de marketing com alvos bem definidos, ou pequenas alterações numa UI. O resultado destas iniciativas poderá ser aferido se ocorrer uma diminuição na taxa de churn a curto e/ou médio prazo. No entanto, é de salientar que o sucesso destas experiências deverá ser medido também através de uma metodologia de A/B testing.
A influência direta de campanhas fará com que o comportamento do consumidor se altere, tal como a sua CX. Aliado a isto, tendências macro e micro económicas, alterações nas estratégias de competidores e outros fatores extrínsecos farão com que o padrão que evidencia o abandono de um cliente não seja estático ao longo do tempo. Em termos práticos, isto significa que um padrão detetado em ti será diferente do detetado em ti+período de tempo. Consequentemente, um algoritmo de Machine Learning terá de ser atualizado e mantido continuamente para que se possa manter relevante e influente nas decisões de negócio. Este fenómeno é denominado como concept drift e é bem conhecido na área de análise preditiva.
Data Science na Xpand IT
A unidade de Data Science da Xpand IT desenvolveu um processo baseado nas referências e nos standards da industria. Este guia ajuda-nos a minimizar a incerteza natural em projetos de Data Science, seguindo uma abordagem estruturada baseada em metodologias agile.
Um exercício simples, mas bastante interessante, seria aproximar o processo de Data Science a alguns dos pontos-chave mencionados ao longo deste blogpost:
– Viability Analysis:
- definir um objetivo e uma pergunta a ser respondida, por exemplo, quais são as séries arquetípicas de eventos que resultam em churn de clientes?;
- determinar que métricas são apropriadas, de acordo com o mercado, os dados disponíveis e a organização da empresa;
- estudar o impacto que o concept drift poderá ter no problema e como subtrair à solução;
- se necessário, desenhar uma metodologia de A/B testing para avaliar o outcome das ações previstas de executar.
– Modelling
- construir algoritmos capazes de detetar o padrão de churn.
– Deployment
- automatizar atualizações de modelos.
Pequena Conclusão
O use case aqui discutido deverá ser familiar a empresas cuja atividade se baseia no consumo de retalho ou em subscrição de serviços. Esperamos ter conseguido demonstrar de maneira sucinta porquê e como é que Machine Learning e Data Science poderão acrescentar valor a uma empresa que pretenda reduzir a taxa de churn de clientes. A unidade de Data Science é capaz de ajudar no desenvolvimento de use cases como este, em similares como Lifetime Value Prediction, ou noutros distintos de Manutenção Preventiva, Detecção de fraude, etc..
O nosso objetivo ao longo de um projeto passará sempre por gerar valor, focando-nos em perceber o negócio e ajudando a desenvolver e implementar a tecnologia necessária.