Déterminer les seuils à risque pour du Churn Analysis binaire en Data Mining

L’analyse du Churn ou de l’attrition d’une base de clients est un problème connu, surtout rencontré dans les industries entretenant une relation d’abonnement avec leur utilisateur: médias, telecom, assurances. En revanche on le retrouve insuffisament cité dans les applications concrètes du mining, alors qu’il est un de ses aspects les plus intéressants. Le principe, comme souvent en statistiques ou en Data mining est assez simple: étudier l’évolution de la base client au jour J dans les jours/mois/années suivantes pour être en mesure d’imaginer si un client donné sera oui ou non amené à cesser sa relation avec la société.

La question semble donc en premier lieu binaire. En réalité personne n’est intéressé par le fait qu’un client résiliera un jour son abonnement: à terme tout le monde le fera contraint ou forcé ! Il y a donc un fort aspect temporel: la vraie question est donc plutôt:

Un client présent depuis t jours quittera-t-il la base avant d’avoir atteint t+n?

Le principal problème business est de déterminer ce n. De préférence il doit s’agir d’une date importante dans la vie du client: seuil de rentabilité, fin d’une promotion… On peut aussi le déterminer en analysant l’évolution de la base client existante pour déterminer les n intéressants.

La variable t de ma question est appellée dans la littérature – anglo-saxonne comme souvent – la tenure: c’est la période de temps depuis laquelle le client est en relation avec la société. Grâce à cet indicateur on peut analyser l’évolution d’une population inscrite au jour J.


Il est parfaitement logique que cette courbe ait une allure asymptotique vers 0: à terme tous les clients inscrits en J résilieront… C’est l’aspect commun de toute base de clients. Mais on peut aussi avec cet indicateur, « photographier » la base comme étant constituée d’une multitude de tenure différentes de cardinalités diverses, dont l’analyse peut révéler des tenures à risque qui aideront à trouver les bons modèles à construire. En calculant pour chaque tenure le risque, c’est à dire la proportion de personnes ayant atteint cette tenure avant de résilier, qui se calcule comme-ceci:

C’est l’ensemble des personnes de tenure t ayant résilié sur l’ensemble des personnes de tenure >t (ayant « survécu à la tenure t »).

On obtient une courbe, très intéressante, pouvant avoir cette allure:


Ici on voit l’allure générale des résiliations:

  • Au bout de 60 jours d’impayés dans cette société, le contrat est résilié: le pic à 60 est donc du au clients n’ayant jamais payé
  • Au bout de 90 jours c’est la fin de la promotion sur le forfait: ce second pic correspond aux personnes résiliant avant le passage au prix maximum.

On comprend donc que l’analyse du risque par tenure permet de diagnostiquer des passages risqués, et donc de construire des modèles de mining binaires, répondant à la question de la survie à certains intervalles: T60 ou T90 ici.

A bientôt!


PS: Cependant il est important de concevoir que ces deux steps concernent en réalité deux directions assez diamétralement opposées:

  • la direction financière, qui souhaitent limiter l’attirance exercée par la société sur de potentiels mauvais payeurs, d’où l’intérêt de prédire la population résiliant à T60.
  • les directions commerciale et marketing, qui souhaitent elles conserver le plus possible leur base client et vérifier l’impact des campagnes et donc souhaitent utiliser les résultats de modèles du type de T90 ci-dessus.

Cette distinction entre churn « subi » et churn choisi est importante car on adresse par essence des domaines fonctionnels diamétralement opposés, et des problématiques antagonistes.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s