- Anticiper pour une meilleure prévention
- Détecter les modes opératoires et les habitudes
- Catégoriser et corréler grâce à des profils anonymes
- Prédiction policière aux USA et en France
- PREDPOL, LE PRECURSEUR MADE IN USA
- PREDICTION A LA FRANÇAISE
- DES TRAVAUX EN EVOLUTION DANS UN CONTEXTE CONTRAINT
- Biographie de Laurent Cellier, auteur de l’article
Anticiper pour une meilleure prévention
Deveryware ambitionne d’aller au-delà des analyses sur le passé et de mettre à profit les données en masse collectées en temps réel par sa plateforme afin d’apporter une vision prédictive.
Pour l’enquêteur, anticiper à partir des expériences acquises est utile comme le souligne Patrick Perrot, Chargé de missions Stratégie de la donnée et intelligence artificielle, au service de la Transformation, Direction générale de la Gendarmerie Nationale :
En axant sur ce qui est utile pour l’enquêteur, il s’agit de montrer ce qui correspond à un rythme et mettre en exergue des moments particuliers qui sortent de ce rythme.
La détection de ces habitudes permettrait, à l’aide d’outils d’apprentissage automatique, la construction d’un modèle à finalité prédictive. S’en suivrait toutes opérations nécessaires à assurer la cohérence du modèle et en augmenter le niveau de réussite.
La nécessité de confidentialité et de sécurité impose un traitement
au sein des services des forces de l’ordre.
Ces impératifs doivent stimuler les méthodes de co-création entre les services de l’Etat et Deveryware, afin d’avancer efficacement, d’avoir accès à des données valides et en quantité suffisante. Cela permettrait aussi d’éprouver les raisonnements et les représentations directement auprès des utilisateurs.
*Perrot, P. (2017a). Disruption et révolution numérique: une nouvelle ère pour la sécurité. Securite globale, N° 11(3), 81-88.
Détecter les modes opératoires et les habitudes
La représentation des habitudes d’une personne permet de définir un attribut à partir d’une estimation probabiliste. Patrick Perrot rappelle : en ce qui concerne les considérations géographiques, il peut s’agir de coordonnées X,Y,Z mais aussi de caractéristiques de type place, rue, stade, cour d’école, hall… d’éléments sur le lieu (à savoir ce qu’il y a à proximité telle une gare…).
L’attribut peut être un fait ou une série de faits criminels de type meurtre mais aussi des infractions d’un autre type comme les cambriolages.”*
Un entretien avec Patrick Perrot en décembre 2020 fut l’occasion de décrire ce que pourrait être un profil dans le cadre d’une enquête judiciaire.
Considérant que la collecte massive de données personnelles puisse être autorisée par un juge, cela permettrait alors de pratiquer une analyse comportementale, en s’appuyant sur des outils de modélisation apparentés à l’intelligence artificielle.
Le profil pourrait être généré à partir d’un apprentissage supervisé afin de labéliser :
- les actions criminelles avec des critères tels que le mode opératoire,
- la géolocalisation,
- les habitudes de vie,
- la scène de crime,
- le profil psychologique…
Ces critères établiraient une probabilité de similarité avec de nouveaux suspects. Il pourrait aussi être fait usage de l’apprentissage non supervisé, avec des réseaux de neurones, qui permettrait d’automatiser la corrélation entre des faits, de faire des rapprochements.
La combinaison des analyses permettrait alors d’envisager les modes opératoires et de relier des groupes d’individus.
*Perrot, P. (2017b). What about AI in criminal intelligence? From predictive policing to AI perspectives. European Law Enforcement Research Bulletin, (16), 65-75.https://bulletin.cepol.europa.eu/index.php/bulletin/article/view/244
Catégoriser et corréler grâce à des profils anonymes
Pour renforcer la légalité du traitement, il faudrait anonymiser les jeux de données, tout en conservant un niveau de valeur satisfaisant dans le résultat, avec des interprétations comportementales clairement identifiables.
Il est nécessaire pour cela d’avoir accès à des jeux de données conséquents et qui s’étendraient sur des centaines d’enquêtes différentes, qui pourraient être étiquetées pour chaque comportement d’un profil identifié. L’apprentissage automatique permettrait de dégager un modèle particulier qui pourrait être éprouvé avec les réalités du terrain.
La quête d’une solution d’analyse prédictive pourrait se défaire de la géolocalisation, qui reste identifiante, et n’en retenir que des schémas comportementaux. Ceux-ci pourraient alors être agrégés avec ceux issus d’autres enquêtes. Pour rappel, rassembler des procédures est impossible juridiquement.
La position ainsi supprimée, nous aurions une succession de profils comportementaux horodatés et dénués d’information permettant d’identifier directement ou indirectement une personne. Nous sortirions alors du champ d’application des lois de protection des données personnelles.
Cette capacité d’anonymiser les données pourrait ainsi permettre de croiser des données d’enquêtes différentes sans contrevenir aux obligations du Code de procédure pénale.
Reste à nous assurer de l’utilité effective que ces profils auront pour l’enquêteur.
Séparés ainsi de la géolocalisation, nous pourrions enrichir la construction du profil, par exemple avec des données sociodémographiques, en y rattachant le type de service d’enquête, le type de crime. Nous obtiendrions ainsi une base de profils issue de données agrégées de plusieurs milliers d’enquêtes potentiellement.
Cela deviendrait un outil d’aide à l’enquête qui pourrait corréler et mettre en évidence, au travers de ces profils, des données issues de différents canaux :
- géolocalisations de tous types
- analyses de documents
- recherches dans toutes les profondeurs du web
- données forensiques, etc.
Ce système nécessite d’être éprouvé avec des données réelles, afin de proposer des résultats intéressants pour l’enquêteur et apporter ainsi une réelle proposition de valeur.
Prédiction policière aux USA et en France
Les Etats-Unis ont pris de l’avance dans la conception et l’usage d’outils de police prédictive, dans un objectif de prévention de la criminalité. Cela en fait un laboratoire d’observation des usages, des problèmes de régulation des algorithmes, de l’éthique des pratiques policières basées sur l’utilisation de ces nouveaux outils.
Aux Etats-Unis, comme nous le rappelle le sociologue Bilel Benbouzid*, la loi reconnaît des circonstances et encadre la pratique du contrôle a priori mais sans entrer dans une quantification précise, s’opposant à réduire l’humain à un chose mesurable. Ce mécanisme juridique fait la part belle à l’appréciation subjective individuelle et ne laisse pas de place à un système statistique qui généraliserait des comportements.
Avec l’arrivée des outils de police prédictive, il a fallu chercher comment adapter la régulation. Et d’après l’étude de Bilel Benbouzid, une solution s’appuierait sur la définition d’un score acceptable de nuisance des pratiques policières sur la population.
Cela pose assez logiquement le problème entre un système de prédiction de masse qui quantifie des pourcentages en généralisant face à une population essentiellement composée de personnes innocentes. Ce qui reviendrait à définir le nombre de faux positifs acceptables.
Il s’agit de trouver l’équilibre entre systématisme pragmatique et mission d’utilité publique.
D’un côté cela revient à ne pas prendre en compte la sensibilité des citoyens face à une pression policière excessive. De l’autre il s’agit de conserver l’efficacité de la mission proactive de la police qui peut être vu comme un bien commun.
Et Bilel Benbouzid de s’interroger sur la capacité de ces nouvelles normes et nouveaux outils à augmenter “l’efficience des forces de police en moralisant leurs protocoles d’action.”
Les algorithmes de prédiction des troubles à l’ordre public sont en place dans de nombreuses villes et états des USA.
*Benbouzid, B. (2018). Algorithmes prédictifs et droit des algorithmes: contrôler la quantité de faux positifs moralement acceptable. Revue de la gendarmerie nationale, (261), 14.
PREDPOL, LE PRECURSEUR MADE IN USA
Le premier système à indiquer aux policiers où et quand un crime pourrait probablement survenir s’appelle PredPol, société californienne crée en 2011 par le mathématicien George Mohler et l’anthropologue Jeffrey Brantingham, avec l’aide de criminologues.
PredPol dit ne pas traiter de données personnelles, seulement le type de crime, sa position et son horodatage. Sous l’angle du RGPD, ces informations permettent toutefois de retrouver indirectement la ou les personnes concernées. Son algorithme doit apprendre automatiquement un jeu de données historique d’au moins deux ans, idéalement jusqu’à cinq ans. Après la mise en route du système dans un centre de police, les données recueillies sur le terrain sont ajoutées quotidiennement aux jeux de données initiales afin de tenir à jour le modèle algorithmique, qui évolue ainsi en permanence. La prévision s’affiche sous forme d’une case rouge qui représente 150 mètres de côté sur une carte. Il y est précisé si le risque est plus fort le jour, la nuit ou les deux.
Pour parvenir à ces résultats prédictifs, l’entreprise américaine PredPol s’est appuyée sur les travaux de sismologie de David Marsan, professeur en science de la terre à l’Université de Savoie. Celui-ci a mis au point un algorithme qui prédit la réplication d’un tremblement de terre : plus on s’éloigne de l’épicentre, moins il y a de chances à subir une réplique. Pour PredPol, cela revient à dire que plus on s’éloigne du lieu d’un crime, moins il y a de probabilités qu’il y en ait un nouveau.
Le sociologue Bilel Benbouzid a travaillé avec Marsan pour mettre en évidence que des évènements s’étant produits dans le passé ne permettaient pas de corréler des événements qui auraient pu se produire l’année suivante ni dans des zones voisines. La criminalité ne fonctionne pas comme les plaques tectoniques et surtout, elle réagit à la pression policière mise en œuvre en suivant les indications du logiciel.
Benbouzid, B. (2017). (Des crimes et des séismes. Reseaux, n° 206(6), 95-123.
Ce que Cathy O’Neil* décrira comme un accélérateur de discrimination par l’usage d’une boucle de rétroaction pernicieuse. L’algorithme indique des zones à patrouiller, majoritairement dans les quartiers pauvres, ce qui augmente la pression policière dans ces zones, les policiers y pratiquant plus d’arrestations, essentiellement de délits mineurs qui seront enregistrés dans la base de données du logiciel, ce qui renforcera les statistiques probabilistes d’interventions, et ainsi de suite.
*O’Neil, C. (2018). Algorithmes, la bombe à retardement. Les Arènes. Page 136.
PREDICTION A LA FRANÇAISE
Dans ses travaux de recherche*, Patrick Perrot suggère l’exploitation de données externes aux crimes, adoptant une orientation préventive, notamment en ajoutant des données sociodémographiques dans le modèle. Cela permettrait, selon lui « de prévenir l’émergence d’une forme criminelle en agissant sur les facteurs socio-économiques d’un territoire ».
L’expérimentation PredVol a été entreprise par Etalab et le STSI² (Service des technologies et des systèmes d’information de la Sécurité intérieure) en 2015. L’objectif était de prédire les vols de voiture, en expérimentant le système sur le territoire de l’Oise. Le projet d’expérimentation a démarré par des observations des utilisateurs, au sein des services des forces de l’ordre, aussi bien en gendarmerie qu’en police. Le recueil des attentes a fait état de deux principaux besoins :
- Cartographier les zones les plus à risques en amont des patrouilles;
- Aider à la décision pendant les patrouilles.
*Perrot, P. (2015). Le renseignement criminel : de nouvelles perspectives contre la criminalité organisée. Revue de la Défense nationale, page 779.
L’équipe d’Etalab a ensuite testé différents algorithmes, y compris un équivalent à celui de PredPol, en ajoutant aux historiques d’infractions les données sociodémographiques issues de l’INSEE.
Une exploration statistique par carte de chaleur s’est révélée comme donnant les meilleurs résultats. En 2016, des tests terrains ont eu lieu pendant 6 mois, générant des itérations entre les retours des utilisateurs et des améliorations de l’application. Le premier constat de l’expérience fut que la prévision n’apportait pas grand-chose en l’état aux enquêteurs. Par contre, la mise à disposition en mobilité des données d’historique s’avéra un véritable gain. Le système a été modifié en conséquence.
Lors de l’entretien de décembre 2020, Patrick Perrot nous a rappelé l’objectif premier de la Gendarmerie nationale dans la mise en œuvre de l’analyse prédictive.
La Gendarmerie nationale a conçu un système de cartographie des points chauds des cambriolages. L’objectif est ainsi une démarche de prévention, plutôt que de chercher à augmenter les interventions sur flagrant délit, ce qui nécessite d’autres moyens humains tels que les filatures ou le renseignement. En effet, cette cartographie permet de programmer la présence des forces de l’ordre dans ces zones. Ainsi renforcée, cette présence dissuade tout nouveau cambriolage et contribue à faire de ces points chauds des zones pacifiées.
Ce système permet également de mesurer l’extension de périmètre, c’est-à-dire à partir de combien de cambriolages les malfaiteurs vont changer de territoire pour échapper à la pression policière. L’usage des outils d’intelligence artificielle, tel que le clustering, la classification des faits, permet de détecter des séries, des sérialités et d’en déduire l’anticipation de faits.
« Depuis un an, nous avons expérimenté un algorithme qui permet d’anticiper les lieux de commission de cambriolages. Sur les onze départements tests, ces derniers ont globalement baissé. Fort de cette expérience, nous forgeons un algorithme inédit qui va prendre en compte toutes les situations appelant une intervention des gendarmes, de l’accident de la route à l’ensemble des crimes et délits », souligne le Général d’armée Christian Rodriguez, Directeur Général de la Gendarmerie Nationale (DGGN)
L’analyse prédictive est donc à envisager dans un cadre de prévention à la survenance de nouveaux actes délictueux.
DES TRAVAUX EN EVOLUTION DANS UN CONTEXTE CONTRAINT
Le rapport Villani souligne le «risque de surveillance généralisée» liée à la mise en place d’un outil prédictif, traitant massivement les données du passé pour établir des probabilités de survenance d’évènements criminels dans le temps et l’espace.
Il soulève également la question de l’exercice du libre arbitre individuel des agents des forces de l’ordre vis à vis des recommandations de l’algorithme. Il y a là un risque de standardisation des comportements qui pourrait faire « craindre une remise en cause progressive de leur responsabilité individuelle.»
Du point de vue du métier, et en contextualisant en fonction du territoire (les pratiques policières ne sont pas identiques entre les USA et la France), Patrick Perrot prône l’action qui permettra au moins de réduire la délinquance, tout en considérant que « l’usage de ces outils est fondamental pour exploiter les données, mais ne devrait pas supplanter les autres moyens. »
Lors de l’entretien de décembre, il nous rappelait l’urgence du besoin de pouvoir traiter des données de qualité et suffisamment précises. L’enjeu ici est de s’adapter à la vitesse de la délinquance, sur tous les fronts, que ce soit dans le monde réel ou virtuel.
« Nous engageons de gros efforts de recherche avec les entreprises et les universités pour déployer des outils d’aide à la décision fondés sur des algorithmes. Nos experts en intelligence artificielle croisent ces informations avec les spécificités de chaque écosystème local, avec ses gares, ses cafés et ses lieux de passage.
Les données, horodatées à la minute près, seront plus viables et les résultats nécessairement meilleurs.
En patrouille, le gendarme lira sur sa tablette la carte de sa circonscription avec les points rouges alertant des risques et d’une potentielle intervention.
Nos data scientists construisent un modèle très précis, avec une granularité allant jusqu’à la rue. Cet algorithme pourrait être mis en œuvre dès le second semestre 2020.
L’intelligence artificielle est au service du gendarme : elle est là pour l’aider. Mais, au final, lui seul doit prendre la bonne décision, au bon moment, au plus près de la population qu’il protège. »
Propos recueillis auprès du Général d’armée Christian Rodriguez, Directeur Général de la Gendarmerie Nationale (DGGN) à l’occasion de la publication du livre blanc « La Data au cœur de l’enquête » édité par Deveryware en 2020.

L’auteur de cet article est spécialiste du design d’interaction, Laurent a rejoint Deveryware en 2005. En charge du design d’expérience de l’ensemble des applications du groupe, il est aussi délégué à la protection des données personnelles.
Titulaire en 2019 d’un Executive Master à Sciences Po ayant trait aux humanités numériques, il prend une part active à l’innovation.