DASHCAM IMAGES RÉVÈLENT L’EMPLACEMENT DE DÉPLOIEMENT POLICIER
Un modèle informatique d’apprentissage profond et un jeu de données contenant des millions d’images de caméras embarquées provenant des conducteurs de VTC à New York ont permis aux chercheurs de Cornell Tech de déterminer quels quartiers comptaient le plus grand nombre de véhicules marqués de la police de New York, une indication possible des schémas de déploiement.
Leurs résultats ont révélé des tendances dans la présence policière en fonction de l’heure de la journée, des caractéristiques démographiques du quartier, de la proximité des commissariats de police et des zones commerciales. Parmi les résultats obtenus par les chercheurs : Gramercy Park, situé dans le centre de Manhattan, comptait le plus grand nombre de véhicules de police visibles sur les images des caméras embarquées – près de 20 fois plus que Arden Heights/Rossville, dans le sud de Staten Island, qui en comptait le moins.
Les zones où il y avait plus d’images de véhicules de police incluaient des zones commerciales aisées ainsi que des quartiers à faible revenu avec une proportion plus élevée de résidents noirs et latinos.
Matt Franchi, étudiant en doctorat en informatique, est l’auteur principal de « Detecting Disparities in Police Deployments Using Dashcam Data », qu’il a présenté le 12 juin lors de la conférence de l’Association for Computing Machinery Conference on Fairness, Accountability, and Transparency (FAccT ’23) à Chicago.
Les auteurs principaux sont Wendy Ju, professeure agrégée en sciences de l’information à l’Institut Jacobs Technion-Cornell de Cornell Tech, et Emma Pierson, professeure adjointe en informatique à l’Institut Jacobs Technion-Cornell de Cornell Tech. Tous deux sont membres du domaine de l’informatique et des sciences de l’information du Collège de l’informatique et des sciences de l’information Ann S. Bowers de Cornell.
Bien que des données sur les arrêts de police, l’utilisation de la force, les fouilles, les incidents criminels et les arrestations soient disponibles au public, la police ne fournit généralement pas d’informations sur la manière dont les agents sont déployés et où, invoquant des raisons de sécurité. Les disparités de déploiement, écrivent les chercheurs, peuvent entraîner des biais lors des arrestations : un quartier qui est plus fortement policé qu’un autre n’a pas nécessairement plus de criminalité, mais simplement plus de personnes arrêtées pour cela.
En 2020, l’équipe – qui comprenait J.D. Zamfirescu-Pereira, étudiant en doctorat à l’Université de Californie à Berkeley – a obtenu 24,8 millions d’images de caméras embarquées provenant de Nexar, une entreprise qui fournit aux conducteurs de VTC des caméras embarquées. Par exemple, Uber recommande à ses conducteurs d’installer des caméras pour leur propre protection.
Nexar a rendu ses images propriétaires (prises entre le 4 mars 2020 et le 15 novembre 2020) disponibles à des fins de recherche ; au départ, l’équipe de Cornell les utilisait pour recueillir des informations sur la distanciation sociale des habitants de New York pendant la pandémie.
“J’étais initialement intéressé par les méthodologies sous-jacentes qui ont alimenté le projet – le traitement de grandes quantités de données chronologiquement et géolocalisées”, a déclaré Franchi. “Lorsque vous effectuez la bonne analyse, vous pouvez obtenir une image détaillée d’un environnement urbain immense et extraire des tendances que vous ne pourriez pas obtenir autrement.”
Les chercheurs ont ensuite utilisé des milliers d’images, annotées pour indiquer si elles contenaient une voiture de police, pour entraîner un modèle d’apprentissage profond à identifier les véhicules de police marqués. Bien que le modèle puisse identifier les véhicules de police, il ne peut pas expliquer les raisons de leur présence.
Les chercheurs ont identifié plus de 233 000 images contenant des véhicules de police marqués. Les photos ont été prises dans les cinq arrondissements, à toutes les heures de la journée. L’équipe a ensuite étudié les images géolocalisées en fonction de facteurs spécifiques tels que le quartier, l’arrondissement et le type de zone, et a déterminé si les photos avaient été prises dans une zone commerciale animée, près d’une zone industrielle ou dans un lieu de résidence principale.
Ils ont également analysé les images par rapport aux données du recensement de la région, telles que la densité de population, le revenu médian des ménages et la composition raciale des résidents (blanc, noir, hispanique, asiatique).
Les chercheurs ont déclaré qu’ils voient deux principaux avantages à ce travail : une avancée vers une plus grande transparence dans la police et la possibilité de vérifier l’efficacité et l’équité de tous les organismes gouvernementaux.
Ju a déclaré que les chercheurs pourraient appliquer cette méthode d’entraînement d’un modèle à identifier des objets – tels que des tas d’ordures – avec la vision par ordinateur de nombreuses manières qui aideraient les gouvernements municipaux et les urbanistes. C’est la capacité de cette méthode à s’adapter pour détecter une grande variété de phénomènes – dans ce cas, les véhicules de police marqués – qui est le plus excitant pour Ju.
“Côté technologie, vous avez ces caméras embarquées qui collectent des données, et puis nous avons la vision par ordinateur qui nous permet de sélectionner ce qui nous intéresse dans ces données”, a-t-elle dit. “Mais c’est vraiment la méthode d’agrégation des données a posteriori et la possibilité de comparer l’incidence de ces choses à travers les quartiers – c’est la chose que nous n’avons pas pu faire auparavant.”
Ce travail a été soutenu par une bourse de recherche d’Amazon, une bourse de recherche de Google et la National Science Foundation.
Sources :
– Cornell Tech – https://tech.cornell.edu/research/detecting-disparities-in-police-deployments-using-dashcam-data/
– ACM Digital Library – https://dl.acm.org/doi/10.1145/3593013.3594020
– Wendy Ju – https://tech.cornell.edu/people/wendy-ju/
– Emma Pierson – https://tech.cornell.edu/people/emma-pierson/