ALGORITHM IGNORE LES LOCUTEURS ESPAGNOLS DANS LES PUBLICITÉS EN LIGNE SUR SNAP
Une équipe de recherche dirigée par Cornell a découvert que l’algorithme derrière Google Ads facturait significativement plus cher pour diffuser des publicités en ligne destinées aux personnes hispanophones sur les avantages de SNAP, anciennement connu sous le nom de bons alimentaires.
En plus d’une enquête auprès de 1 500 Américains qui a révélé un large soutien à une approche plus équitable pour promouvoir SNAP, ces résultats ont conduit à des changements visant à cibler directement davantage de locuteurs hispanophones en Californie ayant besoin d’aide pour se nourrir.
“SNAP est une ressource vraiment importante à prendre en compte”, explique Allison Koenecke, professeure adjointe en sciences de l’information à la Cornell Ann S. Bowers College of Computing and Information Science. “Face à un algorithme ayant un impact disproportionné, notre recherche se demande comment choisir une stratégie pour interagir avec l’algorithme afin de recruter de manière équitable les candidats SNAP.”
Koenecke est l’auteure principale de “Popular Support for Balancing Equity and Efficiency in Resource Allocation: A Case Study in Online Advertising to Increase Welfare Program Awareness”, présenté lors de la Conférence AAAI sur le Web et les Médias Sociaux en juin.
“Notre objectif était d’aller au-delà de la simple quantification de ces disparités de coûts publicitaires”, dit-elle. “Nous voulions également répondre aux questions posées par les décideurs dans la vie réelle, comme que fait-on réellement à ce sujet ? Comment les gens veulent-ils réellement allouer ces publicités ?”
En Californie, les habitants peuvent demander des prestations SNAP en utilisant un site web appelé GetCalFresh, développé et géré par Code for America, une organisation à but non lucratif qui construit des outils et des services numériques pour les leaders communautaires et les gouvernements. Code for America recrute principalement les candidats de GetCalFresh via Google Ads, en dépensant par exemple environ 400 dollars par jour pour toucher toute personne du comté de San Diego qui tape des mots clés ou des phrases comme “comment demander des bons alimentaires” sur Google.
Cependant, malgré le fait que GetCalFresh soit proposé dans plusieurs langues, les locuteurs hispanophones remplissent proportionnellement moins de demandes que les anglophones. Dans le comté de San Diego, 23 % des familles vivant en dessous du seuil de pauvreté parlent espagnol comme langue principale, mais seulement 7 % ont demandé des prestations SNAP via GetCalFresh, selon les chercheurs.
Koenecke et ses collaborateurs ont découvert une raison possible : l’algorithme par défaut de Google Ads, qui cherche à maximiser le nombre d’inscriptions SNAP par dollar, délivre moins de publicités aux candidats potentiels hispanophones, car ces publicités coûtent plus cher que celles destinées aux anglophones. À l’époque, pour chaque dollar dépensé sur Google Ads pour “convertir” un anglophone en bénéficiaire de prestations SNAP, il en coûtait 3,80 dollars pour convertir une personne hispanophone – soit près de quatre fois plus. Une autre option d’enchère sur la plateforme Google Ads coûtait 1,4 fois plus cher pour atteindre les locuteurs hispanophones par rapport aux locuteurs anglophones.
Koenecke et ses collaborateurs ne peuvent pas expliquer définitivement cette différence, car Google Ads est une boîte noire – un outil propriétaire d’apprentissage automatique échappant à tout examen public. Elle pourrait être due à un certain nombre de facteurs, tels que l’offre et la demande ou un bug dans le système, explique-t-elle.
Pour GetCalFresh, ces résultats de recherche soulèvent une question éthique importante concernant la façon de dépenser son budget limité de publicité en ligne : Doit-on toucher le plus de Californiens possible à moindre coût, même si cela signifie moins de candidats hispanophones, ou bien faut-il davantage faire de la publicité auprès des locuteurs hispanophones, même si cela aboutit à moins de demandes au total ?
Les compromis tels que ceux-ci sont au cœur des recherches de Koenecke sur l’équité et les systèmes algorithmiques, qui sont de plus en plus utilisés pour aider à la prise de décision dans des domaines ayant des conséquences réelles, comme les soins de santé, la banque et les services à l’enfance. Mais sans un examen supplémentaire, les algorithmes – y compris celui apparemment inoffensif derrière une plateforme publicitaire – peuvent aggraver les inégalités ou produire des résultats contraires à ce que les gens veulent ou ont besoin, explique-t-elle.
Koenecke et ses collaborateurs ont demandé l’avis du public, en interrogeant environ 1 500 Américains sur la manière dont ils équilibreraient l’efficacité et l’équité dans la publicité des prestations SNAP. Dans toutes les tranches d’âge, tous les genres, toutes les races, tous les statuts de bien-être et même toutes les affiliations politiques, les personnes interrogées préféraient généralement réduire le nombre total de demandes pour faciliter davantage de demandes de locuteurs hispanophones, ont constaté les chercheurs. Lorsqu’ils ont réalisé l’enquête auprès du personnel de Code for America, ils ont obtenu des résultats similaires – un fort désir d’accès équitable.
“Si on compare le fait que la majorité des républicains et des démocrates préfèrent en réalité une certaine équité dans ce cas particulier, alors cela ouvre la voie à davantage de bipartisanisme en ce qui concerne la réflexion sur la manière dont l’équité peut jouer un rôle dans les demandes en ligne concernant la distribution algorithmique des biens”, souligne Koenecke.
Suite aux résultats de l’équipe, Code for America a ajusté sa stratégie de publicité en ligne pour cibler directement davantage de candidats hispanophones potentiels.
“Il est important que le domaine et le public aient des dialogues productifs sur les types de métriques que nous devrions utiliser dans ces systèmes algorithmiques”, dit-elle. “Les communautés les plus touchées par les algorithmes devraient avoir plus de pouvoir dans le processus décisionnel.”
Outre Koenecke, les coauteurs de l’article sont Eric Giannella de Code for America, Robb Willer de l’Université Stanford et Sharad Goel de la Kennedy School de l’Université Harvard.
Cette recherche a été partiellement financée par la National Science Foundation et l’Université Stanford. (Sources : Cornell Ann S. Bowers College of Computing and Information Science, Cornell Chronicle)