in

Google confirme qu’il entraîne l’IA en utilisant des données web collectées de manière automatisée.

# REMANIEMENT DE LA POLITIQUE DE CONFIDENTIALITÉ DE GOOGLE

## L’entraînement des services d’IA de Google sera basé sur des données publiques

Le géant de la recherche, Google, a récemment mis à jour sa politique de confidentialité pour inclure l’utilisation de données publiques pour l’entraînement de ses services d’intelligence artificielle (IA) tels que Bard et Cloud AI. Cette mise à jour a été repérée par Gizmodo et Google a confirmé cette information à travers sa porte-parole Christa Muldoon lors d’une interview avec The Verge. Selon Muldoon, Google utilise depuis longtemps des informations disponibles publiquement sur le web pour entraîner ses modèles linguistiques dans des services tels que Google Translate. Avec cette dernière mise à jour de la politique, Google précise simplement que des services plus récents comme Bard sont également inclus. Google a affirmé respecter les principes de confidentialité et les garanties lors du développement de ses technologies d’IA, en accord avec ses principes d’IA.

## Clarté accrue concernant les services d’IA entraînés par les données collectées

La nouvelle politique de confidentialité de Google, mise à jour le 1er juillet 2023, indique que l’entreprise utilise les informations collectées pour améliorer ses services et développer de nouveaux produits, fonctionnalités et technologies au bénéfice de ses utilisateurs et du public. La politique mentionne également que Google peut utiliser des informations accessibles publiquement pour entraîner ses modèles d’IA et développer des produits et fonctionnalités tels que Google Translate, Bard et les capacités Cloud AI. La politique révisée offre une clarté supplémentaire concernant les services qui seront entraînés à partir des données collectées. Par exemple, le document précise maintenant que les informations peuvent être utilisées pour des “Modèles d’IA” plutôt que des “modèles linguistiques”, donnant ainsi à Google une plus grande liberté pour entraîner et construire des systèmes en utilisant les données publiques. Cependant, cette mention est peu visible, cachée derrière un lien intégré pour les “sources accessibles publiquement” sous l’onglet “Informations locales” de la politique.

## Pertinence des lois sur les droits d’auteur et les régulations mondiales

La politique mise à jour stipule que les produits d’IA de Google sont entraînés à partir de “données accessibles publiquement”, mais elle ne précise pas comment l’entreprise empêchera l’inclusion de matériaux protégés par le droit d’auteur dans ce jeu de données. De nombreux sites publics ont des politiques interdisant la collecte de données ou l’extraction de contenu à des fins d’entraînement de grands modèles linguistiques et d’autres outils d’IA. Il sera intéressant de voir comment cette approche s’aligne avec les régulations mondiales telles que le Règlement général sur la protection des données (RGPD) qui protège les personnes contre une utilisation abusive de leurs données sans leur consentement explicite.

## Les défis posés par l’utilisation des données publiques pour l’entraînement de l’IA

La combinaison de ces lois et de la concurrence croissante sur le marché ont conduit les fabricants de systèmes IA génératifs populaires, comme le GPT-4 d’OpenAI, à être très prudents quant à l’origine des données utilisées pour leur entraînement et à savoir si elles comprennent des publications sur les réseaux sociaux ou des œuvres protégées par des droits d’auteur. La question de savoir si le droit d’utilisation équitable s’applique à ce type d’application se situe actuellement dans une zone grise juridique. Cette incertitude a entraîné plusieurs litiges et a poussé certains législateurs à introduire des lois plus strictes mieux adaptées pour réglementer la collecte et l’utilisation des données dans le domaine de l’IA. Elle soulève également des questions sur la manière dont ces données sont traitées afin d’éviter les défaillances dangereuses des systèmes d’IA.

## L’impact de l’IA sur l’industrie des médias et des réseaux sociaux

Gannett, le plus grand éditeur de journaux aux États-Unis, poursuit Google et sa société mère, Alphabet, affirmant que les avancées technologiques de l’IA ont permis au géant de la recherche de monopoliser le marché de la publicité numérique. Des produits tels que la recherche d’IA en version bêta de Google ont également été qualifiés de “moteurs de plagiat” et critiqués pour léser les sites web en termes de trafic. Pendant ce temps, des plateformes de médias sociaux telles que Twitter et Reddit ont récemment pris des mesures drastiques pour empêcher d’autres entreprises de collecter librement leurs données. Malheureusement, ces changements ont été mal accueillis par leurs communautés

What do you think?

Written by Barbara

Leave a Reply

Your email address will not be published. Required fields are marked *

Le dernier contrôleur de 8BitDo est une version sans fil de la manette de jeu du Neo Geo CD.

Cette célèbre illusion d’optique mettra votre relation à l’épreuve.