in

Démystifier l’algorithme de recommandation de YouTube | par Samuel Flender | Avr, 2023


BREAKING DOWN L’ALGORITHME DE RECOMMANDATION DE YOUTUBE

Les systèmes de recommandation sont devenus l’une des applications les plus répandues du Machine Learning. Cependant, peu d’informations sont publiées sur leur fonctionnement. Heureusement, l’article de Paul Covington intitulé “Deep Neural Networks for YouTube Recommendations” offre un aperçu rare des coulisses d’un système de recommandation moderne ainsi que des problèmes auxquels les ingénieurs en Machine Learning sont confrontés aujourd’hui. Dans ce post, nous allons examiner les huit points clés de l’article qui aident à expliquer le succès de l’algorithme de recommandation de YouTube.

1. RECOMMANDATION = GÉNÉRATION DE CANDIDATS + CLASSEMENT

Le système de recommandation de YouTube est divisé en deux étapes : la génération de candidats et la phase de classement. La première étape filtre les milliards de vidéos pour ne garder que quelques centaines, puis la seconde étape réduit encore plus et trie les candidats proposés à l’utilisateur. Cette approche permet d’optimiser le contenu en termes de rappel et de précision.

2. LES ÉTIQUETTES IMPLICITES FONCTIONNENT MIEUX QUE LES ÉTIQUETTES EXPLICITES

Les feedbacks explicites des utilisateurs (likes, partages, commentaires) sont rares. Les feedbacks implicites tels que les clics et les temps de visionnage sont plus abondants, bien que plus bruités. A grande échelle, la quantité de labels est plus importante que la qualité, et l’utilisation de feedbacks implicites est plus efficace dans les modèles.

3. L’ORDRE DE VISIONNAGE EST IMPORTANT

Un utilisateur suit un certain schéma dans sa séquence de visionnage et cela influe sur les recommandations futures. Par exemple, s’il regarde plusieurs vidéos d’un même créateur, il est probable qu’il continuera à regarder les vidéos de ce créateur. En examinant les derniers 50 visionnages et recherches de l’utilisateur, YouTube est capable de prévoir sa prochaine vidéo.

4. LE MODELE DE CLASSEMENT EST ENTRAÎNE EN UTILISANT UNE RÉGRESSION LOGISTIQUE PONDÉRÉE

Le modèle de classement est entraîné à partir de feedbacks positifs, qui sont pondérés par le temps de visionnage, et de feedbacks négatifs qui reçoivent une pondération unitaire. Cette approche permet de retenir les indicateurs clés de l’engagement en réduisant l’effet des contenus click bait.

5. LE CLASSEMENT PAR TEMPS DE VISIONNAGE PRÉVU EST PLUS EFFICACE QUE LE CLASSEMENT PAR TAUX DE CLICS

Le classement par taux de clic favorable aux click baits mais conduit à des temps de visionnage très courts, contrairement au classement par temps de visionnage prévu.

6. UNE VARIÉTÉ DE FONCTIONNALITÉS EST ESSENTIELLE POUR UNE PERFORMANCE DE MODÈLE ÉLEVÉE

Le modèle de classement de YouTube examine l’historique des visionnages de l’utilisateur, l’historique des recherches effectuées, ainsi que des caractéristiques démographiques comme l’âge, le genre et la localisation.

7. L’ÂGE DE L’EXEMPLE EST UNE CARACTÉRISTIQUE IMPORTANTE

YouTube est préoccupé par les biais temporels, puisque les utilisateurs préfèrent les contenus récents. Pour remédier à ce biais, l’âge de l’exemple est stocké comme caractéristique dans le modèle.

8. LES CARACTÉRISTIQUES RARES SONT CODÉES EN EMBEDDINGS À BASSE DIMENSION

Le modèle de classement utilise de nombreuses fonctionnalités catégorielles rares, telles que l’ID de la vidéo ou de l’utilisateur. Pour limiter l’emprunte mémoire, l’espace d’ID est tronquée pour ne retenir que les ID les plus communs et les fonctionnalités rares dans un même espace d’ID partagent un embedding commun.

En résumé, la recommandation de YouTube est un processus complexe qui utilise une grande variété de fonctionnalités pour classifier les vidéos en ligne de manière efficace. Les feedbacks implicites sont essentiels, tout comme les modèles de génération de candidats et de classement. En utilisant ces insights, les ingénieurs en Machine Learning peuvent améliorer la qualité de la recommandation.

Sources :

– “Deep Neural Networks for YouTube Recommendations” de Paul Covington.
– Article original sur Medium.

What do you think?

Written by Pierre T.

Leave a Reply

Your email address will not be published. Required fields are marked *

La loi de l’Utah exige le consentement parental pour les moins de 18 ans pour utiliser les médias sociaux.

“La voix d’une adolescente clonée par l’IA pour une arnaque de kidnapping à 1 million de dollars”