in

Former le model de segmentation d’image pour accepter les commentaires des utilisateurs par le biais de l’étiquetage Voronoi, Partie 2 | Par Florin Andrei | Mai 2023


COMMENT ENTRAÎNER UN MODÈLE DE SEGMENTATION D’IMAGE HORS-ÉTAGÈRE POUR RÉPONDRE AUX RETOURS UTILISATEURS

Dans ce deuxième article, nous nous intéressons à la manière d’automatiser la génération de clics nécessaires à l’entraînement de modèles de segmentation d’images pour qu’ils répondent aux retours des utilisateurs. Cette étape est jugée fastidieuse, chronophage et parfois inenvisageable pour des volumes très importants de données ou si les modèles doivent être régulièrement entraînés. Nous avons donc besoin de méthodes automatisées, et cette article présente une solution.

LE PROBLÈME À RÉSOUDRE ET SA COMPLEXITÉ

Pour rappel, nous cherchons à entraîner un modèle de segmentation d’images pour qu’il anticipe les formes idéales attendues par les experts, sur la base de retours utilisateurs (clics positifs et négatifs) qui permettent de différencier les zones vraies positives, fausses positives et fausses négatives.

Ce processus est intuitif pour l’humain, mais comprend plusieurs étapes assez complexes : découpage des zones TP, FP et FN ; suppression des plus petites zones ; choix du nombre de clics à appliquer sur chaque segment restant ; règles de proximité entre deux clics et avec les bords de segment.

Le fait que ces règles relatives à la distance et la proximité peuvent se contredire complique l’élaboration d’une solution automatisée, mais nous allons voir qu’il est possible de combiner un concept mathématique appelé la la tesselation de Voronoi avec des concepts tirés de la physique (l’énergie et l’annealing simulé) pour arriver à une solution.

LA TESSELATION DE VORONOI ET SES APPLICATIONS EN SEGMENTATION D’IMAGES

La tesselation de Voronoi est un processus qui permet de découper une zone en tuiles, de telle sorte que chaque point de chaque tuile soit plus proche de son centre que de ceux de toutes les autres tuiles. Ce processus est accessible à tous et facilement pratiqué en ligne sur des simulateurs accessibles sur la toile.

Le tiling peut être uniforme si les clics sont définis comme les centres des tuiles. La répartition des clics peut ensuite être optimisée en maximisant leur énergie selon un procédé d’annealing simulé pour des formes convexes et concaves.

Cette méthode donne de bons résultats pour entraîner un modèle de segmentation d’image en suivant le processus suivant :
_Découpage de l’ensemble de données en 5 fois
_Entrainements d’un modèle de segmentation pour chaque fold
_Comparaison des prédictions des modèles de base avec les labels pour extraire TP, FP et FN
_Découpage des zones TP, FP, FN et génération uniforme des clics en utilisant la méthode de tesselation de Voronoi et les règles définies
_Ajout des clics dans R et G quand les prédictions sont fausses et dans G seule pour les prédictions vraies
_Réentraînement des modèles avec les nouvelles données comprenant les clics pour obtenir les modèles “click-trained”

Cette méthode d’entraînement automatisé permet donc d’optimiser la segmentation d’images mais nécessite l’utilisation d’un simulateur pour optimiser la répartition et la distribution des clics.

What do you think?

Written by Barbara

Leave a Reply

Your email address will not be published. Required fields are marked *

L’ère de l’apprentissage automatique pour la conception de protéines, résumée en quatre méthodes clés | par LucianoSphere | Mai 2023

Le Google Pixel Fold en Français se traduirait par “Le Pixel Pliant de Google”.