L’encodage one-hot consiste à représenter des catégories par des vecteurs binaires (composés de 1 et de 0). Chaque catégorie a un vecteur où une seule position qui est à 1 et toutes les autres sont à 0. Cela permet de représenter les catégories de manière plus compréhensible pour les ordinateurs et les algorithmes.
Prenons l’exemple d’un réseau de neurones dont l’objectif classifier portraits dans 4 catégories : happy, sad, angry, neutral. On pourrait représenter ces 4 catégories avec les vecteurs suivants :
Happy ( 0 0 0 1 )
Sad ( 0 0 1 0 )
Angry ( 0 1 0 0 )
Neutral ( 1 0 0 0 )
Dans un réseau de neurones classifieur (servant à catégoriser), il est commun que la couche de sortie (output layer) corresponde à un vecteur binaire one-hot.