Dans le domaine informatique et de l'intelligence artificielle, l'apprentissage non supervisé est un problème d'apprentissage automatique. Il s'agit, pour un logiciel, de trouver des structures sous-jacentes à partir de données non étiquetées. Puisque les données ne sont pas étiquetées, il n'est pas possible d'affecter au résultat de l'algorithme utilisé un score d'adéquation. Cette absence d'étiquetage (ou d'annotation) est ce qui distingue les tâches d'apprentissage non-supervisé des tâches d'apprentissage supervisé.
L'apprentissage non supervisé consiste à apprendre sans superviseur. Il s’agit d’extraire des classes ou groupes d’individus présentant des caractéristiques communes. La qualité d'une méthode de classification est mesurée par sa capacité à découvrir certains ou tous les motifs cachés.
On distingue l'apprentissage supervisé et non supervisé. Dans le premier apprentissage, il s’agit d’apprendre à classer un nouvel individu parmi un ensemble de classes prédéfinies: on connaît les classes à priori. Tandis que l'apprentissage non-supervisé, le nombre et la définition des classes n’étant pas données à priori.
Différence entre les deux types d'apprentissage.
Exemple : articles en rubrique cuisine, sport, culture...
Exemple: lui attribuer un nom parmi cuisine, sport, culture...
Exemple : une fleur
Exemple: si deux fleurs ont la même forme, elles sont en rapport avec une même plante correspondante.
Il existe deux principales méthodes d'apprentissage non-supervisées :
Les techniques d'apprentissage non-supervisé peuvent être utilisées pour résoudre, entre autres, les problèmes suivants :
L'apprentissage non supervisé peut aussi être utilisé en conjonction avec une inférence bayésienne pour produire des probabilités conditionnelles pour chaque variable aléatoire étant données les autres.