En analyse prédictive et en apprentissage automatique, on parle de dérive conceptuelle lorsque les propriétés statistiques de la variable cible, que le modèle essaie de prédire, évoluent au cours du temps d'une manière imprévue. Ceci pose des problèmes parce que les prédictions deviennent moins exactes au fur et à mesure que le temps passe. La notion de Concept se réfère à la mesure que l'on veut prédire. Plus généralement, il peut faire référence à d'autres phénomènes intéressants en dehors des concepts cibles, tels que les entrées. La dérive conceptuelle est une des contraintes en fouille de flux de données.
Mihai M. Lazarescu
définit la dérive conceptuelle en termes de consistance et de persistance.
Définition 1 : soit le concept à l'instant t=0,1,...n et soit le changement de concept entre les instants t-1 et t. Un concept est consistant si où est un seuil de consistance prédéfini.
Définition 2 : soit la taille de la fenêtre temporelle contenant les observations. Un concept est persistant si et où p est la persistance du changement, c'est-à-dire le nombre d'observations consécutives pendant lesquelles le changement est consistant.
Définition 3 : La dérive est permanente si elle est à la fois persistante et consistante. La dérive est virtuelle si elle est consistante mais pas persistante. La dérive est considérée comme du bruit si elle n'est ni consistante, ni persistante.
La prise en compte de la dérive conceptuelle en fouille de flux de données se fait soit implicitement, soit explicitement.
La prise en compte implicite se fait par l'intermédiaire du stockage de l'information.
Dans ces deux cas la prise en compte de la dérive conceptuelle se fait par l'oubli, on ne tient compte que des observations les plus récentes et on oublie les plus anciennes. Les algorithmes basés sur les classifieurs multiples (les méthodes-ensembles) tels que DWM, « LIFT-based weight assigning » et « adaptive classifiers for changing environments (ACE) » utilisent cette approche.
La prise en compte explicite s'effectue par l'intermédiaire de méthodes de détections.