Modèle substitut


Définition

Un modèle substitut est une approximation plus facilement explicable (modèle linéaire ou modèle à base d'arbre) d'un modèle de type boîte noire obtenue par entrainement sur les résultats et les données issus de ce modèle boîte noire.

Compléments

Un modèle substitut peut être entraîné à partir des données ou un sous-ensemble de données utilisées par l’algorithme à interpréter ainsi que le résultat de prédiction de l’algorithme de boîte noire. Il subsistera toujours une différence entre les modèles substituts et le modèle devant être interprété.

Un modèle substitut peut-être global ou local. Un modèle substitut local n’approxime adéquatement qu'une partie des résultats d’un algorithme de type boîte noire. Il s’agit alors d’apporter des « explications locales interprétables par modèle agnostique », plus connues sous l’acronyme anglais LIME (« local interpretable model-agnostic explanations »)


Français

modèle substitut

modèle substitut global

modèle substitut local

Anglais

surrogate model

global surrogate model

local surrogate model


<-- Global surrogates are really easy to understand, that’s an advantage of this method. First you build a black box model on the training data with the real labels. Then you let the model predict the labels for the same data and you build an interpretable model on the data with the predicted labels. Because the surrogate model is interpretable and build on the predictions of the black box model you learn how the black box model makes its prediction. -->

Source : Boileau et al. (2022)


Source : towardsdatascience