1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

61

Qu'est-ce que la robustesse ?

En conséquence, le traitement des exemples doit s'effectuer par lot et les connaissances produites à partir des ensembles précédents sont modifiées pour prendre en considération les nouveaux exemples. Cette manière de procéder permet de pallier l'incomplétude de l'ensemble des exemples de départ. La prise en compte de ces deux définitions dans la conception du système rend possible son application sur des bases de données importantes et/ou incomplètes.

L'incrémentalité temporelle est celle que nous souhaitons appliquer. Elle fait appel aux facteurs de mise à jour, de cohérence (entre le modèle descriptif et les données) et de redondance (nouvelles données par rapport aux anciennes).

IMAGE imgs/Chapitre204.gif

Généralement, on dit qu'un système d'apprentissage est "robuste" s'il permet d'obtenir des résultats satisfaisants par rapport à un ensemble d'hypothèses de départ. Cette définition très générale de la robustesse laisse la porte ouverte à de multiples interprétations. L'appréciation du résultat est laissée au jugement de n'importe quel type d'utilisateur, qu'il soit informaticien, statisticien, biologiste, expert ou béotien. Or, les idées de ces différents utilisateurs sur la question ne sont pas toujours partagées, loin s'en faut !

2.3.1 L'informaticien

Pour lui, un système robuste traite des données pour obtenir des résultats aussi bons que ceux de l'expert. S'il possède une formation académique basée sur les mathématiques, il supposera que les exemples ont été recueillis convenablement selon un protocole d'échantillonnage précis. S'il est chercheur, le traitement est alors considéré comme la partie "noble" de l'acquisition des connaissances pour valider des solutions algorithmiques, parce que la phase de saisie des données est peu valorisable du point de vue scientifique. Il est d'ailleurs révélateur de constater que de son point de vue, le terme de validation des connaissances est dépendant du traitement qui a été préalablement effectué sur les données. Nous verrons dans notre approche que ce terme s'applique bien avant dans la phase d'acquisition des exemples à l'aide d'un questionnaire (la phase d'observation et de description est la véritable phase d'apprentissage pour le biologiste).

2.3.2 Le statisticien

Il argumenterait qu'un système robuste est doué d'une forte capacité de prédiction sur des exemples qu'il n'a pas vus, ce qui est le critère de qualité d'un bon système d'apprentissage. Il présuppose que les exemples à apprendre sont distribués selon une loi normale et correspondent à un modèle mathématique établi à partir des hypothèses suivantes :

[!]

équi-possibilité des valeurs de chaque variable,