|
|
|
En conséquence, le traitement des exemples doit s'effectuer par lot et les
connaissances produites à partir des ensembles précédents sont modifiées pour
prendre en considération les nouveaux exemples. Cette manière de procéder
permet de pallier l'incomplétude de l'ensemble des exemples de départ. La prise
en compte de ces deux définitions dans la conception du système rend possible
son application sur des bases de données importantes et/ou incomplètes.
L'incrémentalité temporelle est celle que nous souhaitons appliquer. Elle fait
appel aux facteurs de mise à jour, de cohérence (entre le modèle descriptif et les
données) et de redondance (nouvelles données par rapport aux anciennes).
|
|
|
|
|
Généralement, on dit qu'un système d'apprentissage est "robuste" s'il permet
d'obtenir des résultats satisfaisants par rapport à un ensemble d'hypothèses de
départ. Cette définition très générale de la robustesse laisse la porte ouverte à de
multiples interprétations. L'appréciation du résultat est laissée au jugement de
n'importe quel type d'utilisateur, qu'il soit informaticien, statisticien, biologiste,
expert ou béotien. Or, les idées de ces différents utilisateurs sur la question ne
sont pas toujours partagées, loin s'en faut !
2.3.1 L'informaticien
Pour lui, un système robuste traite des données pour obtenir des résultats aussi
bons que ceux de l'expert. S'il possède une formation académique basée sur les
mathématiques, il supposera que les exemples ont été recueillis convenablement
selon un protocole d'échantillonnage précis. S'il est chercheur, le traitement est
alors considéré comme la partie "noble" de l'acquisition des connaissances pour
valider des solutions algorithmiques, parce que la phase de saisie des données
est peu valorisable du point de vue scientifique. Il est d'ailleurs révélateur de
constater que de son point de vue, le terme de validation des connaissances est
dépendant du traitement qui a été préalablement effectué sur les données. Nous
verrons dans notre approche que ce terme s'applique bien avant dans la phase
d'acquisition des exemples à l'aide d'un questionnaire (la phase d'observation et
de description est la véritable phase d'apprentissage pour le biologiste).
2.3.2 Le statisticien
Il argumenterait qu'un système robuste est doué d'une forte capacité de
prédiction sur des exemples qu'il n'a pas vus, ce qui est le critère de qualité
d'un bon système d'apprentissage. Il présuppose que les exemples à apprendre
sont distribués selon une loi normale et correspondent à un modèle mathématique
établi à partir des hypothèses suivantes :
|
|