|
|
Le fait que l'utilisateur ne sache pas répondre à la question sur l'extrémité des
dents provoque le remplacement de ce critère par le second le plus discriminant :
on arrive ainsi à déterminer totalement le nouvel individu en utilisant toute
l'information disponible dans la base de cas.
En fait, les deux critères "extrémité(dents)" et "forme(corps)", au vu du tableau
de la figure 7.2 (et non de la figure 7.5), ont un gain d'information identique : ils
discriminent les exemples avec la même probabilité. Théoriquement, rien ne
justifiait donc le choix du premier critère pour la consultation au lieu du second
car la mesure du gain d'information ne tient pas compte du contenu du message
véhiculé par le critère.
Néanmoins, il est tout à fait possible de tenir compte d'un ordre sur les critères à
utiliser en fonction d'une sémantique donnée lorsque ceux-ci ont le même
pouvoir de discrimination : par exemple, l'expert peut indiquer dans le modèle
descriptif une priorité d'utilisation liée à la facilité d'observer l'attribut (il est plus
facile d'observer visuellement la forme du corps que l'extrémité des dents au
microscope). Cette connaissance explicite supplémentaire peut donc être mise à
contribution en phase de détermination pour améliorer la robustesse de la
consultation.
7.3.3 Formalisation
La procédure de raisonnement par cas que nous avons développée dans
CaseWork peut être décrite par l'algorithme suivant. Il explicite les deux tâches
qui permettent de retrouver les cas "similaires" : Rechercher et Réutiliser. La
méthode utilise toujours le gain d'information comme mesure de discrimination.
Aucun noeud n'est construit, les critères choisis ne servent qu'à indexer les cas :
Algorithme:
Début :
E = W,
|
|
|
|
|
Rechercher (w, E, Y)
siCritèred'Arrêt (E) alors
w [!] {ci}
sinon
Y= ConstruireEspace (E)
s = OrdonnerCritères (E, Y)
Ei= Sélectionner (w, s, E)
Rechercher (w, Ei, Y)
Fin si
Fin.
|
|
|
|
|
|
|
|