1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

27

Le cheminement conceptuel

Une première validation par l'expert (D. Blancard) des règles produites automatiquement a montré qu'elles étaient trop générales (imprécises et incomplètes) et difficilement interprétables. Il s'est donc révélé nécessaire de comprendre le fonctionnement des logiciels d'apprentissage, de corriger certains "bugs" et de tester leurs performances propres afin d'obtenir de meilleures règles.

Pour cela, une méthodologie d'évaluation a été mise au point en faisant intervenir différents tests locaux(dits de "robustesse" et de "précision") avec plusieurs niveaux de difficulté sémantique en fonction :

[!] [!] [!]

du nombre d'exemples (17 à 21),
du nombre de classes (2 à 3),
des objets impliqués (types de symptômes, organes).

D'autres tests plus globauxfaisaient intervenir :

[!] [!] [!]

un plus grand nombre d'exemples et de classes (32 à 34), des types de cas différents (cas typiques ou photos, cas réels bruités), deux types de diagnostic (simple ou multiple, c'est à dire avec plusieurs maladies présentes simultanément sur la même plante).

Ces moyens expérimentaux ont été implantés dans un environnement de tests.

Les résultats sont d'ordre à la fois quantitatifs (durées d'élaboration de l'arbre de décision et des règles de production en fonction du nombre d'exemples et du nombre de classes) et qualitatifs (appréciation de la justesse des règles en fonction de la nature des caractères observés, de l'homogénéité des exemples).

Nous avons pu mettre en évidence certaines incohérences dans les règles apprises qui sont dues à des insuffisances dans la phase d'acquisition des connaissances. Nous mettons ainsi en lumière l'importance de la bonne structuration des connaissances de baseau sein d'un modèle descriptif pour un apprentissage correct. En effet, ce modèle indique les relations structurelles entre les concepts, il peut dans un premier temps être utilisé pour acquérir les exemples à l'aide d'un questionnaire et servir de guide d'observation. La qualité des exemples à apprendre (les données observées) dépend directement de la qualité de la phase de modélisation des descriptions (données observables). Dans un deuxième temps, il servira aussi au système d'apprentissage pour généraliser en utilisant les hiérarchies d'objets (en sachant par exemple que le terme de symptôme est plus général que le terme de tache). Ces constatations sont à l'origine de l'implantation du système d'induction KATE utilisant une représentation orientée objets : les frames.