|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
27
|
|
|
|
|
|
Le cheminement conceptuel
|
|
|
|
|
|
|
|
Une première validation par l'expert (D. Blancard) des règles produites
automatiquement a montré qu'elles étaient trop générales (imprécises et
incomplètes) et difficilement interprétables. Il s'est donc révélé nécessaire de
comprendre le fonctionnement des logiciels d'apprentissage, de corriger certains
"bugs" et de tester leurs performances propres afin d'obtenir de meilleures
règles.
Pour cela, une méthodologie d'évaluation a été mise au point en faisant intervenir
différents tests locaux(dits de "robustesse" et de "précision") avec plusieurs
niveaux de difficulté sémantique en fonction :
|
|
|
|
|
[!]
[!]
[!]
|
|
du nombre d'exemples (17 à 21),
du nombre de classes (2 à 3),
des objets impliqués (types de symptômes, organes).
|
|
|
|
|
D'autres tests plus globauxfaisaient intervenir :
|
|
|
|
|
|
|
|
|
[!]
[!]
[!]
|
|
un plus grand nombre d'exemples et de classes (32 à 34),
des types de cas différents (cas typiques ou photos, cas réels bruités),
deux types de diagnostic (simple ou multiple, c'est à dire avec plusieurs
maladies présentes simultanément sur la même plante).
|
|
|
|
Ces moyens expérimentaux ont été implantés dans un environnement de tests.
Les résultats sont d'ordre à la fois quantitatifs (durées d'élaboration de l'arbre de
décision et des règles de production en fonction du nombre d'exemples et du
nombre de classes) et qualitatifs (appréciation de la justesse des règles en
fonction de la nature des caractères observés, de l'homogénéité des exemples).
Nous avons pu mettre en évidence certaines incohérences dans les règles
apprises qui sont dues à des insuffisances dans la phase d'acquisition des
connaissances. Nous mettons ainsi en lumière l'importance de la bonne
structuration des connaissances de baseau sein d'un modèle descriptif
pour un apprentissage correct. En effet, ce modèle indique les relations
structurelles entre les concepts, il peut dans un premier temps être utilisé pour
acquérir les exemples à l'aide d'un questionnaire et servir de guide
d'observation. La qualité des exemples à apprendre (les données observées)
dépend directement de la qualité de la phase de modélisation des descriptions
(données observables). Dans un deuxième temps, il servira aussi au système
d'apprentissage pour généraliser en utilisant les hiérarchies d'objets (en sachant
par exemple que le terme de symptôme est plus général que le terme de tache).
Ces constatations sont à l'origine de l'implantation du système d'induction
KATE utilisant une représentation orientée objets : les frames.
|
|