|
|
Dans cette thèse, nous avons mis au point une méthode opérationnelle
d'acquisition des connaissances pour les domaines biologiques. Cette méthode
est constituée d'une chaîne en trois parties : acquisition de l'observable avec
élaboration d'un modèle descriptif, acquisition de l'observé (les cas) à l'aide
d'un questionnaire interactif, puis traitement de ces connaissances (observable
et observé) à des fins de classification et/ou de détermination. Les outils
permettant de créer le modèle et le questionnaire ont été conçus pendant cette
thèse (HyperQuest), ainsi que le module de raisonnement par cas (CaseWork)
pour l'objectif de détermination. Pour la classification, nous sommes partis de
travaux sur le logiciel KATE [Manago, 1991].
Afin de mettre au point notre méthode, nous nous sommes appuyés sur une
application concrète au Muséum National d'Histoire Naturelle de Paris et sur la
disponibilité d'un expert du domaine des éponges marines.
Au départ de ce travail, notre objectif était d'obtenir des résultats de
consultation robustes face à un utilisateur donnant des réponses «inconnu» aux
questions posées par le système expert pour déterminer un nouvel individu.
Une méthode de raisonnement par cas, expliquée au chapitre 7, permet de
pallier ce type de "bruit" dans la phase de détermination.
Mais nous savions aussi par d'autres expériences menées à l'INRA en
pathologie végétale que la robustesse de la consultation dépendait de la qualité
des descriptions, c'est-à-dire de la capacité de l'utilisateur à "savoir décrire" à
l'aide d'un questionnaire. De même, cette exigence de qualité des descriptions
est primordiale pour pouvoir construire des classifications artificielles à partir
des exemples.
Or, avant de "savoir décrire", il faut "savoir observer" : le questionnaire devait
donc avoir le rôle de guide d'observation afin d'obtenir des descriptions
robustes. La conception d'un guide demande la formalisation d'un bon modèle
de description sur lequel on peut ensuite bâtir un questionnaire.
|
|