1 2 3 4 5 6 7 8

236

Chapitre 8

(c'est-à-dire les cinq noeuds intermédiaires). KATE transforme aussi des disjonctions d'imprécision dans les exemples en conjonction de variation au moment de la détermination d'une nouvelle observation. On considère ici la variation comme une forme d'imprécision, ce qui justifie un traitement identique des exemples. De plus, le traitement des intervalles pour les attributs numériques n'est pas optimal quant au choix des seuils : le lecteur peut se référer aux travaux de [Fayyad & Irani, 1993]. Il serait donc utile d'étudier d'autres possibilités de discrétisation que celle de la binarisation de l'attribut dans KATE.

KATE et CaseWork ont été mis à l'épreuve sur d'autres applications non biologiques (attribution de crédits bancaires, aide à la photo-interprétation, diagnostic de pannes, etc.). Dans celles-ci, les connaissances pouvaient se réduire à un tableau de données classique. Dans notre application, KATE doit être capable de traiter les objets multi-instanciés correspondant aux objets hordeformalisés par [Diday, 1987] et repris par [Conruyt et al.,1992] sous l'appellation horde composite. Cela signifie de savoir gérer des appariements multiples entre descriptions pour respecter l'homologie des objets et non pas seulement une unification directe entre deux objets de même nom appartenant à des descriptions différentes : les travaux de [Perinet-Marquet, 1993] sur les structures itératives sont un début de recherche dans ce sens.

Enfin, il reste aussi la limite suivante : nos outils d'acquisition de l'observable et de l'observé ont été testés à partir d'un modèle de description issu d'une seule application (Hyalonema). Il faudrait étudier d'autres classes zoologiques pour expérimenter les logiciels et montrer ainsi le bien fondé de notre méthode d'acquisition de connaissances descriptives pour aider les systématiciens dans leurs recherches. Si KATE et CaseWork sont déjà commercialisés par AcknoSoft, le logiciel HyperQuest a quant à lui atteint un niveau de prototype avancé avec une documentation associée [Conruyt & Dumont, 1993].

IMAGE imgs/conclusion04.gif

L'expérience nous montre que la robustesse n'est pas simplement un résultat lié au traitement des données, qui s'arrêtera à la validation des connaissances apprises. C'est pour nous un processus incrémental qui s'inscrit dans la continuité, en appliquant la méthode hypothético-déductive sur un même domaine d'expertise, de manière itérative. Les domaines naturels sont incomplets par nature car ils sont caractérisés par une grande variabilité (multiples exceptions),une évolution des phénomènes à décrire (ex : maladies) et des techniques d'observation de plus en plus précises (cytologie, biochimie, ADN...). Il est alors difficilement concevable de modéliser "tout" l'observable à un moment donné : le modèle descriptif est une photographie qui