|
|
|
(c'est-à-dire les cinq noeuds intermédiaires). KATE transforme aussi des
disjonctions d'imprécision dans les exemples en conjonction de variation au
moment de la détermination d'une nouvelle observation. On considère ici la
variation comme une forme d'imprécision, ce qui justifie un traitement
identique des exemples. De plus, le traitement des intervalles pour les attributs
numériques n'est pas optimal quant au choix des seuils : le lecteur peut se
référer aux travaux de [Fayyad & Irani, 1993]. Il serait donc utile d'étudier
d'autres possibilités de discrétisation que celle de la binarisation de l'attribut
dans KATE.
KATE et CaseWork ont été mis à l'épreuve sur d'autres applications non
biologiques (attribution de crédits bancaires, aide à la photo-interprétation,
diagnostic de pannes, etc.). Dans celles-ci, les connaissances pouvaient se
réduire à un tableau de données classique. Dans notre application, KATE doit
être capable de traiter les objets multi-instanciés correspondant aux objets
hordeformalisés par [Diday, 1987] et repris par [Conruyt et al.,1992] sous
l'appellation horde composite. Cela signifie de savoir gérer des appariements
multiples entre descriptions pour respecter l'homologie des objets et non pas
seulement une unification directe entre deux objets de même nom appartenant
à des descriptions différentes : les travaux de [Perinet-Marquet, 1993] sur les
structures itératives sont un début de recherche dans ce sens.
Enfin, il reste aussi la limite suivante : nos outils d'acquisition de l'observable
et de l'observé ont été testés à partir d'un modèle de description issu d'une
seule application (Hyalonema). Il faudrait étudier d'autres classes zoologiques
pour expérimenter les logiciels et montrer ainsi le bien fondé de notre méthode
d'acquisition de connaissances descriptives pour aider les systématiciens dans
leurs recherches. Si KATE et CaseWork sont déjà commercialisés par
AcknoSoft, le logiciel HyperQuest a quant à lui atteint un niveau de prototype
avancé avec une documentation associée [Conruyt & Dumont, 1993].
|
|
|
|
L'expérience nous montre que la robustesse n'est pas simplement un résultat lié
au traitement des données, qui s'arrêtera à la validation des connaissances
apprises. C'est pour nous un processus incrémental qui s'inscrit dans la
continuité, en appliquant la méthode hypothético-déductive sur un même
domaine d'expertise, de manière itérative. Les domaines naturels sont
incomplets par nature car ils sont caractérisés par une grande variabilité
(multiples exceptions),une évolution des phénomènes à décrire (ex :
maladies) et des techniques d'observation de plus en plus précises (cytologie,
biochimie, ADN...). Il est alors difficilement concevable de modéliser "tout"
l'observable à un moment donné : le modèle descriptif est une photographie qui
|
|