|
|
Les développements logiciels qui ont accompagné
le projet "Éponges" ont abouti, au travers d'un
travail de thèse (CONRUYT,1994), à la mise au
point d'une chaîne complète d'outils permettant de
créer et manipuler les connaissances structurées
tant observables qu'observées, et de les utiliser à
des fins de classification (pour le spécialiste) ou de
détermination (par n'importe qui).
Tout d'abord, un générateur interactif, à forte
composante graphique, permet de créer puis de
faire évoluer le modèle descriptif d'un domaine. Il
n'était pas disponible au moment de la création du
modèle descriptif des Hyalonema, et a donc pu
bénéficier des observations faites à cette occasion.
Ensuite, un questionnaire hypermédia, fabriqué
automatiquement à partir du modèle descriptif et
en traduisant les moindres détails, permet de saisir
des descriptions, soit de novo, soit par recopie
différentielle d'une description préexistante. La
navigation dans le questionnaire peut se faire
localement par renvoi d'écran à écran (chaque
écran étant relatif à un objet), ou bien par
référence directe à l'arbre de structure du modèle
descriptif (à l'aide de la vue globale, Fig. 3). Le
processus de description apparaît bien ainsi
comme une instanciation progressive, dans un
ordre logique, de la variable-description que
constitue le modèle descriptif. Du fait de sa
conception même, l'outil autorise l'incorporation à
la description (de chaque objet du modèle
descriptif) d'une ou plusieurs illustrations saisies
au scanner par exemple.
Les descriptions sont stockées dans une base de
cas, sous une forme interne auto-explicite reflétant
la structure du modèle. En ce qui concerne les
Hyalonema, les 12 classes d'identification (Fig. 2)
correspondent aux sous-genres reconnus par
l'expert. De la sorte, chaque description est un
exemple de sa classe d'identification ; à terme,
l'ensemble des exemples d'une classe (ici un sous-
genre, mais cela pourrait être aussi bien une
espèce, ou une autre catégorie taxinomique)
illustre la variété individuelle propre à cette classe,
sans recours à la statistique ou aux définitions
généralisantes.
Il n'existe pas encore de gestionnaire de base de
cas, sa nécessité ne s'étant pas fait sentir dans le
cadre de ce premier travail. L'extraction des cas est
déportée dans chaque outil d'utilisation des
descriptions.
Pour l'aide à la classification, on utilise une
technique dite d'apprentissage par induction, qui
permet d'ordonner les différents caractères
observables en fonction de leur uniformité au sein
de chaque classe (critère d'entropie de SHANNON).
L'un des intérêts de cette évaluation de la qualité
des caractères (chargée de faire ressortir les
|
|