1 2 3 4 5 6 7 8 9 10 11 12 13 14

Connaissance Descriptive et Hyalonema5 ----------------------------------------------------------------------------------------------------------------------------------------------------------------

modèle descriptif, on pourra dire qu'elle sera une conjonction de descriptions locales (des différentes sous-parties) ; à condition de ne pas oublier d'y adjoindre l'information portée par l'arbre lui-même, à savoir les liens qui existent entre les sous-parties :

Hyalonema, l'état "absent" a été interdit par l'expert du domaine : une Hyalonemaa toujours un pédoncule ; si on ne l'observe pas, c'est qu'il a été arraché, et il n'est donc jamais absent mais inconnu. Cette connaissance experte, utilement incluse dans le modèle descriptif, évite que deux éponges soient artificiellement séparées parce que l'une a son pédoncule arraché et l'autre non.

Mécanisme d'expression de l'imprécision Il suffit de parcourir quelques descriptions, parmi les millions qui ont été publiées, pour se convaincre de l'omni-présence de l'imprécision. Pour rester le plus objectif possible, le descripteur est amené à apporter de multiples nuances ou pondérations. Le respect de cette finesse d'expression est aussi nécessaire que compliqué à formaliser.
Pour le moment, nous avons renoncé à traiter séparément les différentes sources d'imprécision dans les observations, qu'elles soient dues à des erreurs de mesure, à des situations mal définies, à des difficultés d'appréciation ou même à la prise en compte de variations locales.
Dans le cas des valeurs numériques (taille, nombre
, etc.), la possibilité est donnée de fournir, à la place d'une valeur simple, un intervalle plus ou moins large. Par exemple, si, pour l'objet amphidisques, on répond [taille(amphidisques)={100,120}], cela signifie que la taille des amphidisques est comprise entre 100 et 120 (microns). Notons que, pour traduire la variabilité, le modèle descriptif peut fort bien comprendre des attributs statistiques (moyenne, écart-type,etc.).
Dans le cas des valeurs symboliques (couleur, forme, répartition
,etc.), il est convenu que le choix simultané de plusieurs valeurs correspond à une disjonction de ces valeurs. Par exemple, la réponse [couleur(fleurs)={brun, jaune}] signifie que la couleur est située quelque part entre le brun et le jaune. La virgule entre brun et jaune signifie "ou", et jamais "et".

Mécanisme des objets multiples
Ce mécanisme s'applique dans deux situations, en fait très voisines.
La première n'a pas été rencontrée dans le domaine des Hyalonema. Aussi l'illustrerons-nous par la fleur de tournesol. Comment décrire la couleur de cette fleur, jaune à la périphérie et brune au centre? C'est au modèle descriptif d'offrir la seule façon naturelle de résoudre ce problème. En effet l'expert créateur du modèle ne peux pas ignorer que la fleur de tournesol est en fait une inflorescence, avec des fleurs d'un certain type à la périphérie, et des fleurs d'un autre type (et d'une autre couleur) au centre. Si le modèle descriptif est bien conçu, il doit permettre de décrire successivement les deux types de fleurs. Pour cela le modèle descriptif doit prévoir que l'arbre de description de l'objet fleur puisse, au moins dans le cas du tournesol, être parcouru non

IMAGE imgs/Hyalonema08.gif

Sous sa forme la plus simple, un modèle descriptif revêt donc l'aspect d'un arbre dont chaque noeud est un objet. Ce mode de représentation est comparable aux façons classiques de présenter les caractères observables et leurs états, que ce soit sous forme d'une liste textuelle ou sous forme d'un tableau (par exemple : forme du corps = {arrondie, aplatie, allongée} ; diamètre maximal du corps = {20 - 200} mm ; etc.). Le contenu informatif semble équivalent dans les deux cas. Pourtant, le fait de prendre en compte la structure naturelle des données comporte un avantage. En effet, les liens de la logique de composition permettent des raisonnements de bon sens très utiles. Par exemple, si l'on affirme lors d'une description qu'il n'y a pas d'amphidisques (constituants microscopiques du corps de certaines éponges siliceuses), il n'y a plus lieu de s'intéresser aux sous-parties de l'objet amphidisques : tout l'arbre descriptif correspondant à cet objet est simplement tronqué (objet A absent [!]pas de description de A). Il s'agit d'un syllogisme évident (si objet A absent, et si objet B = sous-partie de A, alors B est absent), appelé "merological syllogism" par WINSTONet al.(1987 : 417). Cette simplification de la formulation obéit au "irrelevance principle" de SUBRAMANIAN(1990). Par opposition, dans les tableaux de données, on serait contraint de saturer toutes les cases correspondant à la description des amphidisques par une pseudo-valeur "NA" (non applicable), qui ne fait que refléter l'inadéquation de ce mode de représentation.
De même, lorsqu'un objet n'est pas observable, on ne peut le décrire. Par exemple, si le pédoncule de l'éponge a été arraché lors de la récolte, on se bornera à indiquer le statut "inconnu" pour l'objet pédoncule, ce qui tronquera ipso factoson sous-arbre descriptif.
Ces avantages procurés par la structuration des données tiennent au fait qu'à chaque objet est associé un état trivalué : présent, absent, inconnu. Seule la présence d'un objet permet d'en faire la description. Et une distinction très nette est faite entre l'absence d'un objet (il s'agit d'une propriété qui peut être distinctive et discriminante), et le fait que l'objet ne puisse pas être observé dans les conditions présentes.

Il est aussi possible que la présence / absence d'un objet n'ait aucune signification classificatoire. Ainsi, dans le cas du pédoncule du genre