|
|
modèle descriptif, on pourra dire qu'elle sera une
conjonction de descriptions locales (des
différentes sous-parties) ; à condition de ne pas
oublier d'y adjoindre l'information portée par
l'arbre lui-même, à savoir les liens qui existent
entre les sous-parties :
|
|
Hyalonema, l'état "absent" a été interdit par
l'expert du domaine : une Hyalonemaa toujours
un pédoncule ; si on ne l'observe pas, c'est qu'il a
été arraché, et il n'est donc jamais absent mais
inconnu. Cette connaissance experte, utilement
incluse dans le modèle descriptif, évite que deux
éponges soient artificiellement séparées parce que
l'une a son pédoncule arraché et l'autre non.
Mécanisme d'expression de l'imprécision
Il suffit de parcourir quelques descriptions, parmi
les millions qui ont été publiées, pour se
convaincre de l'omni-présence de l'imprécision.
Pour rester le plus objectif possible, le descripteur
est amené à apporter de multiples nuances ou
pondérations. Le respect de cette finesse
d'expression est aussi nécessaire que compliqué à
formaliser.
Pour le moment, nous avons renoncé à traiter
séparément les différentes sources d'imprécision
dans les observations, qu'elles soient dues à des
erreurs de mesure, à des situations mal définies, à
des difficultés d'appréciation ou même à la prise
en compte de variations locales.
Dans le cas des valeurs numériques (taille, nombre,
etc.), la possibilité est donnée de fournir, à la place
d'une valeur simple, un intervalle plus ou moins
large. Par exemple, si, pour l'objet amphidisques,
on répond [taille(amphidisques)={100,120}], cela
signifie que la taille des amphidisques est
comprise entre 100 et 120 (microns). Notons que,
pour traduire la variabilité, le modèle descriptif
peut fort bien comprendre des attributs statistiques
(moyenne, écart-type,etc.).
Dans le cas des valeurs symboliques (couleur,
forme, répartition,etc.), il est convenu que le
choix simultané de plusieurs valeurs correspond à
une disjonction de ces valeurs. Par exemple, la
réponse [couleur(fleurs)={brun, jaune}] signifie
que la couleur est située quelque part entre le brun
et le jaune. La virgule entre brun et jaune signifie
"ou", et jamais "et".
Mécanisme des objets multiples
Ce mécanisme s'applique dans deux situations, en
fait très voisines.
La première n'a pas été rencontrée dans le
domaine des Hyalonema. Aussi l'illustrerons-nous
par la fleur de tournesol. Comment décrire la
couleur de cette fleur, jaune à la périphérie et
brune au centre? C'est au modèle descriptif
d'offrir la seule façon naturelle de résoudre ce
problème. En effet l'expert créateur du modèle ne
peux pas ignorer que la fleur de tournesol est en
fait une inflorescence, avec des fleurs d'un certain
type à la périphérie, et des fleurs d'un autre type
(et d'une autre couleur) au centre. Si le modèle
descriptif est bien conçu, il doit permettre de
décrire successivement les deux types de fleurs.
Pour cela le modèle descriptif doit prévoir que
l'arbre de description de l'objet fleur puisse, au
moins dans le cas du tournesol, être parcouru non
|
|
|
|
Sous sa forme la plus simple, un modèle descriptif
revêt donc l'aspect d'un arbre dont chaque noeud
est un objet. Ce mode de représentation est
comparable aux façons classiques de présenter les
caractères observables et leurs états, que ce soit
sous forme d'une liste textuelle ou sous forme
d'un tableau (par exemple : forme du corps =
{arrondie, aplatie, allongée} ; diamètre maximal
du corps = {20 - 200} mm ; etc.). Le contenu
informatif semble équivalent dans les deux cas.
Pourtant, le fait de prendre en compte la structure
naturelle des données comporte un avantage. En
effet, les liens de la logique de composition
permettent des raisonnements de bon sens très
utiles. Par exemple, si l'on affirme lors d'une
description qu'il n'y a pas d'amphidisques
(constituants microscopiques du corps de certaines
éponges siliceuses), il n'y a plus lieu de s'intéresser
aux sous-parties de l'objet amphidisques : tout
l'arbre descriptif correspondant à cet objet est
simplement tronqué (objet A absent [!]pas de
description de A). Il s'agit d'un syllogisme évident
(si objet A absent, et si objet B = sous-partie de A,
alors B est absent), appelé "merological
syllogism" par WINSTONet al.(1987 : 417). Cette
simplification de la formulation obéit au
"irrelevance principle" de SUBRAMANIAN(1990).
Par opposition, dans les tableaux de données, on
serait contraint de saturer toutes les cases
correspondant à la description des amphidisques
par une pseudo-valeur "NA" (non applicable),
qui ne fait que refléter l'inadéquation de ce mode
de représentation.
De même, lorsqu'un objet n'est pas observable, on
ne peut le décrire. Par exemple, si le pédoncule de
l'éponge a été arraché lors de la récolte, on se
bornera à indiquer le statut "inconnu" pour
l'objet pédoncule, ce qui tronquera ipso factoson
sous-arbre descriptif.
Ces avantages procurés par la structuration des
données tiennent au fait qu'à chaque objet est
associé un état trivalué : présent, absent, inconnu.
Seule la présence d'un objet permet d'en faire la
description. Et une distinction très nette est faite
entre l'absence d'un objet (il s'agit d'une propriété
qui peut être distinctive et discriminante), et le fait
que l'objet ne puisse pas être observé dans les
conditions présentes.
Il est aussi possible que la présence / absence d'un
objet n'ait aucune signification classificatoire.
Ainsi, dans le cas du pédoncule du genre
|
|
|