|
|
La difficulté est qu'il a fallu travailler à partir de l'existant dans un univers non
paramétrique : les données disponibles sont riches, complexes, hétérogènes en
qualité et en quantité. Outre leur caractère réel ou virtuel, nous sommes
confrontés à des descriptions morphologiques de spécimens "sur la table", ou
extraites des livres anciens, ces descriptions étant parfois incomplètes.
L'incomplétude des descriptions résulte soit :
1) de l'état de l'échantillon récolté,
2) d'opinions préconçues du biologiste qui n'a pas jugé opportun
d'apporter une plus grande précision à certaines de ses observations,
3) du fait de nouveaux critères inaccessibles aux moyens techniques d'une
époque déterminée (critères microscopiques, biochimiques, génétiques,
etc.).
Après discussion avec les systématiciens, nous montrons ce que devrait être une
"bonne" description de spécimen(s) dans le chapitre 4. Une bonne description
s'appuie sur trois facultés à bien distinguer :
|
|
|
|
|
|
|
Un savoir observer, ce qui implique de la part de l'expert de modéliser
l'observablesous la forme d'un modèle descriptif structuré,
Un savoir décrireafin d'acquérir l'observésous forme de descriptions de
qualité, à l'aide d'un questionnaire bâti selon l'architecture du modèle
descriptif,
Un savoir raisonner, afin de traiter les connaissances (l'observable et
l'observé) selon un certain but : le raisonnement inductif pour obtenir une
classification (modélisation de l'observé), le raisonnement déductif et/ou
analogique pour obtenir une détermination.
|
|
|
|
Ces trois savoir-faire sont la clé de voûte de la méthode mise au point au
chapitre 2. Modéliser l'observable est la phase la plus critique pour l'obtention
des descriptions observées : nous illustrons ce constat à l'aide de notre
application sur les éponges marines.
Cette analyse faite, nous exposons le formalisme mathématique retenu pour
décrire les objets biologiques observés. Cet effort d'abstraction est nécessaire à
la compréhension du domaine pour les informaticiens qui peuvent ensuite
développer des méthodes et algorithmes efficaces tenant compte de la sémantique
du domaine. Le formalisme retenu est décrit au chapitre 5. Il est emprunté à
Diday (1987) et a été adapté pour traiter nos descriptions complexes sous forme
d'objets de synthèse booléens. Il met en valeur la nature composite
(dépendante), plus ou moins précise (spécialisable) et itérative (multi-
instanciable) des objets dans les descriptions naturelles. Nous n'utilisons pas les
|
|