|
|
3) mieux comprendre les systèmes naturels.
La robustesse empirique s'appuie sur l'observation familière du travail quotidien
de l'expert qui décrit des spécimens ainsi que sur la prise en compte des
interprétations de ses observations et de son vocabulaire (désambiguation) par
les autres utilisateurs de son système. Le concept de robustesse n'est jamais
acquis définitivement dans les domaines biologiques, il s'adapte et s'améliore
progressivement en ayant la connaissance plus intime du problème posé : il est le
fruit de l'observation du terrain.
Ainsi, pour améliorer la robustesse générale, nous avons mis au point une
méthode d'acquisition de connaissances descriptives dont nous évaluerons
l'adéquation à la démarche des naturalistes. En quelques mots, la méthode
procède ainsi :
1) observation de la diversité des spécimens et modélisation de l'observable
dans un modèle descriptif,
2) construction d'un questionnaire issu du modèle descriptif et description
de l'observé dans une base de cas,
3) induction de règles à partir de la base, détermination de nouveaux faits,
4) validation de l'observé (les cas), validation de l'observable (le modèle),
5) itération.
De plus, nous avons étudié un autre aspect de la robustesse au niveau de la
consultation, celui de déterminer un spécimen face aux non-réponses (ou
réponses «inconnu») de l'utilisateur. Des outils ont été implantés pour répondre
à ces différentes faiblesses (voir plus loin).
Pour acquérir la robustesse escomptée, l'informaticien doit être en mesure de
comprendre le domaine étudié et d'apprécier les différences conceptuelles
inévitables au niveau du vocabulaire employé par les biologistes. Le chapitre 3
est ainsi une sorte de glossaire où nous confrontons les différentes acceptions de
certains mots clés tels que la classification, l'identification, le concept, l'objet,
l'individu, etc..
La clé de voûte de notre étude est le concept de "description" : les deux
communautés de chercheurs (en biologie et en informatique) doivent se mettre
d'accord sur ce qu'il représente d'un point de vue quantitatif (nombre de
descriptions) et qualitatif (niveau des descriptions (espèces ou spécimens),
valeur des descriptions) afin que l'informaticien puisse proposer une offre
adaptée à la sémantique du domaine. Une descriptionest par exemple
considérée comme réellelorsqu'elle concerne un seul spécimen et virtuelle
lorsqu'elle "synthétise" les descriptions de plusieurs spécimens ou d'une
population considérée comme homogène.
|
|