1 2 3 4 5 6 7 8 9 10

6

Chapitre 0

3) mieux comprendre les systèmes naturels.

La robustesse empirique s'appuie sur l'observation familière du travail quotidien de l'expert qui décrit des spécimens ainsi que sur la prise en compte des interprétations de ses observations et de son vocabulaire (désambiguation) par les autres utilisateurs de son système. Le concept de robustesse n'est jamais acquis définitivement dans les domaines biologiques, il s'adapte et s'améliore progressivement en ayant la connaissance plus intime du problème posé : il est le fruit de l'observation du terrain.

Ainsi, pour améliorer la robustesse générale, nous avons mis au point une méthode d'acquisition de connaissances descriptives dont nous évaluerons l'adéquation à la démarche des naturalistes. En quelques mots, la méthode procède ainsi :

1) observation de la diversité des spécimens et modélisation de l'observable
dans un modèle descriptif,
2) construction d'un questionnaire issu du modèle descriptif et description
de l'observé dans une base de cas,
3) induction de règles à partir de la base, détermination de nouveaux faits, 4) validation de l'observé (les cas), validation de l'observable (le modèle), 5) itération.

De plus, nous avons étudié un autre aspect de la robustesse au niveau de la consultation, celui de déterminer un spécimen face aux non-réponses (ou réponses «inconnu») de l'utilisateur. Des outils ont été implantés pour répondre à ces différentes faiblesses (voir plus loin).

Pour acquérir la robustesse escomptée, l'informaticien doit être en mesure de comprendre le domaine étudié et d'apprécier les différences conceptuelles inévitables au niveau du vocabulaire employé par les biologistes. Le chapitre 3 est ainsi une sorte de glossaire où nous confrontons les différentes acceptions de certains mots clés tels que la classification, l'identification, le concept, l'objet, l'individu, etc..

La clé de voûte de notre étude est le concept de "description" : les deux communautés de chercheurs (en biologie et en informatique) doivent se mettre d'accord sur ce qu'il représente d'un point de vue quantitatif (nombre de descriptions) et qualitatif (niveau des descriptions (espèces ou spécimens), valeur des descriptions) afin que l'informaticien puisse proposer une offre adaptée à la sémantique du domaine. Une descriptionest par exemple considérée comme réellelorsqu'elle concerne un seul spécimen et virtuelle lorsqu'elle "synthétise" les descriptions de plusieurs spécimens ou d'une population considérée comme homogène.