|
|
reflète le domaine de discours et les connaissances instantannées de l'expert :
cela évolue nécessairement.
La validation des connaissances apprises (règles, arbre de décision) n'est pas
ainsi seulement un processus post-opératoire sur les données comme nous
pouvions le penser avant cette thèse. La qualité d'une classification artificielle
est dépendante de la précision et de l'exhaustivité des descriptions fournies. En
introduisant des connaissances "de fond" (le modèle descriptif), il s'agit pour
l'expert de valider l'expérience acquise mais non toujours explicite (les "savoir
observer" et "savoir décrire") avant d'appliquer un raisonnement. Cette
caractéristique est à prendre en compte pour les perspectives de développement
d'outils d'aide à la validation de ce savoir en phase d'acquisition des exemples.
N'oublions pas que le temps consacré à cette phase est de loin le plus important
dans la méthode d'apprentissage utilisée.
Dans l'avenir, le rôle de l'informaticien désireux de concrétiser son travail de
recherche sur l'acquisition des connaissances ne se bornera pas à fournir des
outils de traitement des données ("classez, nous classifierons ensuite !"). Il lui
faudra assumer un rôle de cogniticien, prêt à s'investir avec la curiosité
nécessaire pour comprendre les difficultés inhérentes au domaine étudié. Il est
préférable qu'il parte d'ailleurs de problèmes concrets à résoudre et qui sont
posés par l'expert (par exemple, celui de traiter le biais introduit par la quantité
d'information des attributs classifiés dont on ne considère que les feuilles de la
taxonomie des valeurs possibles). C'est une démarche coopérative et
pluridisciplinaire qui doit partir des travaux existants pour améliorer la
robustesse des systèmes d'aide à la classification et à la détermination en
biologie.
Cette amélioration passe par la revalorisation de la notion de description dont
le schéma 8.1 montre le rôle central. Elle doit exprimer toute la richesse du
domaine naturel et refléter l'état des connaissances de l'expert à un moment
donné. Il ne suffit pas de savoir représenter des connaissances à l'aide d'un
langage à objets pour obtenir un système de détermination robuste. Il faut
pouvoir expliciter correctement la connaissance de l'expert en facilitant sa
structuration (facteurs de compréhension et de précision), apprécier sa diversité
(exhaustivité et redondance), et connaître sa sémantique pour les autres
utilisateurs de son système (compréhension, ergonomie et tolérance aux
bruits).
Le progrès technologique des ordinateurs permet de reconsidérer des pratiques
anciennes considérées comme utopiques à l'époque d'Adanson : les
descriptions de spécimens. Ces dernières sont compatibles avec les capacités
de stockage des machines actuelles, ce qui permet de conserver le maximum
d'information par rapport à des "descriptions" de concepts. Posons-nous donc
la question de savoir ce que sont les véritables qualités d'une donnée après le
|
|