1 2 3 4 5 6 7 8

237

Conclusion

reflète le domaine de discours et les connaissances instantannées de l'expert : cela évolue nécessairement.

La validation des connaissances apprises (règles, arbre de décision) n'est pas ainsi seulement un processus post-opératoire sur les données comme nous pouvions le penser avant cette thèse. La qualité d'une classification artificielle est dépendante de la précision et de l'exhaustivité des descriptions fournies. En introduisant des connaissances "de fond" (le modèle descriptif), il s'agit pour l'expert de valider l'expérience acquise mais non toujours explicite (les "savoir observer" et "savoir décrire") avant d'appliquer un raisonnement. Cette caractéristique est à prendre en compte pour les perspectives de développement d'outils d'aide à la validation de ce savoir en phase d'acquisition des exemples. N'oublions pas que le temps consacré à cette phase est de loin le plus important dans la méthode d'apprentissage utilisée.

Dans l'avenir, le rôle de l'informaticien désireux de concrétiser son travail de recherche sur l'acquisition des connaissances ne se bornera pas à fournir des outils de traitement des données ("classez, nous classifierons ensuite !"). Il lui faudra assumer un rôle de cogniticien, prêt à s'investir avec la curiosité nécessaire pour comprendre les difficultés inhérentes au domaine étudié. Il est préférable qu'il parte d'ailleurs de problèmes concrets à résoudre et qui sont posés par l'expert (par exemple, celui de traiter le biais introduit par la quantité d'information des attributs classifiés dont on ne considère que les feuilles de la taxonomie des valeurs possibles). C'est une démarche coopérative et pluridisciplinaire qui doit partir des travaux existants pour améliorer la robustesse des systèmes d'aide à la classification et à la détermination en biologie.

Cette amélioration passe par la revalorisation de la notion de description dont le schéma 8.1 montre le rôle central. Elle doit exprimer toute la richesse du domaine naturel et refléter l'état des connaissances de l'expert à un moment donné. Il ne suffit pas de savoir représenter des connaissances à l'aide d'un langage à objets pour obtenir un système de détermination robuste. Il faut pouvoir expliciter correctement la connaissance de l'expert en facilitant sa structuration (facteurs de compréhension et de précision), apprécier sa diversité (exhaustivité et redondance), et connaître sa sémantique pour les autres utilisateurs de son système (compréhension, ergonomie et tolérance aux bruits).

Le progrès technologique des ordinateurs permet de reconsidérer des pratiques anciennes considérées comme utopiques à l'époque d'Adanson : les descriptions de spécimens. Ces dernières sont compatibles avec les capacités de stockage des machines actuelles, ce qui permet de conserver le maximum d'information par rapport à des "descriptions" de concepts. Posons-nous donc la question de savoir ce que sont les véritables qualités d'une donnée après le