Introduction

1 2 3 4 5 6 7 8 9 10



		10
		10			Chapitre 0
		par rapport à l'induction. Un projet d'intégration des deux approches est en cours (entre 1992 et 1995) dans le cadre du projet INRECA⁷(ESPRIT III nº 6322) dont nous joignons en annexe 5 le descriptif sous forme d'un article paru à EWCBR-93, le premier congrès sur le raisonnement par cas en Europe. Les limites et mérites respectifs des deux approches seront évalués expérimentalement sur les descriptions des éponges marines fournies lors de cette thèse, ainsi que sur d'autres applications industrielles (diagnostic de pannes) qui ne nous concernent pas directement. Mais pour l'heure en attendant ces résultats, nous affirmons que pour l'objectif de classification en biologie, l'expert peut utiliser la méthode inductive avec KATE afin de découvrir des conjectures par caractérisation des classes des exemples (sous forme d'arbre ou de règles de décision). La plausibilité de ces hypothèses peut ensuite être testée directement par l'expert en examinant les règles apprises, ou par détermination de nouveaux individus (par déduction à partir de l'arbre). Si l'objectif est uniquement la détermination d'objets (le diagnostic par exemple), il est préférable d'utiliser un outil de recherche par comparaison comme CaseWork qui tient compte de toutes les descriptions et permet d'éviter les impasses dues à la rencontre d'observations localement impossibles (échantillons incomplets, mal conservés, etc.). Dans tous les cas, une justification des erreurs de classement (voir § 3.3) peut être mise en évidence et révéler l'insuffisance de la base d'exemples (l'observé) ou du modèle descriptif (l'observable). A tout moment, l'expert doit être capable de trouver les raisons des "fautes" commises dans les descriptions. Il devra utiliser les outils de manière interactive, ce qui est une condition d'acceptabilité du service rendu par l'informatique. Les autres conditions sont liées aux moyens mis en oeuvre pour acquérir ces descriptions avec l'éditeur de modèle descriptif et de cas (le questionnaire). Ils doivent être à la fois facile d'accès (souples et ergonomiques), scientifiquement rigoureux dans la démarche de description (logique de description, cohérence entre l'observable et l'observé) et permettre d'exploiter toute la richesse informative du domaine naturel (liaisons intrinsèques entre caractères, exhaustivité et précision des données descriptives). Ce n'est que par cet effort de compréhension de la complexité d'un domaine naturel que l'informaticien est un interlocuteur utile pour l'expert : il sera disposé à adapter le modèle à la réalité des connaissances et non l'inverse.
		7_{INduction and REasoning from CAses.}