|
|
par rapport à l'induction. Un projet d'intégration des deux approches est en
cours (entre 1992 et 1995) dans le cadre du projet INRECA7(ESPRIT III nº
6322) dont nous joignons en annexe 5 le descriptif sous forme d'un article paru
à EWCBR-93, le premier congrès sur le raisonnement par cas en Europe.
Les limites et mérites respectifs des deux approches seront évalués
expérimentalement sur les descriptions des éponges marines fournies lors de
cette thèse, ainsi que sur d'autres applications industrielles (diagnostic de
pannes) qui ne nous concernent pas directement.
Mais pour l'heure en attendant ces résultats, nous affirmons que pour l'objectif
de classification en biologie, l'expert peut utiliser la méthode inductive avec
KATE afin de découvrir des conjectures par caractérisation des classes des
exemples (sous forme d'arbre ou de règles de décision). La plausibilité de ces
hypothèses peut ensuite être testée directement par l'expert en examinant les
règles apprises, ou par détermination de nouveaux individus (par déduction à
partir de l'arbre).
Si l'objectif est uniquement la détermination d'objets (le diagnostic par exemple),
il est préférable d'utiliser un outil de recherche par comparaison comme
CaseWork qui tient compte de toutes les descriptions et permet d'éviter les
impasses dues à la rencontre d'observations localement impossibles (échantillons
incomplets, mal conservés, etc.).
Dans tous les cas, une justification des erreurs de classement (voir § 3.3) peut
être mise en évidence et révéler l'insuffisance de la base d'exemples (l'observé)
ou du modèle descriptif (l'observable). A tout moment, l'expert doit être capable
de trouver les raisons des "fautes" commises dans les descriptions. Il devra
utiliser les outils de manière interactive, ce qui est une condition d'acceptabilité
du service rendu par l'informatique. Les autres conditions sont liées aux moyens
mis en oeuvre pour acquérir ces descriptions avec l'éditeur de modèle descriptif
et de cas (le questionnaire). Ils doivent être à la fois facile d'accès (souples et
ergonomiques), scientifiquement rigoureux dans la démarche de description
(logique de description, cohérence entre l'observable et l'observé) et permettre
d'exploiter toute la richesse informative du domaine naturel (liaisons intrinsèques
entre caractères, exhaustivité et précision des données descriptives).
Ce n'est que par cet effort de compréhension de la complexité d'un domaine
naturel que l'informaticien est un interlocuteur utile pour l'expert : il sera disposé
à adapter le modèle à la réalité des connaissances et non l'inverse.
|
|