1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

VIILE TRAITEMENT DES DESCRIPTIONS BIOLOGIQUES :
KATE ET CASEWORK

Dans notre méthode d'acquisition des connaissances expliquée au chapitre 2, le traitement des descriptions biologiques est la troisième phase importante du processus qui permet de répondre aux deux objectifs de classification et de détermination en biologie. Initialement en apprentissage, la logique inductive est le raisonnement qui a été utilisé pour répondre à ces deux objectifs afin de trouver une alternative aux systèmes experts traditionnels à base de règles. Aujourd'hui, nous souhaitons aller plus loin dans le choix de différentes méthodes qui seront mieux adaptées chacune à un objectif particulier. Le but de ce chapitre est de montrer en quoi le raisonnement inductif est plus approprié à la problématique de la classification telle que nous l'avons définie au § 2.3.2, et pourquoi une forme de raisonnement analogique, le raisonnement par cas, nous permet de mieux résoudre le problème de la détermination en biologie. Les mérites et limites respectives de ces méthodes sont analysées à la lumière de notre application sur les Hyalonema.

En effet, une fois formalisée la base d'exemples (chapitre 5), nous pouvons appliquer différentes méthodes de traitement issues à la fois des recherches en analyse des données et en apprentissage. Il s'agit ici de formaliser le processus de génération automatique de critères de décision pour :

1)fabriquer un arbre de classification (par induction avec KATE), 2)utiliser cet arbre pour la détermination (par déduction avec KATE), 3)comparer directement les exemples pour la détermination (avec un
raisonnement de type analogique : CaseWork
1).

IMAGE imgs/Chapitre701.gif

Le programme KATE [Manago, 1991] est une extension des techniques d'induction utilisées dans ID3 [Quinlan, 1983]. Il autorise le traitement d'un ensemble d'exemples W = {w1,...,wn} composé de descriptions complexes d(w) sous forme d'objets de synthèse [Diday, 1987], et comportant des relations entre objets de la description. A chaque d(w) est associée une classe d'identification ci

IMAGE imgs/Chapitre702.gif
1Ce programme informatique constitue notre véritable contribution lors de cette thèse où il s'agissait de répondre à la question sur la robustesse de la consultation.