|
|
|
Dans notre méthode d'acquisition des connaissances expliquée au chapitre 2, le
traitement des descriptions biologiques est la troisième phase importante du
processus qui permet de répondre aux deux objectifs de classification et de
détermination en biologie. Initialement en apprentissage, la logique inductive est
le raisonnement qui a été utilisé pour répondre à ces deux objectifs afin de
trouver une alternative aux systèmes experts traditionnels à base de règles.
Aujourd'hui, nous souhaitons aller plus loin dans le choix de différentes
méthodes qui seront mieux adaptées chacune à un objectif particulier. Le but de
ce chapitre est de montrer en quoi le raisonnement inductif est plus approprié à la
problématique de la classification telle que nous l'avons définie au § 2.3.2, et
pourquoi une forme de raisonnement analogique, le raisonnement par cas, nous
permet de mieux résoudre le problème de la détermination en biologie. Les
mérites et limites respectives de ces méthodes sont analysées à la lumière de
notre application sur les Hyalonema.
En effet, une fois formalisée la base d'exemples (chapitre 5), nous pouvons
appliquer différentes méthodes de traitement issues à la fois des recherches en
analyse des données et en apprentissage. Il s'agit ici de formaliser le processus
de génération automatique de critères de décision pour :
1)fabriquer un arbre de classification (par induction avec KATE),
2)utiliser cet arbre pour la détermination (par déduction avec KATE),
3)comparer directement les exemples pour la détermination (avec un
raisonnement de type analogique : CaseWork1).
|
|
|
|
Le programme KATE [Manago, 1991] est une extension des techniques
d'induction utilisées dans ID3 [Quinlan, 1983]. Il autorise le traitement d'un
ensemble d'exemples W = {w1,...,wn} composé de descriptions complexes d(w)
sous forme d'objets de synthèse [Diday, 1987], et comportant des relations entre
objets de la description. A chaque d(w) est associée une classe d'identification ci
|
|