|
|
|
(comme les valeurs entières et réelles) en "binarisant" le test. Un seuil est calculé
dynamiquement comme pour le critère "taille" de la figure 1.3. Notons qu'un
critère numérique peut apparaître à plusieurs reprises avec des seuils différents
dans un même chemin de l'arbre. L'algorithme est très efficace et peut traiter de
grosses bases d'exemples (la complexité algorithmique est linéaire en fonction
du nombre des exemples). De plus, sa stratégie descendante (création de
partitions des exemples au noeud courant) permet de traiter certains problèmes de
"bruit" à l'aide de méthodes statistiques comme un élagage en c2. Il permet
également de prendre en compte des coûts associés aux critères et qui dépendent
du domaine d'application: coût financier d'un test, durée d'intervention sur une
chaîne de production pour une application dans l'industrie manufacturière,
douleur infligée à un patient pour une application médicale, fiabilité d'un critère
visuel pour une application d'aide à la photo-interprétation, etc.. On préférera
ainsi faire deux tests qui ne coûtent rien plutôt qu'un seul qui a un coût associé.
On peut donc optimiser d'autres critères outre l'efficacité du diagnostic.
|
|
|
|
A la suite de l'expérience en pathologie végétale décrite ci-dessus, une autre
possibilité d'appliquer les systèmes experts a été proposée au MNHN (Muséum
National d'Histoire Naturelle de Paris) au sein du Laboratoire de Biologie des
Invertébrés Marins et de Malacologie (LBIMM, URA 699 du CNRS). Il ne
s'agissait pas ici de faire de l'aide au diagnostic de symptômes décrits sur des
invertébrés marins mais plutôt de concevoir et réaliser des outils informatiques
pour aider les biologistes à identifier des spécimens, mais aussi à créer des
regroupements de descriptions d'individus, d'espèces ou de sous-genres.
1.5.1 Comparaison avec l'opération SEPV de l'INRA
La problématique est ici analogue à la précédente en ce qui concerne la démarche
scientifique, tout en étant plus générale :
|
|
|
|
|
[!]
|
|
|
au lieu de s'intéresser au couple "symptôme-diagnostic", on travaille sur le
couple "description-détermination". En effet, le diagnostic peut être considéré
comme une forme de détermination dans un certain contexte (la maladie) tout
comme le symptôme est une forme de description selon ce même point de
vue,
on s'intéresse davantage à la nature et à la diversité des spécimens eux-
mêmes. L'objectif n'est pas seulement de déterminer un "avoir" (comme le
nom de la maladie possédée par le spécimen), mais plutôt de déterminer un
nom propre, ce qui fait "l'être" (c'est Solanum lycopersicum6), que l'on
|
|