1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

36

Chapitre 1

(comme les valeurs entières et réelles) en "binarisant" le test. Un seuil est calculé dynamiquement comme pour le critère "taille" de la figure 1.3. Notons qu'un critère numérique peut apparaître à plusieurs reprises avec des seuils différents dans un même chemin de l'arbre. L'algorithme est très efficace et peut traiter de grosses bases d'exemples (la complexité algorithmique est linéaire en fonction du nombre des exemples). De plus, sa stratégie descendante (création de partitions des exemples au noeud courant) permet de traiter certains problèmes de "bruit" à l'aide de méthodes statistiques comme un élagage en c2. Il permet également de prendre en compte des coûts associés aux critères et qui dépendent du domaine d'application: coût financier d'un test, durée d'intervention sur une chaîne de production pour une application dans l'industrie manufacturière, douleur infligée à un patient pour une application médicale, fiabilité d'un critère visuel pour une application d'aide à la photo-interprétation, etc.. On préférera ainsi faire deux tests qui ne coûtent rien plutôt qu'un seul qui a un coût associé. On peut donc optimiser d'autres critères outre l'efficacité du diagnostic.

IMAGE imgs/Chapitre123.gif

A la suite de l'expérience en pathologie végétale décrite ci-dessus, une autre possibilité d'appliquer les systèmes experts a été proposée au MNHN (Muséum National d'Histoire Naturelle de Paris) au sein du Laboratoire de Biologie des Invertébrés Marins et de Malacologie (LBIMM, URA 699 du CNRS). Il ne s'agissait pas ici de faire de l'aide au diagnostic de symptômes décrits sur des invertébrés marins mais plutôt de concevoir et réaliser des outils informatiques pour aider les biologistes à identifier des spécimens, mais aussi à créer des regroupements de descriptions d'individus, d'espèces ou de sous-genres.

1.5.1 Comparaison avec l'opération SEPV de l'INRA

La problématique est ici analogue à la précédente en ce qui concerne la démarche scientifique, tout en étant plus générale :

[!]

au lieu de s'intéresser au couple "symptôme-diagnostic", on travaille sur le couple "description-détermination". En effet, le diagnostic peut être considéré comme une forme de détermination dans un certain contexte (la maladie) tout comme le symptôme est une forme de description selon ce même point de vue,

on s'intéresse davantage à la nature et à la diversité des spécimens eux- mêmes. L'objectif n'est pas seulement de déterminer un "avoir" (comme le nom de la maladie possédée par le spécimen), mais plutôt de déterminer un nom propre, ce qui fait "l'être" (c'est Solanum lycopersicum6), que l'on

[!]

IMAGE imgs/Chapitre102.gif
6Plus connu sous le nom vernaculaire de "tomate".