1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

30

Chapitre 1

représentation des connaissances par vecteurs "attribut-valeur" (logique des propositions ou logique d'ordre 0). Il n'utilise aucune connaissance sur le domaine, c'est à dire aucune taxonomie (ex : blanc et jaune sont des couleurs claires), aucune règle (ex : lorsqu'il y a une multitude de taches sur une feuille, alors leur taille est petite), aucune relation. Il ne peut pas par exemple représenter les objets composites (une plante est formée d'une tige, de feuilles, de racines, etc.) et les hiérarchies de spécialisation d'objets (un symptôme peut être précisé par les termes de tache, anomalie de coloration, flétrissement, etc.).

Si ce mode de représentation des connaissances est adéquat pour certaines applications simples, il s'est avéré beaucoup trop limité pour notre application en pathologie végétale. Nous devons être capable de représenter un nombre quelconque d'objets du même type : il peut en effet y avoir jusqu'à six symptômes différents sur une même plante avec par exemple deux sortes de taches sur les feuilles qui n'indiquent pas la même maladie ! Cette caractéristique objective(car naturellement présente) ne peut pas s'exprimer autrement qu'en introduisant des variables indicées aux objets comme par exemple tache(1) et tache(2) indiquant que l'on a deux sortes de taches, ce qui est la caractéristique d'un formalisme d'ordre 1 ou logique des prédicats.

De plus, la description des exemples est faite de manière subjectivepar des observateurs de nature multiple. Les utilisateurs moins qualifiés que l'expert ne reconnaissent pas forcément les symptômes à décrire : ils peuvent en voir qui sont secondaires ou non pertinents aux yeux de l'expert (par rapport aux maladies possibles de la plante). Ceci peut être dû soit à des "faux symptômes" (par exemple, des taches de cuivre issues d'un précédent traitement à la bouillie bordelaise) ou à des problèmes d'évolution ou de convergence des symptômes observés à des stades avancés de la maladie (ex : un flétrissement évoluant en jaunissement pour le "chancre bactérien"). La manifestation de la maladie donnera l'apparence de deux symptômes différents que le technicien agricole décrira alors que l'expert n'en verra qu'un seul, celui qui est la cause primaire de la maladie (le flétrissement est ainsi le symptôme "pathognomonique" de Corynebacterium michiganense) [Conruyt & Piaton, 1987]. Ce "bruit" lié aux compétences en matière d'observation (fig. 1.2) illustre la complexité des descriptions de symptômes que les utilisateurs sont capables de fournir au système d'apprentissage.

Il est donc souhaitable que le système sache montrer comment observer, au travers d'un questionnaire guidant l'observation de l'utilisateur. Cela nécessite une hiérarchisation des descripteurs entre eux, chacun obtenant un statut propre plus ou moins dépendant des autres dans la hiérarchie. La recherche d'un certain ordre de description met en lumière la notion d'objetdans la structuration des connaissances. Il n'est plus possible de considérer les caractéristiques comme indépendantes les unes des autres comme cela est le cas dans les tableaux de données classiques utilisés par ID3 ou Neddie.