1 2 3 4 5 6 7 8

235

Conclusion

IMAGE imgs/conclusion03.gif

Notre méthode demande que le modèle descriptif soit complet par rapport à un domaine bien délimité. L'exhaustivité de l'observable est une exigence théorique très difficile pour l'expert : elle est néanmoins recherchée pour ne pas devoir changer en profondeur la structure du modèle descriptif, ce qui aura pour conséquence de devoir modifier les anciens cas "à la main".

En effet, nous n'avons pas encore conçu les outils de maintien de la cohérence de l'ancienne base de cas par rapport aux changements effectués dans un nouveau modèle descriptif (élimination d'objets, d'attributs ou de valeurs possibles, rajout d'objets, changement dans la structure de description, etc.). Cette phase de mise à jour des données par rapport à un modèle de l'observable est une des perspectives à prendre en compte dans une prochaine étape pour la robustesse du système global : il n'est pas possible de tout prévoir dès le départ dans le modèle.

Pour ce même modèle, nous n'avons pas non plus conçu l'éditeur permettant de renseigner les règles contextuelles entre les objets et les attributs observables : par exemple, l'expert ne peut pas indiquer le fait que, lorsque le nombre des orifices de la face exhalante est unique, alors ce n'est pas la peine de répondre aux attributs "répartition" et "localisation" des orifices.

Au niveau du traitement des descriptions, nous n'avons pas encore pu mesurer sur notre application l'intérêt d'intégrer les approches inductive et analogique pour "savoir raisonner" à des fins de classification et de détermination en biologie. Cette intégration est l'objet du projet INRECA en cours dont l'annexe 5 donne un aperçu. Plus spécifiquement, nous souhaiterions associer une sémantique au niveau du critère de séparation des classes pour ne pas tenir compte uniquement de son efficacité de discrimination inter-classe : ceci se comprend bien pour la détermination où il faut arriver rapidement à une conclusion mais pas forcément pour la classification : le critère mono dimensionnel du gain d'information est pauvre et peu significatif surtout lorqu'il reste peu d'exemples à comparer. De plus, un choix arbitraire est effectué lorsque deux critères ont un pouvoir de discrimination identique. Il serait bon de faire intervenir d'autres paramètres d'un niveau plus sémantique que la seule entropie dans la mesure (méta-connaissance sur les objets prioritaires par rapport aux autres, facteurs de tolérance aux bruits, etc.).

De même, notre outil d'induction comporte certains biais dans sa manière d'élaborer une classification artificielle. Certains attributs ont un pouvoir de discrimination intrinsèque plus important du fait du nombre de valeurs possibles qu'ils possèdent : la forme du corps de l'éponge contient 17 valeurs lorsqu'elle est traitée sans considérer son type classifié, alors qu'elle ne devrait en compter que 5 en tenant compte de la taxonomie introduite par l'expert