|
|
Notre méthode demande que le modèle descriptif soit complet par rapport à un
domaine bien délimité. L'exhaustivité de l'observable est une exigence
théorique très difficile pour l'expert : elle est néanmoins recherchée pour ne pas
devoir changer en profondeur la structure du modèle descriptif, ce qui aura
pour conséquence de devoir modifier les anciens cas "à la main".
En effet, nous n'avons pas encore conçu les outils de maintien de la cohérence
de l'ancienne base de cas par rapport aux changements effectués dans un
nouveau modèle descriptif (élimination d'objets, d'attributs ou de valeurs
possibles, rajout d'objets, changement dans la structure de description, etc.).
Cette phase de mise à jour des données par rapport à un modèle de l'observable
est une des perspectives à prendre en compte dans une prochaine étape pour la
robustesse du système global : il n'est pas possible de tout prévoir dès le départ
dans le modèle.
Pour ce même modèle, nous n'avons pas non plus conçu l'éditeur permettant de
renseigner les règles contextuelles entre les objets et les attributs observables :
par exemple, l'expert ne peut pas indiquer le fait que, lorsque le nombre des
orifices de la face exhalante est unique, alors ce n'est pas la peine de répondre
aux attributs "répartition" et "localisation" des orifices.
Au niveau du traitement des descriptions, nous n'avons pas encore pu mesurer
sur notre application l'intérêt d'intégrer les approches inductive et analogique
pour "savoir raisonner" à des fins de classification et de détermination en
biologie. Cette intégration est l'objet du projet INRECA en cours dont
l'annexe 5 donne un aperçu. Plus spécifiquement, nous souhaiterions associer
une sémantique au niveau du critère de séparation des classes pour ne pas tenir
compte uniquement de son efficacité de discrimination inter-classe : ceci se
comprend bien pour la détermination où il faut arriver rapidement à une
conclusion mais pas forcément pour la classification : le critère mono
dimensionnel du gain d'information est pauvre et peu significatif surtout
lorqu'il reste peu d'exemples à comparer. De plus, un choix arbitraire est
effectué lorsque deux critères ont un pouvoir de discrimination identique. Il
serait bon de faire intervenir d'autres paramètres d'un niveau plus sémantique
que la seule entropie dans la mesure (méta-connaissance sur les objets
prioritaires par rapport aux autres, facteurs de tolérance aux bruits, etc.).
De même, notre outil d'induction comporte certains biais dans sa manière
d'élaborer une classification artificielle. Certains attributs ont un pouvoir de
discrimination intrinsèque plus important du fait du nombre de valeurs
possibles qu'ils possèdent : la forme du corps de l'éponge contient 17 valeurs
lorsqu'elle est traitée sans considérer son type classifié, alors qu'elle ne devrait
en compter que 5 en tenant compte de la taxonomie introduite par l'expert
|
|