thèse | auteur | jury | résumé | abstract | Index/Downloads |
Thèse | |
Thèse présentée à L'UNIVERSITE PARIS IX-DAUPHINE (U.F.R. Sciences des Organisations) pour obtenir le titre de DOCTEUR ès SCIENCES spécialité INFORMATIQUE. Soutenue le 24 mai 1994 |
|
Auteur | |
Noël Conruyt | |
Jury | |
Directeur : E.DIDAY Rapporteurs : M.C.HATON, D.DOUMENC Examinateurs : S.PINSON, C.LEVI, J.LE RENARD, J.LEBBE, M.MANAGO |
|
Résumé | |
Notre démarche sur la robustesse des systèmes d'aide à la description, à la classification et à la détermination des objets biologiques s'appuie sur l'application de la méthode scientifique en biologie (expérimenter et tester) afin d'aider les naturalistes à mieux comprendre leur domaine, à éprouver leurs opinions et à transmettre leurs connaissances. Nous avons conçu des outils informatiques conviviaux permettant de construire une base de descriptions structurées et pré-classées (les exemples), d'apprendre des hypothèses inductives (les classifications), puis de les mettre à l'épreuve par de nouvelles observations (détermination déductive ou identification). La qualité des descriptions est fondamentale pour l'apprentissage. De plus, elles doivent être comparables entre elles, et reposent donc sur un modèle descriptif que l'expert va explicitement représenter et structurer. Pour l'aider, nous avons dégagé certains mécanismes d'observation à partir de monographies publiées dans la littérature. Le modèle correspond aux objets observables du domaine représenté par un arbre de description. Ensuite, un questionnaire est construit automatiquement à partir du modèle descriptif. Le biologiste utilise celui-ci comme un guide d'observation pour acquérir des descriptions observées et constituer une base de cas cohérente par rapport au modèle. Les cas sont alors traités selon deux technologies complémentaires en fonction de l'objectif poursuivi. Pour la classification, une méthode d'apprentissage inductif permet d'engendrer un arbre de décision caractérisant les classes. Pour la détermination, le raisonnement par cas remplace avantageusement l'induction en partant directement des exemples et en indexant dynamiquement les critères en fonction des réponses de l'utilisateur. Néanmoins, la méthode inductive, tout comme l'utilisation répétitive du questionnaire, permet de détecter des incohérences éventuelles dans la base de cas, ce qui permet la validation du modèle descriptif. La méthode proposée donne donc à l'expert la possibilité de mettre à jour les connaissances en fonction des résultats (classification et identification) et d'améliorer son modèle descriptif de manière itérative afin de constituer un système d'apprentissage de plus en plus robuste, prélude à l'élaboration d'outils de TAO (Taxonomie Assistée par Ordinateur) plus performants. | |
Mots clefs | |
description, classification, détermination, robustesse, apprentissage inductif, raisonnement par cas, modèle descriptif, questionnaire, acquisition de connaissances, objet, systématique, éponges marines, biologie | |
Abstract | |
Our approach of robustness for systems that help to describe, classify and identify biological objects is based on the application of the scientific method in biology (experimenting and testing), in order to help naturalists to understand their domain better, test their opinions, and transmit their knowledge. We have built user-friendly computer tools to allow the construction of structured and pre-classified descriptions (the examples), to learn inductive hypothesis (classifications), and test them with new observations (by identification). The quality of descriptions is fundamental for the learning process. Besides, they must be comparable, and so rely on a descriptive model that the expert must explicitly represent and structure. To help him, we have stressed some observational mechanisms from monographs published in scientific literature. The model corresponds to the objects that can be observed in the domain: they are represented in a description tree. Then, a questionnaire that matches the descriptive model is automatically built; it allows the biologist to use it as an observation guide, to acquire observed descriptions and build a case base that is consistent with the model. Two different types of technology can be used in order to process the case base, depending on the goal to be achieved. For classification purposes, a decision tree is developed using inductive learning from examples to characterize the classes. For identification purposes, a case based reasoning strategy is used. It dynamically extracts the most efficient descriptors and produces better identifications than by following a path of a decision tree. Nevertheless, inductive learning as well as the repetitive use of the questionnaire remains useful for detecting possible inconsistencies within the cases library, thus allowing a validation of the descriptive model. The method proposed here gives to the expert the ability to update the knowledge base according to the results obtained during classification and/or identification, and thus improve iteratively his descriptive model and case base. This process brings more robustness and leads to the elaboration of more powerful CAT (Computer Assisted Taxonomy) tools. | |
Index/Downloads : |
Page de garde | |
Dédicace/Remerciements | |
Table des matières | |
Introduction | |
Chapitre I : Le cheminement conceptuel | |
Chapitre II : Qu'est-ce que la robustesse ? | |
Chapitre III : Terminologie et concepts mis en oeuvre | |
Chapitre IV : Le rôle central des descriptions en sciences naturelles | |
Chapitre V : Formalisation de la notion d'objet en biologie | |
Chapitre VI : Formalisation informatique des descriptions : HyperQuest | |
Chapitre VII : Le traitement des descriptions biologiques : Kate et Casework | |
Conclusion | |
Références | |
Liste des figures | |
Annexe I | |
Annexe II | |
Annexe III | |
Annexe IV | |
Annexe V | |
Annexe VI | |
Poster |
[ Page d' Accueil | Publications | Bienvenue | Top ]
© IREMIA - Equipe IKBS - 03/1999