conf. | auteurs | résumé | mots-clefs | abstract | key words | downloads | article |
Conf. | |
Séminaire technique ZNIEFF-mer D.O.M. Guadeloupe, nov. 1997 |
|
Auteurs | |
Faure G., Conruyt N., Pichon M., Guillaume M., Grosser D, Geynet Y. | |
Résumé | |
Une base de connaissances sur les coraux de La Réunion
et de l'ensemble des Mascareignes est en cours de création.
Elle a pour support une collection d'environ 3000 spécimens
appartenant à 58 genres et 185 espèces. Cette base
de connaissances constitue un outil informatique d'aide à
l'identification et à la classification des spécimens
de Scléractiniaires de l'archipel (Réunion, Maurice,
Rodrigues). Dans le but de mettre en oeuvre la méthode
scientifique en biologie (conjecturer et tester), notre approche
suit le processus d'acquisition des connaissances. Celle-ci est
divisée en trois étapes, dont la première
constitue la partie la plus importante de la méthode.
A ce jour, seule la famille des Pocilloporidae est enregistrée dans la base de connaissances. L'ensemble des Astrocoeniidae et des Thamnasteriidae (2 genres, 9 espèces), des Fungiidae (6 genres et sous genres, 11 espèces), est actuellement expertisé. L'expertise de la famille des Poritidae est en cours de réalisation, de même que celle des Agariciidae. |
|
Mots-clefs | |
base de connaissances, Scléractiniaires, Mascareignes, modèle descriptif, traitement des connaissances, validation | |
Abstract | |
A Scleractinian knowledge base is coming true from a Mascarene
Archipelago (Reunion, Mauritius, Rodriguez islands) corals collection(
about 3000 specimens belonging to 58 genera and 185 species).
It consists of a computer aided systematics tools for describing,
classifying and identifying coral specimens. In order to apply
the scientific method in biology (conjecture and test), our approch
follows a natural process of knowledge acquisition which is divided
in three steps :
At the moment, the family Pocilloporidae is the only one to be recorded in the knowledge base, but for others, such as Astrocoeniidae and Thamnasteriidae (including 2 genera, 9 species) Fungiidae (6 genera and sub-genera, 11 species). families, the first step (acquisition of a descriptive model) is now effected. The valuation of the families Poritidae, Agariciidae is on the way to be achieved. |
|
Key words | |
knowledge base, Scleractinian-corals, Mascarene Archipelago, descriptive model, processing of the knowledge, validation | |
Downloads | |
ZNIEFF97.pdf.gz ZNIEFF97.ps.gz | |
Article : |
G. FAURE : Université de Montpellier II- Institut des Sciences de l'Ingénieur, 34O95, Montpellier &Université de Provence(Marseille I) " Dynamique des Récifs "UPRESA 6019
N. CONRUYT : Université de La Réunion- IREMIA- B.P. 7151 - 97415- St-Denis - La Réunion.
M. PICHON : EPHE, Université de Perpignan, Avenue de Villeneuve, 66025- Perpignan.
M. GUILLAUME : BIM, MNHN, URA 699-CNRS, 55, rue de Buffon, 75OO5- Paris.
D. GROSSER : Université de La Réunion - IREMIA- B.P. 7151- 97415- St-Denis - La Réunion.
Y. GEYNET : Université de La Réunion -
IREMIA- B.P. 7151- 97415- St-Denis - La Réunion.
La mise en oeuvre d'outils informatiques permettant la gestion de collections, la description, la classification des espèces du monde vivant, apparait aujourd'hui comme une nécessité dans le domaine de la biodiversité. L'existence d'une importante et récente collection de Scléractiniaires (environ 3000 spécimens appartenant à 58 genres et 185 espèces, déposés à l'Université de La Réunion, au Muséum de St-Denis, au MNHN de Paris, et récoltés dans les trois iles de l'archipel : Réunion, Maurice, Rodrigues) (G.FAURE., 1982), constitue un patrimoine scientifique qu'il convenait de conserver et de valoriser, en utilisant les techniques informatiques appropriées que constituent les bases de données et de connaissances (CONRUYT N., 1994)
Les bases de données scientifiques sur la biodiversité, qui se développent actuellement en biologie, sont mises sur support CD-ROM (ex. : ETI en Hollande, ICLARM aux Philippines, etc...) ,ou sont accessibles par INTERNET (ex. : HBS à Hawaii, AIMS et CSIRO en Australie, etc...). Elles constituent des moyens de diffusion de l'information sur les espèces biologiques.
Contrairement à ces systèmes d'information bibliographique et/ou taxinomique qui nécessitent de connaître le nom (ou taxon) du spécimen, les bases de connaissances offrent une aide à l'identification pour ceux qui ne connaissent pas le nom d'un échantillon, et une aide à la classification pour les spécialistes,dont le domaine n'est que partiellement étudié (ce qui est vrai pour une grande partie de la faune marine, ainsi également , que pour la flore et la faune tropicales terrestres).
2.- BASE DE CONNAISSANCES SUR LES CORAUX DE LA REUNION ET DES MASCAREIGNES.
Une dizaine d'experts se partagent la connaissance des coraux dans le monde. Dans quelques années, du fait de leur départ, l'expertise accumulée pour les identifier ne sera plus disponible . Il ne restera que les collections et les monographies et la mémoire littéraire pour reconnaître les espèces.
Connaissant le rôle très important des écosystèmes récifaux pour l'équilibre de la planète, et les dégradations continuelles opérées par l'homme sur son milieu naturel, il est impératif de pouvoir transmettre ce savoir aux personnes chargées de la biodiversité des milieux récifaux ainsi qu'aux futurs systématiciens.
La gestion des connaissances en sciences de la vie, nécessite de s'appuyer sur une démarche expérimentale. Les experts en sciences de la vie appliquent une méthode inductive fondée sur l'observation des faits, l'énoncé d'hypothèses, la pratique de tests expérimentaux pour mettre ces hypothèses à l'épreuve.
Nous avons construit un atelier de gestion de bases de connaissances itératif qui reproduit ces trois étapes sous la forme suivante (Fig. 1).
Fig.1.- Méthodologie de gestion des connaissances .
A l'aide de ces outils, l'expert peut appliquer la méthode scientifique en biologie : expérimenter (apprendre des règles de classification à partir de l'arbre inductif) et tester (mettre à l'épreuve les hypothèses inductives par de nouvelles observations). Le non-spécialiste va pouvoir consulter les systèmes expert résultant, avec une forte probabilité de succès (par détermintion déductive ou identification comparative).
Le but de cette phase est de construire une base de descriptions qui soient comparables entre elles. Ces descriptions structurées et pré-classées par l'expert ,permettent de constituer une base de cas ( 90 cas actuellement pour le seul genre Pocillopora) . Lors de la phase d'acquisition des connaissances, nous distinguons l'étape d'acquisition du modèle descriptif (l'observable), de l'étape d'acquisition des descriptions (l'observé).
Le modèle descriptif représente tout ce qui est observable pour notre domaine d'étude. Sa réalisation constitue une étape fondamentale de la méthode (CONRUYT N. et al., 1997 a,b). De sa qualité, dépend la validité de la base de connaissances. L'expert (ou mieux le groupe d'experts) doit (outre ses compétences) collationner un très grand nombre d'informations bibliographiques, de terrain (variabilité intra-spécifique ,notions d'écomorphes et de géomorphes), utilisation et redescription des types... Il doit, dans un deuxième temps, discerner et hiérarchiser les caractères spécifiques et génériques significatifs. La définition du modèle est représentée sous forme d'un schéma structuré de tous les objets, attributs et valeurs possibles du domaine, ce dernier constituant la racine de ce que l'on nomme l'arbre de description . Pour construire cet arbre, nous suivons certaines logiques descriptives en sciences de la vie, avec des règles de bon sens pour décrire une espèce :(dé)composition, point de vue, spécialisation, multi-instanciation, conditions contextuelles (LE RENARD J. & CONRUYT N., 1994). Pour la famille des Pocilloporidae, par exemple, 45 objets et 97 attributs ont été recencés pour 4 genres et 14 espèces (Fig.2). Ensuite, un questionnaire est construit automatiquement à partir du modèle descriptif. Le biologiste utilise celui-ci comme un guide d'observation pour acquérir des descriptions observées et constituer une base de cas cohérente par rapport au modèle (Fig. 3 a et b ; Fig.4 a et b ).
Fig. 3. a - Une vue locale de l'objet " calices de l'apex " chez P. damicornis acuta : caractéristiques
Fig. 3. b - Une vue locale de l'objet " calices de l'apex " chez P.damicornis acuta :composants.
Fig. 4 a- Un exemple d'attribut commenté
Fig.4. b - Un exemple d'attribut illustré.
3.2.- Traitement des connaissances.
Les cas sont alors traités selon deux technologies complémentaires en fonction de l'objectif poursuivi. Pour la classification, un arbre de décision est construit. A partir des descripions (représentation en extension), une méthode inductive fondée sur l mesure d'entropie et du gain d'information fabrique une caractérisation des classes par un ensemble de régles .Chaque chemin depuis l racine vers les feuilles de l'arbre de décision est une règle de classification (également appelée diagnose ).
Pour les Pocillopora (genre de coraux très courant dans les Mascareignes), nous donnons à titre indicatif l'arbre de décision suivant, qui les classifie les 9 descriptions des types (espèces et écomorphes) (Fig.5).
Fig.5.- Exemple d'arbre de décision pour classifier le
genre Pocillopora.
Cet arbre de classification peut être utilisé pour déterminer une nouvelle observation. Nénmoins, lorsque l'utilisateur répond " inconnu " à une quesion, la consultation de cet arbre est idadaptée.
Pour l' identification, le raisonnement à partir
de cas est utilisé. Etant donné un ensemble d'exemples,
notre méthode extrait dynamiquement le critère le
plus efficace à partir d'une liste ordonnée de tests,
après chaque réponse de l'utilisateur (Fig. 6).
Les cas sont sélectionnés en fonction de cette réponse.
Si la réponse est inconnue, le second test le plus discriminant
est proposé à l'utilisateur, et ainsi de suite.
D'autres méthodes faisant appel à des mesures de
ressemblance peuvent être utilisées (identification
par comparaison).
Fig. 6.- La liste des tests ordonnés à un noeud
(ici la racine) est choisie par l'intermédiaire d'une mesure
de discrimination inter-classes. A chaque noeud, l'attribut le
plus discriminent est choisi pour séparer les cas.
3.3. Validation des connissances et itération.
Pour la classification, l'expert va pouvoir analyser les règles produites. Il contrôlera si les diagnoses son significatives pour séparer les espèces voisines. Il pourra aussi détecter certaines erreurs dans ses descriptions ayant servi à générer l'arbre de décision.
Pour l'identification, une phase de test est nécessaire pour contrôler la fiabilité des résultats à l'aide du raisonnement par cas. Cette épreuve de vérité permet de savoir si le système d'identification est robuste ou non (tolérance aux bruits). Dans une phase d'expérimention, différents utilisateurs (novices du domaine, autres experts) utilisent le questionnaire avec des spécimens,soit non décrits initialement dans la base de cas, soit déjà décrits par d'autres expérimentateurs. Les résultats du sytème expert sont alors comparés aux identifications de l'expert. L'idéal serait de pouvoir pour chaque description d'espèce, constituer un " pool " d'experts, afin de renforcer la " robustesse " de l'arbre de description.
Il s'en suit une phase d'évaluation et de discussion, où l'expert va pouvoir détecter certaines incohérences dans le modèle descriptif et/ou dans la base de cas (mauvais choix de caractères, illustrations non significatives, vocabulaire imprécis et/ou insuffisant, etc...).Une concertation entre les utilisateurs et l'expert permet d'identifier les différences d'interprétation du vocabulaire et des illustrations.
La méthode proposée donne donc la possiblité
à l'expert de mettre à jour les connaissances observables
et observées en fonction des résultats (classification
et identification) et d'améliorer son modèle descriptif
de manière itérative. Par exemple, il va pouvoir
redéfinir les attributs et les valeurs, restructurer les
objets du modèle descriptif, faire de nouvelles illustrations
plus explicites (dessins), de nouveaux commentaires, etc... Dans
le cas des Pocillopora, les interrogations les plus
nombreuses ont porté : sur la féfinition de la partie
apicale des branches, le caractère hirsute du coenosteum,
la densité des épines septothécales, le développement
de la columelle...
4.- DISCUSSION, CONCLUSION.
A ce jour, seule la famille des Pocilloporidae est enregistrée dans la base de connaissances. L'ensemble des Astrocoeniidae et des Thamnasteriidae (2 genres, 9 espèces), des Fungiidae (6 genres et sous genres, 11 epèces), est actuellement expertisé. L'expertise de la famille des Poritidae est en cours de réalisation de même que celle des Agariciidae.
L'une des difficultés majeure rencontrée lors de
la phase d'expertise est due à l'extrême variabilité
intra-spécifique, voire intra-coloniale que presentent
les espèces à large répartition écologique
et/ou géographique. Par ailleurs, et pour les mêmes
raisons, il existe dans la littérature de nombreuses lacunes
et contradictions. Par exemple, la fréquence et le développement
de la columelle, qui aujourd'hui sont des caractères qui
discriminent chez le genre Pocillopora le groupe
verrucosa-meandrina (chez qui elle est absente ou abortive),
du groupe eydouxi-woodjonesi (chez qui l'axe central est
au contraire bien développé). Dans la description
originale de P. eydouxi (MILNE EDWARDS H. & HAIME J.,
1860), la columelle est absente, mais l'examen du type (MNHN,
Paris, n° 434, Collection ME & H) montre à l'évidence
une columelle toujours présente et bien développée...
A l'inverse, ces mêmes auteurs mentionnent la présence
chez P.verrucosa d'une " saillie columellaire
bien développée ".
REFERENCES
CONRUYT N.,1994-Amélioration de la robustesse des systèmes d'aide à la description,à la classification et à la determination des objets biologiques.Thèse Doctorat , Univ.Paris IX Dauphine,1-281
CONRUYT N., FAURE G., ANCEL G., LE RENARD J., GUILLAUME M., NAIM O., GRAVIER-BONNET N., GROSSER D., 1997 a -A knowledge base for corals of the Mascarene archipelago : Genus Pocillopora. Proc. 8th. Int. Coral Reef Symp. Panama " sous presse ".
CONRUYT N., GROSSER D., FAURE G., 1997 b -Ingénierie des connaissances en sciences de l a vie. Application à la systématique des coraux des Mascareignes. Actes des journées Ingénieries des connaissances, IC' 97, Roscoff, 513-525.
FAURE G., 1982.- Recherches sur les peuplements de Scléractiniaires des récifs coralliens des Mascareignes. Thèse Doct Etat Sci. nat., Uni. Aix-Marseille II, 2, 1-219.
LE RENARD J. & CONRUYT N., 1994- On the representation of observational data used for classification and identification of natural objects. IFC93, Lectures Notes in Artificial Intelligence, Springer Verlag, 308-315.
MILNE-EDWARDS H. & HAIME J., 1860 - Histoire naturelle des
Coralliaires T.III, Paris, 219 p.
[ Page d' Accueil | Publications | Bienvenue | Top ]
© IREMIA - Equipe IKBS - 03/1998