Onglet Coraux des Mascareignes

 

 

 

Valorisation des bases de données scientifiques à la Réunion : vers les bases de connaissances

Application aux coraux des Mascareignes

 



Logo Region



Rapport soumis au Conseil Régional en septembre 1997


Table des matières


I - Présentation générale du projet

1.1 - Introduction
1.2 - Base de données et base de connaissances
  1.2.1 Les bases de données scientifiques 1.2.2 Les bases de connaissances
1.3 - Justification du projet
  1.3.1 Conserver un potentiel d'expertise 1.3.2 Contribuer à la mise au point d’outils d’information et de sensibilisation pour la protection de l’environnement
1.4 - Public visé
  1.4.1 Les techniciens et professionnels de l'environnement
1.4.2 Le monde du tourisme et le grand public
1.4.3 Le monde de la formation
1.4.4 Le monde de la recherche

II - La plate-forme informatique

2.1 - Méthodologie
  2.1.1 Acquisition des connaissances
2.1.2 Traitement des connaissances
2.1.3 Validation des connaissances et itération
2.2 - L’atelier de développement IKBS

III - Construction d’une base de connaissances sur les coraux des Mascareignes

3.1 - Phasage
  3.1.1 Phase I (Mars 1996 - Mars 1997) : Construction d'un prototype
3.1.2 Phase II (Mars 1997 - Septembre 1998) : Traitement de quatre familles de Coraux des Mascareignes
3.1.3 Phase III (Septembre 1998 - Septembre 2000) : Traitement de l'ensemble des coraux des Mascareignes
3.1.4 Phase IV : Extension éventuelle de la base aux autres coraux dans le monde
3.2 - Modèle fonctionnel
3.3 - Décomposition en tâches

IV - Modalités pratiques de réalisation de la phase II

4.1 - Organisation
4.2 - Coût de la réalisation de la phase II
4.3 - Financement de la phase II
Conclusion

V - Perspectives


Annexes : VI - Répartition des Ressources nécessaires par tâche pour la phase II

 


 

 

I - Présentation générale du projet

1.1 Introduction

L'exploitation rationnelle des données scientifiques fait l'objet d'une prise de conscience au niveau international en intelligence artificielle (Knowledge Discovery and Data Mining, Case-Based Reasoning, Information Processing and Management of Uncertainty in Knowledge-Based Systems), dans le domaine des bases de données (Very Large Data Bases) et en analyse des données (Intelligent Data Analysis). Les domaines concernés sont multiples. Par exemple, cela est apparu comme un problème incontournable dans le domaine de la biodiversité dont l’homme a décidé de faire l’inventaire, le suivi, et la conservation des espèces des différents règnes du monde vivant. Suite au sommet de Rio en juin 1992, de grands projets ont vu le jour (BIN-21, MUSE, Tree of Life, Species 2000) avec des bases de données accessibles par Internet diffusant toute l’information disponible aujourd’hui sur les espèces.

A l’île de La Réunion, il existe de nombreuses données scientifiques (biologiques, volcanologiques, météorologiques). Elles se présentent comme des collections de spécimens (herbier de la Réunion, coraux des Mascareignes, roches volcaniques, minéraux, etc.), des informations sous forme textuelle (monographies), des résultats de campagnes de mesures, des images, sont souvent mal conservées, peu accessibles et donc peu ou pas exploitées. Or ces données constituent un patrimoine scientifique qu'il convient de conserver et surtout de valoriser. Cela a d'ailleurs été défini comme un axe à privilégier dans le dernier "Schéma régional de l'enseignement supérieur et de la recherche".

Dans ce contexte international et régional, l’IREMIA a initié il y a quelques années un projet général de recherche baptisé "Valorisation des bases de données scientifiques à la Réunion" dont l’objectif est de mettre au point une méthodologie pour inventorier, structurer, exploiter et valoriser ces données. L’IREMIA entend valider les outils informatiques développés sur des exemples comme l’herbier de la Réunion, la collection des coraux des Mascareignes, la collection minéralogique du laboratoire de Sciences de la Terre de l’Université de la Réunion. Ce choix tient au fait que ces données sont fiables et relativement complètes mais participe aussi d'une volonté de s'impliquer localement dans le domaine de la conservation et de la protection de l'environnement.

 

Une étude de faisabilité, financée par le Conseil Régional de la Réunion, a été réalisée et a mis en évidence deux problèmes :

La nécessité de mettre au point des outils fondamentaux pour traiter ces données qui sont souvent imprécises et floues. Cela a entraîné la mise en route d'un programme de recherche de l'IREMIA sur le "Traitement des données bruitées".

La nécessité de créer au dessus de la base de donnée une couche intelligente intégrant la "connaissance" des spécialistes du domaine : le résultat est une base de connaissances.

1.2 Base de données et base de connaissances

1.2.1 Les bases de données scientifiques

Les bases de données scientifiques sur la biodiversité qui se développent actuellement en biologie sont mises sur support CD-ROM (ex : ETI aux Pays-Bas avec "Birds of Europe", ICLARM aux Philippines avec "FishBase", etc.) ou sont accessibles par INTERNET (ex : HBS à Hawaii, AIMS et CSIRO en Australie, etc.). Elles constituent des moyens modernes de stockage et de diffusion de l'information sur les espèces biologiques.

Ces bases de données sont généralement associées à un module de recherche et de tri car pour consulter ces systèmes d'information bibliographique et/ou taxinomique il est nécessaire de connaître le nom (ou taxon) du spécimen.

1.2.2 Les bases de connaissances

Aux informations proposées dans une base de données, les bases de connaissances ajoutent une dimension dynamique fondamentale en intégrant la "connaissance" des spécialistes reconnus du domaine concerné (Fig. 1). En effet, certaines personnes ont acquis, du fait d'une longue pratique, un savoir-faire unique leur permettant de prendre des décisions : ce sont les experts. Un expert n’est pas simplement une encyclopédie vivante dépositaire d'un ensemble d’informations, c’est aussi une personne qui sait raisonner sur un domaine particulier pour aboutir à une décision : identifier une maladie ou une espèce par exemple. C'est cette facette de la compétence qu'il s'agit d'intégrer dans une base de connaissances.

Fig. 1 : Bases de données et bases de connaissances

A ce titre les bases de connaissances permettent de gérer des informations plus complexes et plus générales que les données (voir paragraphe 2.1). Elles offrent une aide à l'identification pour ceux qui ne connaissent pas le nom du spécimen et une aide à la classification pour les spécialistes dont le domaine n'est que partiellement étudié (ce qui est vrai pour une grande partie de la faune marine, ainsi que pour la flore et la faune tropicales terrestres).

1.3 Justification du projet

1.3.1 Conserver un potentiel d'expertise

Pour recenser la biodiversité, il faut faire appel à une science intitulée la Systématique, dont une partie étudie et décrit la diversité des êtres vivants. Or, les systématiciens capables d’identifier les espèces dans le monde se font de plus en plus rares. Beaucoup d’entre eux sont décédés (T. Cadet n’est plus là pour transmettre ses connaissances sur l’herbier de la Réunion) et n’ont pas été remplacés, et la plupart des spécialistes encore en exercice sont proches de la retraite.

En ce qui concerne les coraux, une poignée d’experts, la plupart en fin de carrière, se partagent la connaissance dans le monde. Si l’expertise ainsi accumulée n'est pas conservée, il ne restera pour reconnaître les espèces que les collections et les monographies. Dans ce contexte nous avons sollicité G. Faure, spécialiste français qui a été enseignant chercheur pendant 23 ans à l'Université de La Réunion et qui a réalisé une collection exhaustive des coraux des Mascareignes (3 000 spécimens répartis entre le Muséum National d’Histoire Naturelle de Paris, le Muséum d’Histoire Naturelle de St-Denis et l'Université de la Réunion). Sous l'impulsion de G. Faure, d'autres spécialistes nationaux se sont intéressés au projet, et des spécialistes internationaux seront associés par la suite.

C’est la raison pour laquelle nous proposons dans un premier temps de valider notre plate-forme informatique à travers la construction d’une base de connaissances sur les coraux des Mascareignes.

Cette expérience acquise dans le milieu marin, nous avons l'intention de la poursuivre par la construction d’une base de connaissances sur l’herbier de la Réunion. Sans expert disponible, nous ne sommes en mesure pour le moment que de construire une base de données botaniques.

1.3.2 Contribuer à la mise au point d’outils d’information et de sensibilisation pour la protection de l’environnement

Connaissant le rôle très important des écosystèmes coralliens pour l’équilibre de la planète et les dégradations continuelles opérées par l’homme sur son milieu naturel, il est impératif de pouvoir transmettre ce savoir-faire aux personnes chargées de l’étude de la biodiversité des récifs. A la Réunion, le lagon est en voie de perdre une grande partie des espèces qui étaient courantes il y a dix ans à peine. A titre d’exemple, G. Faure a passé deux heures en 1997 dans une partie du lagon de St-Gilles pour retrouver deux spécimens de l’espèce Stylophora mordax, espèce pourtant très commune à cet endroit en 1985.

La base de connaissances proposée sur les coraux des Mascareignes ne se substitue évidemment pas aux moyens indispensables à mettre en oeuvre pour lutter contre les dégradations constatées. Cependant, les scientifiques et les politiques doivent se doter d’outils de contrôle de la richesse du milieu écobiologique, ce qui passe nécessairement par un bilan en nombre d’espèces et des outils qualitatifs d’identification des différents noms présents.

En résumé, outre les moyens classiques de protection de l’environnement, la base de connaissances s'avère très utile par ses trois fonctions de stockage, de gestion, et de transmission des connaissances du milieu. Elle permet de "photographier" la situation exacte des dégradations afin de mieux agir pour conserver ce patrimoine, tout en informant et en éduquant les différents publics.

 

1.4 Public visé

1.4.1 Les techniciens et professionnels de l'environnement

Nous pensons d’abord aux professionnels et techniciens de l’environnement qui sont chargés du suivi des récifs coralliens dans notre région. La demande est très importante. Ainsi une association de défense de l'environnement se livre actuellement à une observation de la pente externe du récif : un outil de ce type leur serait fort utile.

1.4.2 Le monde du tourisme et le grand public

Dans le cadre du développement économique de la Réunion, la filière tourisme est en plein essor. De nombreux plongeurs, touristes ou vacanciers locaux sont curieux de connaître les espèces de coraux qu’ils ont photographiées. Des bornes interactives pourraient être présentées à ce public pour l'informer. N'est-il pas surprenant de constater que l’on ignore les noms des coraux les plus courants, alors qu’ils ont dans le milieu marin la même fonction vitale que les arbres dand la forêt ?

Par ailleurs du fait de la mise en oeuvre de ces systèmes sur Internet le public le plus large sera concerné.

1.4.3 Le monde de la formation

Les enseignants et les étudiants, qu'ils relèvent du secteur primaire, secondaire ou supérieur, sont de plus en plus demandeurs d’informations sur les coraux. Il faut donc des outils d’aide à l’identification des espèces, avant de pouvoir recueillir toute l’information disponible sur elles.

De plus, à partir de ces outils, des actions de vulgarisation sont possibles : par exemple, l’utilisation d'un questionnaire permet d’apprendre à observer. Un aller-retour entre les questions posées et l’observation d'un spécimen au microscope favorise une auto-formation efficace des étudiants. Cette démarche très formatrice peut être proposée aux élèves des lycées et collèges.

1.4.4 Le monde de la recherche

Les systématiciens eux-mêmes ont beaucoup à apprendre de l’utilisation des outils informatiques. D’une part, ils leur imposent une plus grande rigueur dans la manière de décrire les spécimens : les descriptions produites sont structurées à partir de certaines logiques naturelles qu’ils ont l’habitude de mettre en oeuvre. D’autre part, ces descriptions deviennent comparables entre elles car elles sont codées dans l’ordinateur : cela permet d’établir des comparaisons entre descriptions pour établir des ressemblances et à partir de là de faire des classifications automatiques. On constate que les comparaisons ainsi obtenues peuvent contredire celles faites spontanément par les experts.

 

 

II - La plate-forme informatique

2.1 Méthodologie

La gestion des connaissances en sciences de la vie nécessite de s’appuyer sur une démarche expérimentale. Les experts en sciences de la vie appliquent une méthode inductive fondée sur l’observation des faits, la constitution d’hypothèses, la pratique de tests expérimentaux pour mettre ces hypothèses à l’épreuve.

Nous avons construit un atelier de gestion de bases de connaissances itératif qui reproduit ces trois étapes sous la forme suivante (Fig. 2) :

Acquisition des connaissances,

Traitement des connaissances,

Validation des connaissances et itération.

Fig. 2 : Méthodologie de gestion des connaissances

A l’aide de ces outils, l'expert peut appliquer la méthode scientifique en biologie : expérimenter (apprendre des règles de classification à partir de l'arbre inductif) et tester (mettre à l’épreuve les hypothèses inductives par de nouvelles observations). Le non-spécialiste va pouvoir consulter le système expert résultant avec une forte probabilité de succès (par détermination déductive ou identification).

2.1.1 Acquisition des connaissances

Le but de cette phase est de construire une base de descriptions de qualité qui soient comparables entre elles. Ces descriptions structurées et pré-classées par l’expert permettent de constituer une base de cas. Lors de la phase d’acquisition des connaissances, nous distinguons l’étape d’acquisition du modèle descriptif (l’observable), de l’étape d’acquisition des descriptions (l’observé).

Le modèle descriptif représente tout ce qui est observable pour notre domaine d’étude. Sa définition est représentée sous forme d’un schéma structuré de tous les objets, attributs et valeurs possibles du domaine, ce dernier constituant la racine de ce que l’on nomme l’arbre de description.. Pour construire cet arbre, nous suivons certaines logiques descriptives en Sciences de la vie, avec des règles de bon sens pour décrire une espèce : (dé)composition, point de vue, spécialisation, multi-instanciation, conditions contextuelles, etc.

Ensuite, un questionnaire est construit automatiquement à partir du modèle descriptif. Le biologiste utilise celui-ci comme un guide d'observation pour acquérir des descriptions observées et constituer une base de cas cohérente par rapport au modèle.

2.1.2 Traitement des connaissances

Les cas sont alors traités selon deux technologies complémentaires en fonction de l'objectif poursuivi.

Pour la classification, un arbre de décision est construit. A partir des descriptions (représentation en extension) une méthode inductive fondée sur la mesure d’entropie et du gain d’information fabrique une caractérisation de ces classes par un ensemble de règles. Chaque chemin depuis la racine vers les feuilles de l’arbre de décision est une règle de classification (également appelée diagnose).

Pour les Pocillopora (genre de coraux très courant dans les Mascareignes) , nous donnons à titre indicatif l’arbre de décision suivant qui classifie les 9 descriptions des types (espèces et écomorphes) (Fig. 3).

Fig. 3 : Exemple d’arbre de décision pour classifier le genre Pocillopora

Cet arbre de classification peut être utilisé pour déterminer une nouvelle observation. Néanmoins, lorsque l’utilisateur répond inconnu, la consultation de cet arbre est inadaptée.

Pour l’identification, le raisonnement à partir de cas est utilisé. Étant donné un ensemble d’exemples, notre méthode extrait dynamiquement le critère le plus efficace à partir d’une liste ordonnée de tests, après chaque réponses de l’utilisateur. Les cas sont sélectionnés en fonction de cette réponse. Si la réponse est inconnue, le second test le plus discriminant est proposé à l’utilisateur, et ainsi de suite. D’autres méthodes faisant appel à des mesures de ressemblance peuvent être utilisées.

2.1.3 Validation des connaissances et itération

D’une part pour la classification, l’expert va pouvoir analyser les règles produites. Il contrôlera si les diagnoses sont significatives pour séparer les espèces voisines, il pourra aussi détecter certaines erreurs dans ses descriptions ayant servi à générer l’arbre de décision.

D’autre part pour l’identification, une phase de test est nécessaire pour contrôler la fiabilité des résultats à l’aide du raisonnement par cas. Cette épreuve de vérité permet de savoir si le système d’identification est robuste ou non (tolérance aux bruits). Dans une phase d’expérimentation, différents utilisateurs (novices du domaine, autres experts) utilisent le questionnaire avec des spécimens soit non décrits initialement dans la base de cas, soit déjà décrits par d’autres expérimentateurs. Les résultats du système expert sont alors comparés aux identifications de l’expert.

Il s’en suit une phase d’évaluation et de discussion, ou l’expert va pouvoir détecter certaines incohérences éventuelles dans la base de cas ou dans le modèle descriptif (mauvais choix de caractères ou d’illustrations, explications du vocabulaire insuffisantes, etc.). Une confrontation entre les utilisateurs et l’expert permet de mettre le doigt sur des différences d’interprétation du vocabulaire et des illustrations.

La méthode proposée donne donc la possibilité à l'expert de mettre à jour les connaissances observables et observées en fonction des résultats (classification et identification) et d'améliorer son modèle descriptif de manière itérative. Par exemple, il va pouvoir redéfinir les attributs et les valeurs, restructurer les objets du modèle descriptif, faire de nouvelles illustrations plus explicites (dessins), de nouveaux commentaires, etc..

 

2.2. L’atelier de développement IKBS

L'atelier de développement a été baptisé IKBS (Iterative Knowledge Base System) (Fig. 4). L’aspect itératif de l’atelier est indispensable car les connaissances des experts évoluent avec le temps. Elles peuvent être remises en question du jour au lendemain. En effet, la nature nous offre un terrain de jeu tellement varié et contradictoire qu’il est très difficile d’énoncer des règles qui soient toujours valides. On ne peut donc considérer ce travail de reproduction du savoir-faire de ces experts dans l’ordinateur comme un processus linéaire allant de l’acquisition des connaissances, à leur traitement puis à leur validation.

 

Fig. 4 : L’atelier de développement IKBS

Cet atelier doit permettre de concevoir des bases de connaissances qui soient disponibles sur n’importe quelle plate-forme et qui soient consultables à distance par l’intermédiaire d’Internet.

C’est la raison du choix de Java et d’HyperTalk (le langage d’HyperCard) comme langages de programmation pour IKBS. Le système expert résultant sera accessible par réseau à distance.

La réalisation de cet atelier fait l’objet d’une thèse de doctorat en informatique à l’IREMIA (David Grosser), thèse financée par le Conseil Régional de la Réunion. Cet atelier s’appuye sur un autre environnement de développement baptisé HyperQuest, qui a permis d’appliquer la méthodologie de construction de bases de connaissances expliquée plus haut.

 

III - Construction d’une base de connaissances sur les coraux des Mascareignes

3.1 Phasage

Il est proposé de réaliser le projet en plusieurs phases.

 

3.1.1 Phase I (Mars 1996 - Mars 1997) : Construction d'un prototype

Cette phase préliminaire correspond à une étude de faisabilité. Elle a abouti à la construction d'un prototype sur un genre de coraux (Pocillopora). Ce genre a été choisi car il est l'un des plus répandu parmi 55 genres existant dans les Mascareignes (Réunion, Maurice, Rodrigues) et il est bien connu de Gérard Faure qui a réalisé l'expertise. La validation a été réalisée avec la participation de Guy Ancel, Nicole Gravier-Bonnet, Odile Naïm. La construction de ce prototype a permis de démontrer tout l’intérêt que l’on pouvait attendre de la méthodologie employée, et a fait l'objet d'une publication en anglais lors du 8ème symposium international sur les récifs coralliens qui s'est tenu à Panama en 1996.

3.1.2 Phase II (Mars 1997 - Septembre 1998) : Traitement de quatre familles de Coraux des Mascareignes

Cette phase a pour but la construction de la base sur 4 familles de coraux des Mascareignes (Pocilloporidae, Agariciidae, Poritidae et Fungiidae). Des experts français, Michel Pichon, Mireille Guillaume et Claude Bouchon, ont déjà donné leur accord pour participer au traitement des 19 genres et 50 espèces, soit un tiers (1/3) des espèces de coraux dans les Mascareignes.

Le bilan de cette phase II sera présenté à la "Réunion Européenne de la Société Internationale pour les Études Récifales" prévue à Perpignan en septembre 1998. Cela permettra entre autre de consolider l’image de la base de connaissances et du projet au niveau international.

3.1.3 Phase III (Septembre 1998 - Septembre 2000) : Traitement de l'ensemble des coraux des Mascareignes

Cette phase de généralisation a pour objectif de traiter l’ensemble des espèces de la collection de coraux des Mascareignes. La collection renferme 70% des espèces actuellement connues dans la province Indo-Pacifique.

A l'exception du genre Acropora, pour lequel il faudra faire appel à des compétences extérieures, cette phase peut être prise en charge par les experts français.

3.1.4 Phase IV : Extension éventuelle de la base aux autres coraux dans le monde

Cette phase suppose une implication importante d'experts internationaux. Les chercheurs australiens sont d’ores et déjà intéressés.

3.2 Modèle fonctionnel

La construction de la base de connaissances fait intervenir trois types de fonctions : la production, l'édition, la validation.

La fonction de production est assurée par les experts qui possèdent la connaissance. Ils sont situés sur différents sites géographiques.

La fonction d’édition est le rôle des concepteurs informaticiens, qui doivent extraire ces connaissances et les stocker dans la base de connaissances. L’éditeur ne peut se trouver que sur un site.

La fonction de validation concerne les personnes qui saisissent les cas (ce sont des expérimentateurs de toute sorte, autres experts mais aussi non spécialistes) et celles qui évaluent la base de connaissances (évaluateurs experts du domaine ou autres systématiciens). Cela permet de tester la bonne adéquation du vocabulaire de l’expert et des illustrations de la base de connaissances avec l’interprétation qu’en font les utilisateurs. Cette validation peut remettre en cause la définition même du modèle descriptif réalisé par les producteurs.

3.3 Décomposition en tâches

La construction de la base de connaissances peut se décomposer en 5 tâches :

T1. Définition du modèle descriptif

T2. Illustration du questionnaire issu du modèle descriptif

T3. Acquisition des cas avec le questionnaire

T4. Validation

T5. Recherche et développement informatique

On a défini ci-dessous ces différentes tâches et à la lumière de l'étude de faisabilité, on a estimé le temps nécessaire pour les réaliser. Cela a permis d’établir un devis temps et d’estimer ainsi pour chaque tâche le coût humain relatif à chaque phase du projet.

 

T1 : Définition du modèle descriptif

Description

Il s’agit de la phase d’initialisation de la construction de la base de connaissances. Cette tâche fait intervenir à la fois les producteurs et l’éditeur. Un producteur est en charge d’une (ou de plusieurs) famille(s) de coraux.

L’éditeur possède ici un rôle de cogniticien et va devoir assister chaque expert pour le former aux logiques descriptives et structurer la représentation de ses connaissances dans le système.

Devis temps

L'étude de faisabilité a permis d’évaluer à 15 jours le temps de formation pour traiter 10 taxons (5 espèces et 5 sous-espèces). Ainsi chaque producteur doit rencontrer l’éditeur une première fois au cours d’une mission de 2 à 3 semaines pour devenir autonome dans la définition du modèle descriptif. Ce travail a déjà été effectué pour l’expert Gérard Faure pour la famille des Pocilloporidae, ce qui lui permet aujourd’hui de travailler sur de nouvelles familles de manière autonome : Astrocoeniidae et Thamnasteriidae.

T2 : Illustration du questionnaire issu du modèle descriptif

Une fois les caractères définis dans le modèle descriptif, un questionnaire est généré automatiquement. Il va permettre d’acquérir les descriptions des spécimens observés pour les stocker dans une base de cas. Un cas est l’association d’une description et d’une identification faite par l’expert.

Pour que ce questionnaire soit utilisable par des expérimentateurs, il faut illustrer les différents objets (composants de la description), attributs associés aux objets (caractères), et valeurs d’attributs (états de caractères). L’illustration du questionnaire fait intervenir à la fois le producteur et l’éditeur. Deux manières de travailler doivent être appliquées (dans l’ordre) :

1. Procéder à partir d’un spécimen,

2. Procéder à partir des caractères.

 

1. Procéder à partir d’un spécimen :

Description

Le principe de cette première méthode est de se fixer un échantillon et de l’illustrer systématiquement au niveau de ses composants (objets) observés. Cette pratique est interessante pour l’expérimentateur car il pourra vérifier le résultat d’une identification d’espèce faite par le système expert avec les illustrations des spécimens y appartenant, et répertoriés dans la base de données images.

Ce travail n’a pas été effectué systématiquement pour notre prototype car il correspond à l’illustration d’une base de données plutôt qu’à celle d’une base de connaissances. En effet, il s’agit de photographier chaque spécimen en détail pour apporter l’information visuelle associée aux réponses du producteur. Néanmoins, ce travail gagne à être réalisé au niveau des objets observés pour chaque spécimen, ce qui permet à l’expert d’expliciter chaque description locale d’un objet (valeurs observées). On peut ainsi indexer des images observées aux objets composant l’arbre de description d’un spécimen (fig. 5).

Devis temps

Suite à la phase d’élaboration du prototype, nous pouvons estimer la durée du travail pour une description de spécimen. Lorsque l’ingénieur de la connaissance et l’expert travaillent ensemble, il faut compter une demi-journée de travail par spécimen pour numériser, modifier les images sous Photoshop et les incorporer dans le questionnaire (une dizaine de photos numérisées et exploitables par spécimen).

 

2. Procéder à partir des caractères :

Description

Le principe de la seconde méthode est d’illustrer l’ensemble des états observables pour chaque caractère : on va rechercher dans la collection des spécimens les images les plus représentatives des valeurs observables définies dans le modèle descriptif. Cette manière de travailler est celle que nous avons suivie avec l’expert G. Faure, car elle permet de choisir les images qui caractérisent le mieux la variabilité des réponses possibles. Il s’agit donc d’une aide à l’observation du producteur vers l’expérimentateur pour l’acquisition des cas (Fig. 6).

Devis temps

L’étape préliminaire (prototype) mettait en jeu 10 taxons (en fait 5 espèces et 5 sous-espèces ). Nous avons illustré 56 caractères sur 124 (37 objets et 67 attributs). Certains attributs ne nécessitent pas d’illustrations associées (les types numériques et commentaires) et certaines de ces illustrations sont réutilisables pour d’autres objets.

Le producteur et l’éditeur ont passé 15 jours pour fabriquer cette banque d’images (photos pour la plupart). Sous réserve de l'emploi systématique d'une caméra numérique, on peut considérer qu'il faut en moyenne 10 jours de travail pour illustrer 50 caractères.

Remarque : ce travail est effectué à partir d’images photographiques et de retouches sous Photoshop. Cette tâche d’édition a été prise en charge jusqu’à maintenant par un informaticien. Nous envisageons de déléguer dans le projet cette tâche à un infographiste.

 

Fig. 5 : Pour ce spécimen appartenant à l’espèce P. bulbosa, une image choisie par l’expert et permettant d’illustrer la description locale de l’objet sillon inter-calicinal des calices de l’apex a été indexée par l’éditeur.

 

 

 

 

Fig. 6 : le caractère disposition des calices de l’apex est illustré par trois images provenant de trois espèces différentes : elle permettent de visualiser les trois valeurs possibles du caractère.

 

T3 : Acquisition des cas avec le questionnaire

Description

Une fois que le questionnaire a été illustré par le producteur et l’éditeur, les producteurs peuvent commencer à acquérir des descriptions pour les stocker dans une base de cas. Cette base sera aussi bien le point de départ de la fabrication de l’arbre de décision par apprentissage automatique (induction) que de l’obtention d’une identification par comparaison des cas entre eux.

Pour effectuer ce travail, il faut diffuser le questionnaire aux différents producteurs afin que chacun puisse décrire des échantillons des différentes familles étudiées. Cela suppose que chaque expert dispose d'un ordinateur multimédia.

Devis temps

Suite à la phase d’élaboration du prototype, nous pouvons estimer la durée moyenne d’acquisition des cas à l’aide du questionnaire : il faut compter une journée de travail par producteur pour acquérir cinq descriptions de spécimens.

 

T4 : Validation

La validation est une phase essentielle du processus de construction de la base de connaissances. Il s’agit de tester les résultats du système expert construit par apprentissage des cas saisis précédemment avec le questionnaire. Cela permet de reconsidérer le modèle descriptif initial au cas où les résultats escomptés ne seraient pas à la hauteur des espérances de l’expert.

La validation fait intervenir tous les partenaires : producteurs, éditeur, expérimentateurs. Nous pouvons distinguer deux sous-tâches dans l’ordre chronologique de travail :

 

1. Expérimentation,

2. Evaluation des résultats, discussion et itération.

 

1. Expérimentation :

Description

Le rôle des expérimentateurs est de reproduire une situation normale de consultation du système d’identification par des personnes représentant le public visé par le projet. Ce travail permettra de vérifier la fiabilité des résultats de détermination par rapport à ceux de l’expert.

Les expérimentateurs sont des utilisateurs potentiels du système d’identification dont le niveau de connaissance sur le domaine est très varié. Ils peuvent être experts, ingénieurs des bureaux d’étude inventoriant la biodiversité du récif, techniciens de terrain, étudiants, enseignants en biologie, plongeurs ...

En général, on prévoit de consacrer deux tiers des descriptions de la base de cas à la construction de la clé d’identification, le tiers restant étant une base de descriptions pour effectuer les tests de fiabilité.

L’intégration dès le départ de tous les niveaux (du naïf à l’expert) de perception de l’objet dans la base de cas garantit une grande couverture des réponses possibles, et assure donc un arbre d’identification qui tienne compte de la variabilité des interprétations entre les expérimentateurs.

Devis temps

Les expérimentateurs ne sont pas plus rapides que les producteurs pour saisir les cas : il faut donc prévoir aussi en moyenne une journée pour recueillir cinq descriptions.

 

2. Evaluation des résultats d’identification, Discussion, Itération :

Description

La validation des résultats de l’expérimentation précédente demande une analyse à faire conjointement entre le producteur et l’éditeur. Il est certain que la connaissance experte ne se transmet pas aussi facilement que l’on voudrait par des mots et des illustrations, du fait de toute une démarche d’apprentissage de l’observation souvent inconsciente chez l’expert. Il faut pourtant "faire passer" celle-ci auprès des non-spécialistes, c’est-à-dire concevoir un questionnaire comme un véritable guide d’observation.

Nous avons pu constater deux tiers de bonnes réponses d’identification du système expert par rapport à l’expert pour la phase d’évaluation du prototype Pocillopora. La base de cas contenait 45 descriptions de 5 espèces et la base de tests contenait 15 descriptions. Nous avons pu relever les causes des échecs sur quelques caractères souvent incriminés, ce qui permettra, après discussion avec l’expert, de modifier le modèle descriptif initial (itération) et de mettre à jour les anciens cas.

Les causes d’échec peuvent aussi être dues à un traitement pas assez pointu des descriptions très riches de l’expert, descriptions qu’il a fallu appauvrir dans un tableau de données pour satisfaire les outils d’induction et de raisonnement par cas dont on dispose aujourd’hui. Il s’agit par exemple de développer des algorithmes d’apprentissage qui sachent traiter les dépendances entre caractères (les descriptions sont structurées), le doute (elles sont imprécises), la variation (il y a présence simultanée de plusieurs valeurs par attribut, de plusieurs objets du même type par échantillon), etc.. Cela fait l’objet de recherches actives par les informaticiens de l’IREMIA .

La phase d’itération est donc capitale pour l’amélioration de la robustesse des résultats d’identification : une personne à plein temps s’y consacre dans le cadre d’une thèse sur IKBS.

Devis temps

L’évaluation des résultats et le repérage des causes d’échec n’est pas couteux en temps dès le moment où l’on dispose d’outils d’évaluation automatisés. Ceci n’a pas été le cas pour notre prototype, mais nous envisageons de développer rapidement un tel système de validation dans le cadre du projet. On pourra dès lors compter sur 5 journées de travail par famille à deux personnes (producteur et éditeur) pour évaluer et discuter des améliorations à apporter au modèle descriptif. Les modifications effectives, quand à elles, ne peuvent être chifrées aujourd’hui car elles demandent une mise à jour préalable des outils de construction de la base de connaissances.

 

T5 : Recherche et développement informatique

Description

Tout au long du cycle de construction de la base de connaissances et afin de tenir compte de la richesse d’expression des objets du monde vivant, les chercheurs informaticiens modifient les outils de définition du modèle descriptif, de génération du questionnaire, de traitement des cas et de validation de la base de connaissances.

Nous préconisons trois approches à mettre en œuvre conjointement pour la recherche et le développement informatique : une approche orientée recherche se fondant sur la mise à jour d’HyperQuest et une approche orientée développement pour la réalisation de l’atelier final IKBS.

1. Une approche orientée recherche pour la conception d’interfaces

HyperQuest a permis de construire le prototype sur Pocillopora. Il est à la fois un éditeur de modèles descriptifs, un générateur de questionnaires multimédias et un outil de consultation pour identifier les spécimens. La conception d’HyperQuest a fait l’objet d’un travail de thèse en informatique, appliqué au domaine des éponges marines (le genre Hyalonema).

HyperQuest est écrit en HyperTalk, le langage de scripts d’HyperCard. Son intérêt le plus immédiat est de faciliter le prototypage d’applications, c’est-à-dire de programmer dans des temps records par rapport aux autres langages classiques (rapport 1/10 avec C++). De plus, à l’instar d’autres langages de scripts (Visual Basic, OpenScript , SuperTalk, etc.), HyperTalk est très utilisé pour la conception d’interfaces multimédias adaptées aux besoins des utilisateurs. HyperCard est en effet le précurseur des applications hypertextes qui sont à la mode aujourd’hui sur le WEB. Une évolution majeure est en cours : HyperTalk se transformera dans moins d’un an en QuickTime Interactive, ce langage permettra alors de scripter directement des films QuickTime sur n’importe quelle plate-forme !

En résumé, HyperQuest se prête bien à la phase d’acquisition et de transmission des connaissances de notre méthodologie, car il procure un environnement hypertextuel très convivial pour que des non-informaticiens puisse saisir des cas et consulter le système expert.

Les descriptions d’HyperQuest sont générées de manière à être lisibles par l’expert : elles sont textuelles et structurées. Elles conservent toute la richesse d’expression que permettent les logiques de description (voir § 2.1.1). Néanmoins, les descriptions textuelles ne sont pas bien adaptées aux différents traitements des connaissances envisagés (induction, raisonnement par cas, etc.), ces derniers ayant besoin d’être efficaces.

2. Une approche orientée développement sur les modules d’IKBS

IKBS est le système de gestion des connaissances que nous voulons développer. Cet atelier sera écrit en langage java, langage orienté objet qui devient un standard pour le développement d’applications dans l’industrie informatique. Ce nouveau langage est indépendant de toute plate-forme (Unix, Macintosh, Windows, etc.), et il rend accessible toutes ses applications sur Internet. La communication de java avec les bases de données est facilitée parce qu’elle est gérée par une interface performante (Java Data Base Connectivity).

Dans un premier temps, IKBS conservera HyperQuest comme frontal d’acquisition des connaissances. Si jamais java devenait un langage de développement multimédia, les fonctionnalités d’HyperQuest seraient directement intégrées dans IKBS.

En attendant de voir cette évolution, la première tâche d’IKBS est de gérer la communication avec HyperQuest. Tout d’abord, des programmes en java vont permettre de traduire les descriptions externes (codées par des chaînes de caractères) en structures de données internes à IKBS (codées par des symboles et des nombres). Le noyau d’IKBS est constitué par ces descriptions codées dans un formalisme de représentation des connaissances orienté objet.

La deuxième tâche d’IKBS est de s’occuper du traitement des connaissances sur ces données dont on souhaite conserver toute la richesse du texte initial. Par exemple, IKBS évoluera avec la prise en compte des outils de traitement du flou mis au point dans le cadre du programme de recherche "Traitement des données bruitées".

La troisième tâche d’IKBS est de pouvoir transporter ses structures de données vers des bases de données classiques (Access, Oracle) ou orientées objets (O2), afin d’assurer le stockage et la pérennité de grandes quantités de données, mais aussi leur accessibilité (au détriment toutefois de leur richesse). Il est aussi envisagé une ouverture d’IKBS vers d’autres formats de descriptions taxinomiques utilisés par les systématiciens (DELTA).

3. Recherche d’une méthodologie de développement intéractif du modèle descriptif et le la base de descriptions.

L’essentiel du travail de recherche a jusqu’ici porté sur les phases 1 (acquisition des connaissances) et 2 (traitement des connaissances) telles qu’indiquées sur la Figure 2 (voir p. 9). Il convient à présent d’affiner la phase 3 de validation croisée des connaissances sur l’observable et sur l’observé, qui doit conférer au système global une capacité fondamentale d’amélioration itérative et d’évolution.

Cette phase 3 est actuellement fonctionelle, mais ne repose encore que sur des bases empiriques. Il est nécessaire de l’analyser en détail afin de dégager une méthodologie générale de validation, reposant sur des bases formalisées et généralisables. L’objectif est en particulier de parvenir à un système d’identification à la fois plus robuste et plus précis, par une prise en compte optimisée des malfonctionnements constatés (qui ont pour cause soit une imperfection du modèle descriptif, soit une incomplétude de la base de cas, soit une difficulté d’observation de certains caractères particuliers).

De même que le modèle descriptif se fonde sur des logiques de description, la correction itérative des connaissances doit s’appuyer sur un certain nombre de logiques d’amendement qu’il importe d’expliciter.

L’approche orientée développement présentée au point 2 ci-dessus devra permettre d’intégrer directement les résultats des recherches dans un module IKBS. Ce " module itératif d’amendation " constituera à terme pour l’éditeur le moyen de maintenir la cohérence entre les différents niveaux de connaissances intégrés dans le système global, tout en tirant profit des connaissances acquises (expérience) pour compléter et améliorer l’ensemble.

Cette activité de recherche, qui se situe clairement dans le prolongement des recherches ayant conduit au système actuel, justifie une collaboration étroite entre les informaticiens de l’IREMIA et du LBIMM (Jacques LE RENARD), et devrait pouvoir être évaluée au travers de publications scientifiques finalisées.

Devis temps

Développement d'interfaces à l'intention des producteurs et des expérimentateurs :

HyperQuest demande encore des adaptations au domaine étudié des coraux et nécessite donc une sous-tâche de programmation. Celle-ci pourrait être réalisée par une personne recrutée pour développer les modifications à apporter à HyperQuest. Il pourrait s’agir d’une personne effectuant un stage de DESS en informatique pendant 6 mois (jusqu’en juillet 1998).

Développement de IKBS :

En s'appuyant sur l'exemple des coraux des Mascareignes, il s'agit de développer la plate-forme complète de construction et d'exploitation de bases de connaissances. Ce travail a déjà débuté dans le cadre d’un stage de maîtrise d’informatique de trois mois. La personne s’appelle Philippe Vincent. Les premiers résultats du développement d’IKBS en java sont déjà prometteurs. Il envisage de continuer ce travail dans le cadre du DESS en informatique de l’IREMIA, ce qui nous conduirait aussi à une durée de travail de 6 mois pendant le stage (jusqu’en juillet 1998).

Recherche "Module intéractif d’amendement" :

Il s’agit d’une collaboration impliquant, à nouveau Philippe Vincent, avec Noël Conruyt et Jacques Le Renard, Directeur de Recherche au LBIMM et à l’INRA. Pour ces deux derniers, le projet représente un investissement de l’ordre de 20% de leur temps, plus des échanges par courrier électronique et quelques réunions de travail en commun (préparation de publications et de congrès).

 

IV - Modalités pratiques de réalisation de la phase II

4.1. Organisation

 

Maître d'oeuvre :

Université de la Réunion

Institut de Recherche en Mathématiques et Informatique Appliquées (IREMIA)

Organismes partenaires :

Muséum National d’Histoire Naturelle de Paris (MNHN)

Laboratoire de Biologie des Invertébrés Marins et de Malacologie (LBIMM).

Université Antilles-Guyane

Laboratoire de Biologie Animale (LBA)

Université de Montpellier II

Institut des Sciences de l’Ingénieur de Montpellier (ISIM)

Université de Perpignan

École Pratique des Hautes Études (EPHE)

Université de la Réunion

Laboratoire d'Écologie Marine (ECOMAR),

Centre Ressources Multimédia (CRM)

Répartition fonctionnelle :

Édition :

IREMIA,

Centre Ressources Multimédia

Production :

Laboratoire de Biologie des Invertébrés Marins et de Malacologie (LBIMM).

Laboratoire de Biologie Animale (LBA)

Institut des Sciences de l’Ingénieur de Montpellier (ISIM)

École Pratique des Hautes Études (EPHE)

Validation :

Laboratoire d'Écologie Marine (ECOMAR),

Autres partenaires sur chaque site.

Recherche informatique :

IREMIA.

Laboratoire de Biologie des Invertébrés Marins et de Malacologie (LBIMM).

Responsabilités :

Coordonateur du projet "Valorisation des données scientifiques à la Réunion" :

Pierre Gigord (IREMIA)

Responsable scientifique du projet "Base de connaissances sur les coraux des Mascareignes": Noël CONRUYT (IREMIA)

 

 

Experts

 

Famille des Pocilloporidae

G. FAURE (ISIM)

 

Famille des Astrocoeniidae

G. FAURE (ISIM)

 

Famille des Thamnasteriidae

G. FAURE(ISIM)

 

Famille des Fungiidae

M. PICHON (EPHE)

 

Famille des Poritidae

M. GUILLAUME (MNHN)

 

Famille des Agariciidae

C. BOUCHON (LBA)

Coordination G. FAURE (ISIM)

Validation :

Nicole GRAVIER-BONNET (ECOMAR)

Odile NAÏM (ECOMAR)

Responsable du secteur numérisation et multimédia :

Guy ANCEL (CRM)

 

4.2. Coût de la réalisation de la phase II

 

En pages suivantes on trouvera :

le Tableau 1 qui présente le budget de fonctionnement et d'équipement

le Tableau 2 qui détaille le coût du projet en personnels permanents

Ce budget est résumé dans le tableau ci-dessous :

Coût du projet

Financé

Demandé

Total

3 750KF

2 452KF

1 298KF

Total fonc. et équip.

2 068KF

770KF

1 298KF

Fonctionnement

586KF

10KF

576KF

Equipement

1 482KF

760KF

722KF

Personnel

1 682KF

1 682KF

4.3. Financement de la phase II

Les coûts en personnels permanents seront pris en charge par les organismes partenaires qui s'engagent dans le cadre d'une convention à mettre en oeuvre les ressources humaines nécessaires à la bonne réalisation du projet :

Muséum National d’Histoire Naturelle de Paris

Université Antilles-Guyane

Université de Montpellier II

Université de Perpignan

Université de la Réunion

Une partie du coût de fonctionnement et surtout d'équipement sera pris en charge par l'Université de La Réunion (IREMIA, Centre Ressources Multimédia)

Conclusion :

 

 

Une subvention de 1 298KF est nécessaire pour réaliser la phase II du projet "Base de connaissances sur les coraux des Mascareignes".

 

 

 

 

V - Perspectives

 

Dans le cadre de la préparation du projet de construction d'une base de connaissances sur les coraux des Mascareignes, beaucoup d’investissements ont déjà été réalisés tant au niveau des ressources humaines que de l'équipement.

Ce projet de valorisation des bases de données scientifiques, fondé sur une plate-forme informatique sophistiquée permettant d'intégrer des "connaissances" et de les exploiter, est un projet original et unique au monde.

La construction d'une base de connaissances sur une partie des Coraux des Mascareignes (Phase II du projet) fournira un outil original, moderne et efficace en terme de diffusion de la connaissance mais aussi et surtout en terme de contrôle de la biodiversité (monitoring) et de gestion de l'environnement. Par ailleurs, cette base de connaissances sera disponible sur un serveur chez l’éditeur : les consultations du questionnaire pour identifier les espèces de coraux se feront par Internet.

L'objectif final est d'étendre la base de connaissances dans un premier temps à l'ensemble des Coraux des Mascareignes (Phase III), et dans un deuxième temps aux coraux du monde entier (Phase IV). A la lumière de l'avancement de la réalisation de la phase II un dossier sera établi pour structurer la Phase III et en chiffrer les coûts.

Ces phases finales feront intervenir des producteurs de différents pays (France, Australie, Pays Bas). Elles nécessiteront une collaboration pluridisciplinaire et la création d’un groupe d’experts au niveau international. A la lumière d'une expérience réalisée avec l'association MEDSAT, l'Aérospatiale et France Télécom, dans le cadre du MILIA 97, le projet s'appuiera sur les moyens de communication à haut débit dans le cadre d'un dispositif de "Recherche collaborative à distance" (Projet Télésystématique)" proposé par l'IREMIA.

 

 

 

 

 

Annexes

 

VI - Répartition des Ressources nécessaires par tâche pour la phase II

 

6.1 Coûts financiers de fonctionnement et d’équipement

En fonction des tâches prédéfinies, nous décrivons les différents budgets nécessaires à leur accomplissement. Il s’agit d’une estimation globale des besoins financiers pour la phase II. Ces besoins englobent les investissements déjà réalisés, et un tableau récapitulatif est dressé à la fin de cette description des tâches, qui fait la part entre les dépenses déjà effectuées et celles à mettre en oeuvre (tableau 1).

6.1.1. T1.

Budget Missions :

On envisage des missions pour que chaque producteur puisse acquérir les logiques descriptives permettant la construction du modèle descriptif de sa famille :

Famille

Producteur

Nb d’espèces

Mission en jours

Pocilloporidae

G. Faure

11

déjà réalisé

Astrocoeniidae

G. Faure

3

8

Thamnasteriidae

G. Faure

6

12

Fungiidae

M. Pichon

15

20

Poritidae

M. Guillaume

15

20

Agariciidae

C. Bouchon

10

20

Sur la base d’un déplacement Métropole - Réunion et d’un séjour sur place de 20 j :

coût total : 74 KF

D’autre part, G. Faure, en tant que coordinateur, s’est proposé pour collecter et analyser avec eux les travaux des autres experts avant que ceux-ci ne soient soumis à l’éditeur. Des missions de travail entre experts sont donc à prévoir, notamment sur les sites de Paris (MNHN) et de Perpignan (EPHE).

coût total : 20 KF.

Frais généraux :

Expédition des spécimens : un budget de fonctionnement pour l’expédition des spécimens entre les sites est nécessaire afin de bien vérifier la définition des caractères observables avec les échantillons observés.

coût total : 30 KF (nombre de spécimens X prix envoi postal)

6.1.2. T2.

Budget Missions :

Travail en laboratoire :

On envisage des missions pour que chaque producteur puisse choisir les images qui correspondent le mieux aux caractères déjà définis dans la tâche T1.

Travail sur le terrain :

Il est d’abord nécessaire d’aller photographier et/ou filmer les différentes espèces in situ. Pour récolter des prises de vue de 10 espèces, il faut prévoir 2 jours dans le lagon et sur la pente externe du récif de la Réunion pour chaque expert.

Si l’on se fonde sur la durée moyenne de travail effectuée pour la phase d’élaboration du prototype, on obtient :

Famille

Producteur

Nb de caractères à illustrer

Nb d’espèces à illustrer

Mission en jours

Pocilloporidae

G. Faure

50

11

10+5+2 = 17

Astrocoeniidae

G. Faure

x

3

x

Thamnasteriidae

G. Faure

x

6

x

Fungiidae

M. Pichon

x

15

x

Poritidae

M. Guillaume

x

15

20+3 = 23

Agariciidae

C. Bouchon

x

10

x

Sur la base d’un déplacement Métropole - Réunion et d’un séjour sur place de 20 j :

coût total : 74 KF (à voir en fonction du nombre de caractères et de spécimens à illustrer).

Ce budget peut être réduit si le producteur peut coupler la venue pour construire le modèle descriptif avec le travail d’illustration (1 mois de travail).

Vacations :

Pour assurer la numérisation des images de la phase intermédiaire, des vacations sont à prévoir pour des étudiants en licence et maîtrise de biologie (20 KF). Pour un infographiste, compter aussi quelques jours pour un travail artistique (20 planches x 200F = 40 KF).

coût total : 60 KF

Budget Equipement :

Éditeur :

× Matériel coraux in situ : pour effectuer les photos sur le terrain, un appareil photographique de plongée (Nikonos) avec flash est nécessaire : 100 KF.

× Matériel macro-photo en laboratoire : le CRM est équipé d’un appareil photo (50 KF) et d’un banc statif (10 KF). Pour éviter la phase de développement des pellicules qui coûte assez cher, il sera judicieux d’acheter un appareil photo numérique (60 KF).

× Matériel micro-caméra : ECOMAR est le laboratoire où se font les observations microscopiques. L’atelier est constitué d’un microscope, d’une caméra mono-CCD avec bague d’adaptation, d’un système d’éclairement directionnel, et d’un écran de contrôle (50 KF). Il serait peut être opportun d’acquérir une caméra tri-CCD pour améliorer la qualité des images lors de l’illustration des caractères microscopiques (100 KF).

× Matériel de numérisation : le CRM est équipé d’une station de numérisation comprenant un ordinateur multimédia, un écran 20 pouces, des scanners, des moyens de stockage, les logiciels associés (200 KF).

× Pour les échanges, il faut prévoir de stocker les images numérisées sur des disques durs de grande capacité, par exemple sur un disque Jazz Ioméga avec cartouches de 1 Go. L’IREMIA prevoit l’achat de deux lecteurs (10 KF), sachant qu’il peut mettre à disposition une capacité de stockage sur disque sur ses propres ressources (20 Go), estimée à 40 KF.

coût total : 620 KF

6.1.3 T3

Budget Equipement :

Pour chaque producteur, afin qu’il puisse saisir sa base de cas :

Le meilleur compromis comme ordinateur multimédia aujourd’hui est le PowerMacintosh 8600/200 avec un écran 20 pouces et une capacité adéquate en RAM, VRAM et disque dur (45 KF). L’intérêt est aussi qu’il possède un lecteur intégré de disquettes Zip 100 Mo, ce qui permettra d’échanger les différentes versions du questionnaire lors des modifications (celui de la version Pocillopora faisait 54 Mo).

Un équipement complémentaire est à prévoir au niveau d’une loupe binoculaire pour observer les échantillons (15 KF).

coût total : 60 KF par site, soit 240 KF (LBIMM, ISIM, LBA, EPHE).

6.1.4 T4

Budget de Fonctionnement :

Expérimentation :

Pour assurer la saisie des cas par des expérimentateurs critiques, des vacations sont à prévoir pour des étudiants en licence et maîtrise de biologie qui apporteront leur perception de l’observation et une étude objective de l’amélioration du questionnaire à différents niveaux (ergonomie, questions mal posées, choix des images, etc.). Une équipe de 10 stagiaires travaillant 5 jours chacun permettrait de saisir 250 cas. Cette étude nous donnera la possibilité de faire une analyse statistique des résultats d’identification pour différents niveaux d’utilisation. Parmi ces stagiaires, nous prevoyons la venue de deux d’entre-elles depuis la metropole.

coût total : 28 KF

Expédition des spécimens :

Un budget de fonctionnement pour l’expédition des spécimens entre les sites est nécessaire afin que les expérimentateurs puissent décrire les mêmes échantillons que les producteurs. Ceci permettra bien sûr d’évaluer la robustesse du système d’identification.

coût total : 30 KF (nombre de spécimens x prix envoi postal)

Budget Equipement :

Pour l’expérimentation, nous prevoyons deux loupes binoculaires supplémentaires afin que ce travail puisse s’effectuer en parallèle sans trop perdre de temps : 30 KF.

6.1.5 T5.

Budget de Fonctionnement :

Vacations :

Deux stagiaires de DESS en informatique.

coût total : 60 KF

Budget Equipement :

Stations de travail :

Afin de réaliser le développement informatique, un ordinateur puissant est nécessaire chez l’éditeur (Macintosh 9600/240Mhz/64Mo/4Go), ainsi qu’un écran de grande taille (20 pouces). L’autre ordinateur sera mis à disposition par l’IREMIA.

coût total : 60 KF

Logiciels :

Programmation Java et HyperCard pour trois postes de développement (18 KF), et traitement d’images (Photoshop) et multimédia (QuickTime Media Layer) pour trois postes d’infographie (24 KF)

coût total : 42 KF

6.1.6 Divers.

Budget Missions :

Afin de présenter les résultats à la "Réunion Européenne de la Société Internationale pour les Études Récifales" prévue à Perpignan en septembre 1998, prévoir des frais de mission pour trois personnes au départ de La Réunion.

coût total : 30 KF

Frais généraux :

Nous prévoyons une enveloppe pour couvrir les frais de communication entre les sites très distants (téléphone, fax, visioconférences) ainsi que les besoins en consommables, documentation, publicité et imprimerie.

coût total : 92 KF

Vacations supplémentaires :

Pour deux familles de coraux (Fungiidae et Poritidae), nous devons prévoir 20 heures de microscope electronique à balayage pour les illustrations. Le coût d’utilisation de la machine s’élève à 3 KF et les vacations correspondantes à 2 KF.

coût total : 5 KF

Des frais de manipulation des collections est aussi à envisager sur tous les sites pour les conserver dans le meilleur état.

coût total : 20 KF

 

6.2 Coûts humains associés (personnel permanent)

Il est clair que toutes ces tâches à réaliser demandent un investissement en temps de la part des différents partenaires, chose qu’il nous reste à évaluer pour offrir un panorama complet de la phase II du projet. Encore une fois, nous allons nous référer à la phase préliminaire de réalisation du prototype (phase I).

Les moyens humains peuvent se décompter sous la forme d’une mise à disposition d’un travail de chercheur sur les différentes tâches pendant une certaine durée annuelle.




 [ Page d' Accueil | Publications | Coraux des Mascareignes | Top ]


© IREMIA - Equipe IKBS - 09/1998