1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

17

Le cheminement conceptuel

d'élargissement des valeurs possibles, etc.) et en tenant compte d'heuristiques pour contrôler la recherche multi-directionnelle.

G(e1, CE) est appelé l'étoile de e1et représente l'ensemble de toutes les descriptions les plus générales qui couvrent le noyau (complétude) et ne couvrent pas les exemples négatifs (cohérence). Comme cela représente un nombre trop élevé de descriptions dans la pratique, l'algorithme effectue une recherche en faisceau pendant la génération de l'étoile pour produire une étoile bornéeG(e1, CE/m) ne contenant que les m meilleures descriptions selon certains critères et seuils de tolérance fixés au départ. Les exemples positifs qui ne sont pas couverts par l'étoile sont éliminés et le processus de départ est répété jusqu'à ce que tous les exemples soient couverts.

Contrairement à Neddie, Main utilise une stratégie hybride (en faisceau) ascendante guidée par les données (lors du choix d'un exemple) et descendante guidée par un modèle (lors de la génération de l'étoile bornée). C'est un système à la fois numérique et symboliquequi exploite une représentation plus ou moins orientée objets : VL2(Variable-Valued Logic) comme sous-ensemble de la logique du premier ordre [Michalski, 1980]. Main ne savait pas traiter les attributs à valeur numérique.

1.2.3 Maggy

Maggyest une implantation de l'algorithme d'appariement structurel et un descendant du système Agape [Kodratoff & Ganascia, 1986]. Il prend un ensemble d'exemples positifs et produit les généralisations conjonctives les plus spécifiques [Michalski, 1983]. Maggy utilise une représentation des connaissances fondée sur les framespermettant de décrire les observations (les observés) sous forme d'objets structurés ainsi que d'autres connaissances initiales de bon sens sur le domaine (hiérarchies d'objets, propriétés déductives, etc.) constituant le modèle descriptif (l'observable). Maggy peut être utilisé pour trouver toutes les généralisations conjonctives possibles d'un ensemble d'exemples (étant donné un modèle descriptif) ou sélectionner une généralisation fondée sur la quantité d'information perdue pendant la procédure. Considérons l'exemple suivant :

E1: [objet1 <classe pourriture> <couleur blanc>] & [objet2 <classe tache> <couleur brun>] E2: [objet1 <classe pourriture> <couleur jaune>] & [objet2 <classe tache> <couleur blanc>]

En faisant l'hypothèse qu'il y a une taxonomie des couleurs et que les pourritures et les taches sont des sortes de symptômes, Maggy extrait la généralisation "il y a une pourriture de couleur claire et une tache" plutôt que "il y a un symptôme blanc et un autre symptôme". Ceci provient du fait que davantage d'information est perdue en produisant la seconde généralisation [Manago, 1986]. Maggy renvoie à la fois la généralisation et une mesure de la quantité d'information perdue pendant le processus de généralisation.