1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

211

Le traitement des descriptions biologiques: KATE et CaseWork

L'algorithme demande donc trois opérations principales :

1)Tester si un noeud est terminal : si chaque élément de E appartient à la même
classe, on construit une feuille de l'arbre libellée par le nom de la classe,

2) Sélectionner la meilleure division pour placer son représentant (A) dans un
noeud intermédiaire,

3) Partitionner les exemples restants à un noeud intermédiaire en sous-ensembles
disjoints.

Une quatrième opération spécifique à KATE vient s'ajouter entre 1) et 2) :

1') Construire l'espace des attributs possibles au noeud d.

Soit l'ensemble des exemples restants E et l'ensemble Yd des attributs restants attachés au noeud d:

Algorithme:

Début :
E =
W,

ConstruireArbre (E, Yd)
siCritèred'Arrêt (E) alors
ConstruireFeuille (E)
sinon
Y
d = ConstruireEspace (E)
s = OrdonnerCritères (E, Y
d)
A = Meilleure_division (E, s)
d
i= CréerNoeud (A)
partition = R (E)

Pour tout Ei [!] partition
CréerBranche (v
i)
ConstruireArbre ( E
i , Yd ) Fin Pour tout

Fin si

Fin.