ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 16/6 - 2002  - pp.705-728  - doi:10.3166/ria.16.705-728
TITRE
Etude de méthodes de recherche locale pour la construction de bipartitions

RÉSUMÉ
Les méthodes de classification non supervisée sont des outils de fouille de données qui visent à identifier des groupes d'objets similaires par rapport aux valeurs qu'ils prennent sur différentes variables. Les méthodes dites conceptuelles adjoignent à la partition une interprétation des classes en fonction des valeurs des variables présentes dans chacune des classes. Une telle structuration peut être décrite par un couple de partitions liées, appelé bipartition, constitué d'une partition des objets et d'une partition des modalités de variables. Cet article présente une étude de l'utilisation de méthodes de recherche locale pour la construction de bipartitions maximisant un critère de qualité défini par Goodman et Kruskal [GOO 54, GOO 59]. Nous proposons un algorithme basé sur le parcours stochastique d'une structure de voisinage sur l'espace de recherche des bipartitions possibles. Le critère d'arrêt est redéfini de manière statistique, ce qui permet de borner statistiquement la qualité de la solution obtenue. Enfin, une étude variationnelle de la fonction à optimiser permet de réduire la complexité du calcul.


ABSTRACT
The clustering methods are data mining tools, which aim at identifying groups of similar objects compared to the values they take on different attributes. The methods known as conceptual clustering associate with the partition an interpretation of the classes. Such a structuring can be described by a pair of partitions, called bipartition, composed of a partition of objects and a partition of attribute value pairs. This article presents a study of the use of local search methods to produce bipartitions maximizing a quality measure defined by Goodman and Kruskal [GOO 54, GOO 59]. We propose an algorithm based on a stochastic neighborhood. The stopping criterion is redefined in a statistical way to guaranty the quality of the obtained solution with respect to a confidence level. Finally, a variational study of the function to be optimized leads to a complementary reduction of the computational complexity.


AUTEUR(S)
Céline ROBARDET, Christophe RIGOTTI

MOTS-CLÉS
classification conceptuelle, optimisation par recherche locale, méthode de bipartitionnement, mesure d'association.

KEYWORDS
conceptual clustering, local search, biclustering method, measure of association.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (205 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier