ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 28/5 - 2014  - pp.523-545  - doi:10.3166/ria.28.523-545
TITRE
Un nouveau modèle pour la classification non supervisée sous contraintes

TITLE
A new model for constrained clustering

RÉSUMÉ
La classification non supervisée sous contraintes utilisateur a connu un essor important en fouille de données. Dans les dix dernières années, beaucoup de travaux se sont attachés à étendre les algorithmes classiques pour prendre en compte des contraintes utilisateur, mais ils sont en général limités à un seul type de contraintes. Dans de précédents travaux (Dao et al., 2013a), nous avons proposé un cadre générique et déclaratif, fondé sur la programmation par contraintes, qui permet de modéliser différentes tâches de clustering sous contraintes. L’utilisateur peut spécifier un parmi plusieurs critères d’optimisation et combiner différents types de contraintes. Ce modèle exige que le nombre de classes soit fixé à l’avance. Dans ce papier, nous présentons un nouveau modèle pour le clustering sous contraintes où le nombre de classes est seulement borné par des bornes inférieure et supérieure. Ce modèle, tout en offrant plus de flexibilité, est plus efficace et les expérimentations montrent que les performances obtenues sont meilleures que les méthodes complètes existantes traitant des mêmes critères.


ABSTRACT
Constrained clustering is an important task in Data Mining. In the last ten years, many works have been done to extend classical clustering algorithms to handle user-defined constraints, but they are in general limited to one kind of constraints. In our previous work (Dao et al., 2013a), we have proposed a declarative and general framework, based on Constraint Programming, which enables to design a clustering task by specifying an optimization criterion and different kinds of user-constraints. The model is designed for a clustering task, where data is divided in exactly k clusters. In this paper, we present a new model for constrained clustering tasks where the number of clusters is only bounded. It offers more flexibility, while being more efficient and experiments show that it has a better performance, when compared to existing complete methods dealing with the same criteria.


AUTEUR(S)
Thi Bich HANH DAO, Khanh-Chuong DUONG, Christel VRAIN

MOTS-CLÉS
classification non supervisée, contraintes utilisateur, programmation par contraintes.

KEYWORDS
clustering, constrained clustering, constraint programming.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (513 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier