Classification de données fonctionnelles par décomposition de mélange Apports de la visualisation dans le cas des distributions de probabilité
Les données fonctionnelles peuvent résulter de mesures répétées, mais aussi avoir une origine statistique. Ainsi en analyse de données symboliques, un objet complexe peut être décrit par une variable s'exprimant comme une distribution de probabilité. La classification d'un ensemble d'objets symboliques décrits par ce type de variable, peut être obtenue en appliquant une décomposition de mélange de copules archimédiennes sur les valeurs des distributions calculées en un nombre q de points distincts, appelés coupures. Jusqu'à présent ces coupures ont été choisies arbitrairement. Dans cet article nous essayons de façon empirique à l'aide de visualisations de comprendre où se situent les coupures optimales et en quel nombre. Nous proposons ensuite quelques règles pour fixer visuellement ce paramètre de la classification.
Functional data can come from repeated measures, but also as result of statistical analysis. In symbolic data analysis a symbolic object can be described with a probability distribution. The clustering of such objects can be performed using a mixture decomposition with archimedean copulas on values of the distributions computed in q points, named intersection points. So far this points were chosen randomly. In this paper, using visualizations, we try, empirically, to understand what is the best choice for the number and the location of these intersections points. We propose also some rules to choose this parameter of the classification.
E.CUVELIER, M.NOIRHOMME-FRAITURE
analyse de données symbolique, analyse fonctionnelle, distributions de probabilité, copules archimédiennes, visualisation.
symbolic data analysis, functional data analysis, probability distributions, archimedean copulas.
Français
|