ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 20/6 - 2006  - pp.697-716  - doi:10.3166/ria.20.697-716
TITLE
A Bayesian Approach for the Clustering of Short Time Series

RÉSUMÉ
Des technologies récentes telles que les microarrays permettent de mesurer le niveau d'expression de milliers de gènes au cours du temps. Cependant, le nombre de points réduit de ces séries temporelles rend difficile la prise en compte des dépendances entre les temps par les algorithmes de classification. De plus, certaines des classes les plus intéressantes pour le biologiste peuvent être totalement omises par les algorithmes classiques du fait du faible nombre de gènes qui les composent. Nous proposons une approche bayésienne de ce problème. Un modèle de mélange est utilisé pour décrire et classer les données. Les paramètres de ce modèle sont contraints par une distribution a priori définie grâce à un nouveau type de modèles qui exprime les connaissances a priori dont on dispose. Ces connaissances permettent de traiter les dépendances temporelles d'une manière très naturelle, et de prendre en compte des connaissances approximatives concernant les profils temporels les plus intéressants.


ABSTRACT
Microarrays allow monitoring of thousands of genes over time periods. However, due to the low number of time points of the gene expression series, taking the temporal dependences into account when clustering the data is an hard task. Moreover, classes very interesting for the biologist, but sparse with regard to all the other genes, can be completely omitted by the standard approaches. We propose a Bayesian approach for this problem. A mixture model is used to describe and classify the data. The parameters of this model are constrained by a prior distribution defined with a new type of model that expresses our prior knowledge. These knowledge allow to take the temporal dependences into account in natural way, as well as to express rough temporal profiles about classes of interest.


AUTEUR(S)
Laurent BRÉHÉLIN

MOTS-CLÉS
séries temporelles, classification non supervisée, algorithme EM, bioinformatique, données d'expression de gènes.

KEYWORDS
time series, clustering, EM algorithm, bioinformatics, gene expression data.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (188 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier