Identification de répétitions dans les navigations au sein d'un catalogue de santé
Identification of recurrent navigation behaviours within a catalogue of health ressources
Nous présentons dans cet article un algorithme d'extraction de comportements récurrents durant la consultation de ressources au sein du catalogue de santé CISMeF. Nous proposons pour cela d'utiliser la structure de données appelée arbres des suffixes, appliquée aux fichiers log de CISMeF. Parallèlement à cela, nous nous intéressons à l'identification de ressources pertinentes pour une requête donnée en construisant un ensemble de ressources syntaxiquement et sémantiquement proche des ressources consultées au cours de la navigation. L'idée sous-jacente étant, à partir de la consultation d'une ou plusieurs ressources, de proposer une liste de liens susceptibles de contenir l'information recherchée par l'utilisateur.
In this article we aim at introducing an algorithm designed to extract recurrent navigation behaviours within CISMeF, a catalogue of Health Resources. We propose to use the data structure called tree suffixes, applied to the log files collected from CISMeF. At the same time, we are interested in the identification of resources relevant to a query by building a set of resources syntactically and semantically close to the resources visited during the user navigation. The idea is, when consulting one or more resources, to propose a list of ressources that could contain the information sought by the user.
A.PAUCHET, M.EL ABED, T.MERABTI, É.PRIEUR, T.LECROQ, S.DARMONI
fouille de données internet, extraction de motifs de navigation, arbres des suffixes.
web log mining, navigation pattern extraction, suffix trees.
Français
|