ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 28/2-3 - 2014  - pp.269-296  - doi:10.3166/ria.28.269-296
TITRE
Identification de relations sémantiques portées par les structures énumératives paradigmatiques. Une approche symbolique et une approche par apprentissage supervisé

TITLE
Indentification of semantic relations carried out by paradigmatic enumerative structures. A rule-based approach and a supervised learning approach

RÉSUMÉ

Un texte est une suite de phrases dont la cohérence sémantique et rhétorique doit être assurée par des relations du discours. Un texte met aussi en œuvre un ensemble de moyens typographiques, de ponctuations et d’agencements qui contribuent, eux aussi, à identifier son sens. Ces deux propriétés ont été respectivement formalisées, par différentes théories du discours, et par des modèles de structure de textes. Les correspondances entre les représentations des structures du discours et les mises en forme des textes ne sont pas généralement bijectives. Néanmoins, certaines structures discursives comme les structures énumératives profitent de ce tte correspondance. Ces dernières ont des caractéristiques de typographie, de ponctuation ou/et de disposition qui (1) les rendent facilement repérables et (2) traduisent des relations hiérarchiques. Dans cet article nous montrons comment les objets textuels ayant les propriétés (1) et (2) peuvent être exploités pour améliorer le processus d’enrichissement de ressources termino-ontologiques à partir de textes. Deux approches, l’une symbolique et l’autre par apprentissage supervisé ont été mises en œuvre. Les avantages et limites de ces approches font l’objet d’une discussion en fin d’article.



ABSTRACT

A written text is a sequence of sentences whose discourse relations must grant its semantic and rhetoric coherence. A text implements also a set of typographical, punctuational and laying out means, which contribute to the construction of its meaning. These two properties were respectively formalized through different discourse theories and through text structure models. The mappings from the representations of the discourse structures to the laying out of the text are generally not isomorphic. However, some discourse structures such as enumerative structures benefit from this mapping. Those structures have typographical, punctuational and/or laying out characteristics, which (1) make them easily identifiable and (2) convey hierarchical relations. This paper will try to show how textual objects that own (1) and (2) properties can be exploited in order to considerably improve the process of ontology enrichment from text. Two approaches, a symbolic one and another one based on supervised learning have been implemented. Their advantages and limits are discussed at the end of the article.



AUTEUR(S)
Mouna KAMEL, Bernard ROTHENBURGER, Jean-Philippe FAUCONNIER

MOTS-CLÉS
extraction de relations, mise en forme matérielle, structure énumérative, système à base de règles, apprentissage supervisé

KEYWORDS
Relationship extraction, document layout, enumerative structure, based-rules system, supervised machine learning

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (409 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier