ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 21/3 - 2007  - pp.371-390  - doi:10.3166/ria.21.371-390
TITRE
Les réseaux bayésiens : un formalisme adapté au traitement automatique des langues ?

RÉSUMÉ
De nombreux problèmes de traitement automatique des langues (TAL) se ramènent à des problèmes de classification. La complexité de la langue naturelle fait qu'il est difficile d'isoler les attributs discriminants pour une tâche donnée, que la fiabilité des valeurs associées à ces attributs est souvent faible et varie sur des corpus de domaines différents. Cet article défend l'idée que le formalisme des réseaux bayésiens est adapté à la classification de données décrites par de tels attributs. Nous avons estimé le bénéfice apporté par un classifieur bayésien sur une application réelle du TAL: la reconnaissance des pronoms anglais 'it' impersonnels et anaphoriques. Nous avons évalué notre classifieur sur deux corpus de domaines différents, ses résultats sont significativement meilleurs que ceux des systèmes existants.


ABSTRACT
Many problems in natural language processing (NLP) can be formulated as classification problems. The complexity of the natural language make it difficult to select the discriminating attributes for a given task, the reliability of attribute values is often dubious and vary with the domain of the corpus. This article argues that the bayesian network formalism is well adapted for the classification of this type of data. We have estimated the benefit brought by the bayesian classifior on a real NLP application: the distinction between the impersonal and anaphoric occurrences of the english pronoun it. After having implemented various state of the art systems able to perform this distinction, we have integrated them within a single classifior. Each system has been tested on two different domain corpora. The results obtained by our classifior are significantly better than those of the state of the art systems.


AUTEUR(S)
Davy WEISSENBACHER

MOTS-CLÉS
TAL, pronom impersonnel, classifieur bayésien naïf, classifieur bayésien simple.

KEYWORDS
NLP, non-anaphoric pronoun, naive bayesian classifier, simple bayesian classifier.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (178 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier