ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 30/6 - 2016  - pp.637-674  - doi:DOI:10.3166/RIA.30.637-674
TITRE
Extraction automatique d’entités et de relations par ontologies et programmation logique inductive

TITLE
Automatic extraction of entities and relations by ontology and inductive logic programming

RÉSUMÉ

Face à la quantité croissante d'informations disponibles tant sur le web que dans les bibliothèques numériques, le développement de systèmes d’extraction d’information (EI) automatique, à la fois efficaces, robustes et adaptatifs, constitue un grand défi. Dans l’extraction d’information la reconnaissance d’entités nommées (REN) vise à extraire des instances nommées dans le texte, par exemple des noms de personnes,de lieux, tandis que l’extraction de relation (ER) consiste à extraire des relations entre ces entités nommées. Pour ces deux tâches, la plupart des méthodes d’apprentissage automatiques supervisé es utilisées sont essentiellement statistiques avec de très bons résultats pour la REN, moins bons pour l’ER. Ces méthodes statistiques utilisent généralement un espace d’hypothèses propositionnelles pour la représentation des exemples (attribut-valeur) présentant certaines limitations notamment dans l’extraction de relations complexes exigeant des informations contextuelles sur les instances concernées, voire des ressources séma ntiques. Dans cet article, nous présentons le système OntoILPER, permettant d’extraire automatiquement des instances d’entités et de relations de documents textuels en langue anglaise. Ce système tire profit des ressources sémantiques d’une ontologie de domaine, mais aussi d’un espace d’hypothèses relationnel plus riche, pour représenter les exemples et induire des règles d’extraction symboliques par programmation logique inductive (PLI), une technique d’apprentissage symbolique. Plusieurs expérimentations sur le corpus de référence TREC permettent de comparer ses performances encourageantes avec celles de systèmes d’extraction statistiques.



ABSTRACT

Faced with the growing amount of information available both on the Web and in digital libraries, the development of automatic Information Extraction (IE) systems, both effective, robust and adaptive, is a big challenge. In IE domain, Named Entity Recognition (NER) and Relation Extraction (RE) are two important tasks. The former aims at finding named instances, as people ́s names, locations, among others, where as the latter consists detecting and characterizing relations among such named entities in text. Most of the state-of-the-art supervised learning methods for NER and RE relies on statistical machine learning techniques with higher accurate results for NER than RE. These statistical machine learning techniques typically uses a propositional hypothesis space for representing examples, i.e., an attribute-value representation. Such representation presents some limitations particularly to the extraction of complex relations, which demand more semantic resources, and mainly contextual information about the involving instances. In this paper, we present an IE system, named OntoILPER, permitting to extract both entity and relation instances from textual document in english. This system, not only benefits from a domain ontology as semantic resource, but also takes advantage of a higher expressive relational hypothesis space for representing examples whose structure is relevant to the task at hand. OntoILPER induces extraction rules that subsume examples of entities and relation instances from a specific graph-based model of sentence representation. Moreover, the system enables the application of domain ontologies and further ground knowledge in the form of relational features. In addition, this paper presents several experiments with OntoILPER on NER and RE using the TREC reference corpus, and compare these results to other state- of-the-art IE systems.



AUTEUR(S)
Bernard ESPINASSE, Rinaldo LIMA, Fred FREITAS

MOTS-CLÉS
extraction d’entités et de relations, apprentissage symbolique, extraction d’information à base d’ontologies, programmation logique inductive, peuplement d’ontologie.

KEYWORDS
entity and relation extraction, symbolic machine learning, ontology-based information extraction, inductive logic programming, ontology population.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (720 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier