Une Approche Formelle pour la Génération d'Analyseurs de Langages Naturels
Manuel Vilares Ferro / vilares@dc.fi.udc.es
Alberto Valderruten Vidal / valderruten@dc.fi.udc.es
Jorge Graña Gil / grana@dc.fi.udc.es
Miguel A. Alonso Pardo / alonso@dc.fi.udc.es
in P. Blache (ed.),
Actes de la Seconde Conférence Annuelle sur le Traitement Automatique du Langage Naturel, pp. 246-255,
Marseille, France, 1995.
Résumé
Un processus d'analyse syntaxique et d'étiquetage efficace est
déterminant dans l'élaboration de structures d'analyse de
langages naturels. Ce papier introduit un environnement de
dévéloppement permettant l'implémentation du support formel des
langages naturels à partir de deux points de vue, analyse syntaxique
et étiquetage. Le problème de l'analyse syntaxique repose sur
l'analyse de grammaires algébriques sans restrictions, et celui de
l'étiquetage sur des automates finis non déterministes.
L'analyseur syntaxique prends en entrée un texte arbitraire, et suit
la structure désignée par une grammaire algébrique. Le partage
syntaxique est optimisé de façon à favoriser l'élimination des
ambiguïtés pendant le processus sémantique.
Les automates à états finis sont utilisés comme formalisme
opérationnel pour étiqueter les corpora de façon efficace,
spécialement pour les langages dont
l'analyse morphologique a une relevance accrue.
Les deux activités, analyse syntaxique et étiquetage, sont
intégrées dans un même outil, Galena (pour
Generador de Analizadores para Lenguages
Naturales), fournissant l'incrémentalité comme fonctionnalité
favorisant la réutilisabilité des composantes d'un point de vue
génie logiciel.
Mots clés: Analyse Syntaxique, Analyse Morphologique, Automates à États Finis,
Automates à Piles, Forêt Partagée, Étiquetage.
Ce travail a été partiellement financé
par le projet Eureka Software Factory, et par le
Gouvernement Autonome de Galice, projet XUGA10501A93.
Manuel Vilares Ferro / vilares@dc.fi.udc.es
Alberto Valderruten Vidal / valderruten@dc.fi.udc.es
Jorge Graña Gil / grana@dc.fi.udc.es
Miguel A. Alonso Pardo / alonso@dc.fi.udc.es