Une Approche Formelle pour la Génération d'Analyseurs de Langages Naturels

Manuel Vilares Ferro / vilares@dc.fi.udc.es
Alberto Valderruten Vidal / valderruten@dc.fi.udc.es
Jorge Graña Gil / grana@dc.fi.udc.es
Miguel A. Alonso Pardo / alonso@dc.fi.udc.es

in P. Blache (ed.), Actes de la Seconde Conférence Annuelle sur le Traitement Automatique du Langage Naturel, pp. 246-255, Marseille, France, 1995.

Résumé

Un processus d'analyse syntaxique et d'étiquetage efficace est déterminant dans l'élaboration de structures d'analyse de langages naturels. Ce papier introduit un environnement de dévéloppement permettant l'implémentation du support formel des langages naturels à partir de deux points de vue, analyse syntaxique et étiquetage. Le problème de l'analyse syntaxique repose sur l'analyse de grammaires algébriques sans restrictions, et celui de l'étiquetage sur des automates finis non déterministes. L'analyseur syntaxique prends en entrée un texte arbitraire, et suit la structure désignée par une grammaire algébrique. Le partage syntaxique est optimisé de façon à favoriser l'élimination des ambiguïtés pendant le processus sémantique. Les automates à états finis sont utilisés comme formalisme opérationnel pour étiqueter les corpora de façon efficace, spécialement pour les langages dont l'analyse morphologique a une relevance accrue. Les deux activités, analyse syntaxique et étiquetage, sont intégrées dans un même outil, Galena (pour Generador de Analizadores para Lenguages Naturales), fournissant l'incrémentalité comme fonctionnalité favorisant la réutilisabilité des composantes d'un point de vue génie logiciel.

Mots clés: Analyse Syntaxique, Analyse Morphologique, Automates à États Finis, Automates à Piles, Forêt Partagée, Étiquetage.


Ce travail a été partiellement financé par le projet Eureka Software Factory, et par le Gouvernement Autonome de Galice, projet XUGA10501A93.


Manuel Vilares Ferro / vilares@dc.fi.udc.es
Alberto Valderruten Vidal / valderruten@dc.fi.udc.es
Jorge Graña Gil / grana@dc.fi.udc.es
Miguel A. Alonso Pardo / alonso@dc.fi.udc.es