SciELO - Scientific Electronic Library Online

 
vol.18 issue2Efficiently Finding the Optimum Number of Clusters in a Dataset with a New Hybrid Cellular Evolutionary AlgorithmA Gaussian Selection Method for Speaker Verification with Short Utterances author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Computación y Sistemas

Print version ISSN 1405-5546

Abstract

GELBUKH, Alexander. Aprendizaje no supervisado para la desambiguación sintáctica. Comp. y Sist. [online]. 2014, vol.18, n.2, pp.329-344. ISSN 1405-5546.  http://dx.doi.org/10.13053/CyS-18-2-2014-035.

Se presenta un marco metodológico para la desambiguación sintáctica de textos en lenguaje natural. El método se aprovecha de una gramática no probabilística y no lexicalizada existente compilada manualmente, y la convierte en una gramática lexicalizada probabilística a través del aprendizaje automático de una especie de los marcos de subcategorización o preferencias de selección para todas las palabras observadas en el corpus de entrenamiento. El diccionario de los marcos de subcategorización o preferencias de selección, obtenido en el proceso de entrenamiento, se puede utilizar posteriormente para la desambiguación sintáctica de nuevos textos no vistos previamente por el algoritmo. El proceso de aprendizaje es no supervisado y no requiere de marcaje manual alguno. El algoritmo de aprendizaje propuesto en este artículo se puede aprovechar de cualquier método de desambiguación existente, incluyendo métodos lingüísticamente motivados, para la filtración o ponderación de los árboles sintácticos alternativos o relaciones sintácticas alternativas, lo que permite la integración del conocimiento lingüístico y el aprendizaje automático no supervisado.

Keywords : Procesamiento del lenguaje natural; análisis sintáctico; desambiguación sintáctica; aprendizaje automático no supervisado.

        · abstract in English     · text in English     · English ( pdf )

 

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License