SciELO - Scientific Electronic Library Online

 
vol.15 número2Evaluación de modelos de n-gramas para la tarea de desambiguación bilingüe del sentido de las palabrasReconocimiento de patrones para la identificación de estilos de aprendizaje en herramientas de educación móvil y en redes sociales índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Computación y Sistemas

versión On-line ISSN 2007-9737versión impresa ISSN 1405-5546

Resumen

DAS, Dipankar  y  BANDYOPADHYAY, Sivaji. Etiquetación de emociones a nivel de documento: aprendizaje automático y un método basado en recursos. Comp. y Sist. [online]. 2011, vol.15, n.2, pp.221-234. ISSN 2007-9737.

El objetivo de este trabajo es identificar las emociones en documentos escritos en bengalí extraídos de un blog usando dos enfoques distintos. El primer enfoque es aprendizaje automático en el cual se acumula la información de los documentos a partir de las oraciones obtenidas a través de análisis de palabras, es decir, en el nivel más granular, mientras que el segundo enfoque está basado en recursos de los cuales usamos el Bengalí WordNet Affect -un recurso léxico que incluye palabras del bengalí etiquetadas con emociones. En el primer enfoque, la máquina de soporte vectorial (Support Vector Machine, SVM) se usa para la clasificación a nivel de palabras. El valor afectivo de las oraciones se calcula según la técnica basada en promediar los puntajes de pesos asignados a los significados de palabras etiquetadas con emociones en estas oraciones. La suma acumulada de los puntajes afectivos de las oraciones se asigna a cada documento tomando en cuenta diversas características heurísticas. El segundo enfoque implementa el método basado en mayoría para clasificar un documento dado considerando las listas del Bengalí WordNet Affect. En ambos enfoques, en vez de asignar una única etiqueta afectiva a un documento dado, las dos mejores etiquetas afectivas se asignan a cada documento según los puntajes afectivos obtenidos ordenados. Usando la combinación de las mejores características obtenida del conjunto de desarrollo, al evaluar 110 documentos de prueba resulta un valor promedio de la métrica F-score en los dos enfoques 59,50% y 51,07% respectivamente para toda clase de emociones.

Palabras llave : Procesamiento de lenguaje natural; lingüística computacional; texto; blog; documento; WordNet Affect; puntaje de peso de significado; campo aleatorio condicional (Conditional Random Field, CRF); máquina de soporte vectorial (Support Vector Machine, SVM); etiquetas afectivas; características heurísticas.

        · resumen en Inglés     · texto en Inglés     · Inglés ( pdf )

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons