Services on Demand
Journal
Article
Indicators
- Cited by SciELO
- Access statistics
Related links
- Similars in SciELO
Share
Computación y Sistemas
On-line version ISSN 2007-9737Print version ISSN 1405-5546
Abstract
ISLAM, Zahurul and MEHLER, Alexander. Clasificación automática de la legibilidad de datos de fuentes múltiples basada en características lingüísticas y de la teoría de información. Comp. y Sist. [online]. 2013, vol.17, n.2, pp.113-123. ISSN 2007-9737.
En este trabajo se presenta un clasificador de la legibilidad de textos basado en las características de la teoría de información. El clasificador ha sido desarrollado en base del enfoque lingüístico a la legibilidad usando las características léxicas, sintácticas y semánticas. Para esta evaluación se extrajo un corpus de 645 artículos de Wikipedia, junto con sus evaluaciones de calidad. Se demuestra que las características mencionadas tienen buen desempeño, incluso en el caso cuando se exploran varios niveles lingüísticos a la vez.
Keywords : Legibilidad de textos; Wikipedia; entropía; transmisión de información; evaluación de características.