SciELO - Scientific Electronic Library Online

 
vol.18 issue1Speech Enhancement with Local Adaptive Rank-Order FilteringNoise Detection and Learning Based on Current Information author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Computación y Sistemas

Print version ISSN 1405-5546

Abstract

RAMIREZ-CRUZ, Yunior. Introducción de sesgos en el agrupamiento de documentos. Comp. y Sist. [online]. 2014, vol.18, n.1, pp.137-151. ISSN 1405-5546.  http://dx.doi.org/10.13053/CyS-18-1-2014-024.

En este artículo se presentan tres criterios para la introducción de sesgos en algoritmos de agrupamiento de documentos, cuando se dispone de información que caracteriza las colecciones de documentos. Nos concentramos en colecciones de las que se conoce que son el resultado de un proceso de categorización o filtrado de documentos basado en muestras. Nuestras propuestas utilizan perfiles, es decir muestras de documentos de las que se conoce que han sido utilizadas para obtener la colección, para extraer estadísticos que determinan los sesgos a introducir. Llevamos a cabo una evaluación experimental sobre un conjunto de colecciones extraídas del corpus ampliamente utilizado RCV1, que nos permiten confirmar la validez de nuestras propuestas y determinar un número de situaciones donde los agrupamientos sesgados según diferentes criterios superan a sus contrapartes no sesgadas.

Keywords : Agrupamiento de documentos; introducción de sesgos.

        · abstract in English     · text in English     · English ( pdf )

 

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License