SciELO - Scientific Electronic Library Online

 
vol.12 número3Vibration Analysis of Rolling Element Bearings DefectsGeneralized SSPRT for Fault Identification and Estimation of Linear Dynamic Systems Based on Multiple Model Algorithm índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Journal of applied research and technology

versión On-line ISSN 2448-6736versión impresa ISSN 1665-6423

J. appl. res. technol vol.12 no.3 Ciudad de México jun. 2014

 

Extensions to K-Medoids with Balance Restrictions over the Cardinality of the Partitions

 

B. Bernábe-Loranca*1, R. González-Velázquez2, E. Olivares-Benítez3, J. Ruiz-Vanoye4 and J. Martínez-Flores5

 

1, 2 Facultad de Ciencias de la Computación, Benemérita Universidad Autónoma de Puebla BUAP, Puebla, Pue., México. *beatriz.bernabe@gmail.com

35 Universidad Popular Autónoma del Estado de Puebla, Puebla, Pue., México.

4 Universidad Autónoma del Carmen Ciudad del Carmen, Campeche, México.

 

ABSTRACT

The zones design occurs when small areas or basic geographic units (BGU) must be grouped into acceptable zones under the requirements imposed by the case study. These requirements can be the generation of intra-connected and/or compact zones or with the same amount of habitants, clients, communication means, public services, etc. In this second point to design a territory, the selection and adaptation of a clustering method capable of generating compact groups while keeping balance in the number of objects that form each group is required.

The classic partitioning stands out (also known as classification by partition among the clustering or classification methods [1]). Its properties are very useful to create compact groups.

An interesting property of the classification by partitions resides in its capability to group different kinds of data. When working with geographical data, such as the BGU, the partitioning around medoids algorithms have given satisfactory results when the instances are small and only the objective of distances minimization is optimized. In the presence of additional restrictions, the K-medoids algorithms, present weaknesses in regard to the optimality and feasibility of the solutions.

In this work we expose 2 variants of partitioning around medoids for geographical data with balance restrictions over the number of objects within each group keeping the optimality and feasibility of the solution. The first algorithm considers the ideas of k-meoids and extends it with a recursive constructive function to find balanced solutions. The second algorithm searches for solutions taking into account a balance between compactness and the cardinality of the groups (multiobjective). Different tests are presented for different numbers of groups and they are compared with some results obtained with Lagrange Relaxation. This kind of grouping is needed to solve aggregation for Territorial Design problems

Keywords: Cardinality, grouping, k-medoids.

 

RESUMEN

El diseño de zonas ocurre cuando pequeñas áreas o unidades geográficas básicas (UGB) deben ser agrupadas en zonas que resulten aceptables según los requerimientos impuestos por el problema estudiado. Estos requerimientos pueden ser la generación de zonas conexas y/o compactas o con la misma cantidad de habitantes, clientes, medios de comunicación, servicios públicos, etcétera. En este punto, es exigido para el diseño de un territorio, la selección y adaptación de un método de agrupamiento que genere grupos compactos satisfaciendo también balanceo en el número de objetos que integran los grupos.

Dentro de los métodos de agrupamiento o clasificación, destaca el particionamiento clásico (llamado también clasificación por particiones [1]). Sus propiedades son muy útiles en la creación de grupos compactos.

Un aspecto importante de la clasificación por particiones reside en su capacidad para agrupar distintos tipos de datos. Si de datos geográficos se trata, como lo son las UGB, los algoritms particionales alrededor de los medoides han dado resultados satisfactorios cuando las instancias son pequeñas y solo el objetivo de minimización de distancias es optimizado. En presencia de restricciones adicionales, los algoritmos K medoides, presentan debilidades en la optimalidad y factibilidad de la solución.

En este trabajo exponemos 2 variantes de particionamiento sobre medoides para datos geográficos con restricciones de balanceo en el número de objetos que forman los grupos manteniendo optimalidad y factibilidad. El primer algoritmo considera los principios de k-medoides y lo extiende con una función recursiva y constructiva para encontrar solucione balanceadas. El segundo algoritmo se ocupa en la búsqueda de soluciones considerando un esquema de equilibrio entre compacidad y balanceo (multiobjectivo). Se presentan distintas pruebas para el tamaño de los grupos y se comparan con algunos resultados obtenidos por Relajación Lagranjeana. Este tipo de agrupamiento se hace necesario en la resolución de agregación con homogeneidad en la cardinalidad de los grupos para problemas de Diseño de Territorio.

 

DESCARGAR ARTÍCULO EN FORMATO PDF

 

References

[1] E. Piza et al., "Nuevas técnicas de particionamiento en clasificación automática", Revista de Matemática: Teoría y Aplicaciones, vol. 6, no. 1, 51-66, 1999.         [ Links ]

[2] J. Ferland and G. Guenette, "Decision Support System for the School Districting Problem". Operations Research, vol. 38, no 1, pp. 15-21, 1990.         [ Links ]

[3] E.A. Rincón-García et al., "A Multiobjective Algorithm for Redistricting", Journal of Applied Research and Technology, vol. 11, pp. 324-330 , 2013.         [ Links ]

[4] F. Tavares-Pereira et al., "Multiple criteria districting problems; The public transportation network pricing system of the Paris region", Annals Operations Research, vol. 154, pp. 69-92, 2007.         [ Links ]

[5] F. Bacao et al., "Applying Genetic Algorithms to Zone Design", Soft Computing-Fusion of Foundations, Methodologies and Applications, Springer-Verlag Heidelberg, vol. 2, no. 5, pp. 341-348, 2005.         [ Links ]

[6] S.W. Hess and S.A. Samuels, "Experiences with a Sales Districting Model: Criteria and Implementation". Management Science, Application Series, Part 2, Marketing Management Models, vol. 18, no. 4., pp. 4154. 1971.         [ Links ]

[7] R.Z. Ríos-Mercado and E. Fernández, "A reactive GRASP for comercial territory design problem with multiple balancing requirements". Computers & Operations Research, vol. 36, no. 3, pp. 755-776, 2009.         [ Links ]

[8] M. Segal, and D. Weinberger, "Turfing", Operations Research, vol. 25, no. 3, pp. 367-386, 1977.         [ Links ]

[9] M. Blais et al., "Solving a home-care districting problem in an urban setting". Journal of the Operational Research Society, vol. 54, pp. 1141-1147, 2003.         [ Links ]

[10] J.T. Cova and R.L. Church, "Contiguity Constraints for Single-Region Site Search Problems". Geographical Analysis, vol. 32, no. 4, pp. 306-329, 2000.         [ Links ]

[11] W. Macmillan, "Redisricting in a GIS environment: An optimization algorithm using switching-points". Journal of geographical systems, vol. 3, pp. 167-180, 2001.         [ Links ]

[12] T. Shirabe, "A Model of Contiguity for Spatial Unit Allocation". Geographical Analysis, vol. 37, pp. 2-16, 2005.         [ Links ]

[13] J. Han et al., "Spatial clustering methods in data mining: A survey, Geographic Data Mining and Knowledge Discovery, Research Monographs in GIS Taylor and Francis, New York, 2001, pp. 33-50.         [ Links ]

[14] L. Kaufman & P. Rousseeuw,, "Clustering by Means of Medoids, Statistical Data Analysis Based on the L1 Norm and Related Methods", North-Holland, 1987, pp. 405-416.         [ Links ]

[15] Petra Kudová, "Clustering Genetic Algorithm", 18th International Workshop on Database and Expert Systems Applications, Institute of Computer Science IEEE, Czech Republic, 2007, pp. 138-142.         [ Links ]

[16] Forgy, "Cluster analysis of multivariate data: Efficiency versus interpretability of classification", Biometrics, vol. 21, pp. 768-780, 1965.         [ Links ]

[17] T. Velmurugan and T. Santhanam, "Computational Complexity between K-Means and K-Medoids Clustering Algorithms for Normal and Uniform Distributions of Data Points", Journal of Computer Science, vol. 6, no. 34, pp. 363-368, 2010.         [ Links ]

[18] A. Zoltners, P. Sinha., "Towards a unified territory alignment: A review and model", Management Science, pp. 1237-1256, 1983.         [ Links ]

[19] J. Kalcsics, et al., "Towards a unified territorial design approach: Applications, algorithms, and GIS integration", TOP, vol. 13, no. 1, pp. 1-56, 2005.         [ Links ]

[20] B. Bernábe, et al., "A comparative study of simulated annealing and variable neighborhood search for the geographic clustering problem", Proceedings of the international conference on data mining, Las Vegas Nevada USA, 2009, pp. 595-599.         [ Links ]

[21] García Sabater y J. Maheut, "Modelos y Métodos de Investigación de Operaciones. Procedimientos para Pensar", Spain, Investigacion Group ROGLE 20112012, pp. 42-44.         [ Links ]

[22] J. Díaz et al., "Relajación Lagrangeana para el problema de particionamiento en datos geográficos", Revista de Matemática Teoría y Aplicaciones, vol. 19, no. 2, pp. 43-55, 2012.         [ Links ]

[23] Jania Astrid Saucedo, "Uso de cotas lagrangianas mejoradas para los problemas de optimización con la estructura de descomposición doble", Universidad Autónoma de Nuevo León Facultad de Ingeniería Mecánica y Eléctrica, tesis doctoral 2009.         [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons