SciELO - Scientific Electronic Library Online

 
vol.17 issue4A Semantically-based Lattice Approach for Assessing Patterns in Text Mining TasksOn the NP-Completeness of Computing the Commonality Among the Objects Upon Which a Collection of Agents Has Performed an Action author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Computación y Sistemas

Print version ISSN 1405-5546

Comp. y Sist. vol.17 n.4 México Oct./Dec. 2013

 

Artículos regulares

 

Uso eficiente de pivotes aplicado a la búsqueda aproximada en algoritmos rápidos sobre espacios métricos

 

Efficient use of Pivots for Approximate Search in Metric Spaces

 

Raisa Socorro Llanes1 , Luisa Micó Andrés2

 

1 Instituto Superior Politécnico José Antonio Echeverría, CUJAE, Cuba. raisa@ceis.cujae.edu.cu

2 Universidad de Alicante, España. mico@dlsi.ua.es

 

Article received on 13/06/2012
Accepted on 20/06/2013

 

Resumen

El contexto de este trabajo es la búsqueda rápida de vecinos más cercanos en espacios métricos. Uno de los objetivos de estos algoritmos es la reducción del tiempo de respuesta durante la búsqueda. Reducir el tiempo de respuesta consiste muchas veces en reducir el número de distancias a calcular, debido al alto coste computacional que de por sí pueden tener las distancias a utilizar en ciertas aplicaciones. Nosotros proponemos una nueva versión y mejoras de un algoritmo recientemente publicado, PiAESA, variante del algoritmo AESA, usado como referencia en este área por sus buenos resultados desde hace más de 20 años. La nueva versión es más simple y permite una mejor comprensión del algoritmo y sus parámetros. Además, se ha conseguido aumentar la eficiencia definiendo una versión aproximada. Los resultados empíricos obtenidos utilizando datos artificiales y reales confirman una mejora en los resultados de la versión aproximada, con un alto porcentaje de una respuesta correcta (dada por un algoritmo exacto).

Palabras clave: Búsqueda aproximada, espacios métricos, vecino más cercano, distancias.

 

Abstract

This work focuses on pivot-based fast nearest neighbor search algorithms that can work in any metric space. One of the objectives of these algorithms is to reduce the time consumed during search. Reducing time consumption of such algorithms usually consists in reducing the number of distances for computing, due to the high cost that they have in certain applications. We introduce a new version and improvements for a recently proposed algorithm, PiAESA, a variant of the AESA algorithm, used as baseline for performance measurement for over twenty years. The new version is simpler and allows better understanding of the algorithm and parameters used. Moreover, the efficiency is increased by defining an approximated version. Our empirical results with real and artificial databases confirm a consistent improvement in performance, when retrieving very high percentage of the correct answers (given by the exact algorithm).

Keywords: Approximate search, metric spaces, near neighbor, distances.

 

DESCARGAR ARTÍCULO EN FORMATO PDF

 

Agradecimientos

Los autores agradecen a la Comisión Interministerial de Ciencia y Tecnología del gobierno de España por la ayuda a través del proyecto TIN2009-14205-C04-C1, a la Consellería de Educación de la Comunidad Valenciana a través del proyecto PROMETEO/2012/01 y al Proyecto Habana de la Universidad de Alicante.

 

Referencias

1. Lv, Q., Charikar, M., & Li, K. (2004). Image similarity search with compact data structures. Thirteenth ACM international conference on Information and knowledge management (CIKM '04), Washington D.C., USA, 208-217.         [ Links ]

2. Ankerst, M., Kastenmuller, G., Kriegel, H.-P., & Seidl, T. (1999). 3d shape histograms for similarity search and classification in spatial databases. 6th International Symposium on Advances in Spatial Databases (SSD'99), Hong Kong, China, 207-226.         [ Links ]

3. Socorro, R., Mico, L., & Oncina, J. (2011). A fast pivot-based indexing algorithm for metric spaces. Pattern Recognition Letters, 32(11), 1511-1516.         [ Links ]

4. Battiato, S., di Blasi, G., & Reforgiato, D. (2007). Advanced indexing schema for imaging applications: three case studies. IET Image Processing, 1(3), 249-268.         [ Links ]

5. Brisaboa, N.R., Farina, A., Pedreira, O., & Reyes, N. (2006). Similarity search using sparse pivots for efficient multimedia information retrieval. Eighth IEEE International Symposium on Multimedia (ISM 06), San Diego, CA, 881-888.         [ Links ]

6. Bustos, B., Pedreira, O., & Brisaboa, N. (2008). A dynamic pivot selection technique for similarity search. 1st International Workshop on Similarity Search and Applications (SISAP'08), Cancun, Mexico, 105-112.         [ Links ]

7. Chavez, E., Navarro, G., Baeza-Yates, R., & Marroquin, J.L. (2001). Searching in metric spaces. ACM Computer Survey, 33(3), 273-321.         [ Links ]

8. Clarkson, K.L. (1999). Nearest neighbor queries in metric spaces. Discrete and Computational Geometry, 22(1), 63-93.         [ Links ]

9. Dasarathy, B.V. (1990). Nearest neighbor (NN) norms: NN pattern classification techniques. Los Alamitos, Calif.: IEEE Computer Society Press.         [ Links ]

10. Figueroa, K.M. (2007). Indexación Efectiva de Espacios Métricos usando Permutaciones. Tesis de Doctorado, Universidad de Chile, Santiago de Chile, Chile.         [ Links ]

11. Figueroa, K., Chavez, E., Navarro, G., & Paredes, R. (2009). Speeding up spatial approximation search in metric spaces. Journal of Experimental Algorithmics, 14, Article 6.         [ Links ]

12. Huang, T.S., Dagli, C.K., Rajaram, S., Chang, E.Y., Mandel, M.I., Poliner, G.E., & Ellis, D.P.W. (2008). Active learning for interactive multimedia retrieval. Proceedings of the IEEE, 96(4), 648-667.         [ Links ]

13. Korn, F., Sidiropoulos, N., Faloutsos, C., Siegel, E., & Protopapas, Z. (1996). Fast nearest neighbor search in medical image databases. 22th International Confonference on Very Large Data Bases (VLDB '96), Bombay, India, 215-226.         [ Links ]

14. Levenshtein, V.I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Soviet Physics Doklady, 10(8), 707-710.         [ Links ]

15. Micó, M.L. (1996). Algoritmos de búsqueda de vecinos más próximos en espacios métricos. Tesis doctoral, Universidad Politécnica de Valencia, Valencia, España.         [ Links ]

16. Moreno-Seco, F., Micó, L., & Oncina, J. (2003). A modification of the LAESA algorithm for approximated k-nn classification. Pattern Recognition Letters, 24(1-3), 47-53.         [ Links ]

17. Potamias, M. & Athitsos, V. (2008). Nearest neighbor search methods for handshape recognition. 1st International conference on PErvasive Technologies Related to Assistive Environments (PETRA '08), Athens, Greece Article No. 30.         [ Links ]

18. Tokoro, K., Yamaguchi, K., & Masuda, S. (2006). Improvements of TLAESA nearest neighbour search algorithm and extension to approximation search. 29th Australasian Computer Science Conference (ACSC06), Tasmania, Australia, 48, 77-83.         [ Links ]

19. Vida,l E. (1985). Diversas aportaciones al Reconocimiento Automático del Habla. PhD thesis, Universitat de Valencia, Valencia, España.         [ Links ]

20. Vidal, E. (1986). An algorithm for finding nearest neighbours in (approximately) constant average time. Pattern Recognition Letters, 4(3), 145-157.         [ Links ]

21. Vidal, E. (1994). New formulation and improvements of the nearest-neighbour approximating and eliminating search algorithm (AESA). Pattern Recognition Letters, 15(1), 1-7.         [ Links ]

22. Zezula, P., Amato, G., Dohnal, V., & Batko, M. (2006). Similarity Search. The Metric Space Approach, New York: Springer.         [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License