SciELO - Scientific Electronic Library Online

 
vol.17 issue2Anaphora Resolution for Bengali: An Experiment with Domain AdaptationGeneration of Bilingual Dictionaries using Structural Properties author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Computación y Sistemas

Print version ISSN 1405-5546

Comp. y Sist. vol.17 n.2 México Apr./Jun. 2013

 

Artículos

 

Inference and Reconciliation in a Crowdsourced Lexical-Semantic Network

 

Inferencia y reconciliación en la red léxica y semántica basada en la técnica crowdsourced

 

Manel Zarrouk1, Mathieu Lafourcade2, and Alain Joubert3

 

1 LIRMM, Montpellier, 161, rue Ada, 34392 Montpellier Cedex, France manel.zarrouk@lirmm.fr

2 LIRMM, Montpellier, 161, rue Ada, 34392 Montpellier Cedex, France lafourcade@lirmm.fr

3 LIRMM, Montpellier, 161, rue Ada, 34392 Montpellier Cedex, France joubert@lirmm.fr

 

Article received on 18/12/2012
Accepted on 11/01/2013.

 

Abstract

Lexical-semantic network construction and validation is a major issue in NLP. No matter the construction strategies used, automatically inferring new relations from already existing ones is a way to improve the global quality of the resource by densifying the network. In this context, the purpose of an inference engine is to formulate new conclusions (i.e. relations between terms) from already existing premises (also relations) on the network. In this paper we devise an inference engine for the JeuxDeMots lexical network which contains terms and typed relations between terms. In the JeuxDeMots project, the lexical network is constructed with the help of a game with a purpose and thousands of players. Polysemous terms may be refined in several senses (bank may be a bank-financial institution or a bank-river) but as the network is indefinitely under construction (in the context of a Never Ending Learning approach) some senses may be missing. The approach we propose is based on the triangulation method implementing semantic transitivity with a blocking mechanism for avoiding proposing dubious new relations. Inferred relations are proposed to contributors to be validated. In case of invalidation, a reconciliation strategy is undertaken to identify the cause of the wrong inference: an exception, an error in the premises or a transitivity confusion due to polysemy with the identification of the proper word senses at stake.

Keywords: Inference, reconciliation, lexical networks.

 

Resumen

Construcción y validación de una red léxica y semántica es un reto en el procesamiento de lenguaje natural. Para todas las estrategias usadas de construcción, un método de mejorar la calidad general del recurso es la inferencia automática de relaciones nuevas a partir de las existentes, lo cual resulta en el aumento de la densidad de la red. En este contexto un motor de inferencia tiene el objetivo de deducir las conclusiones nuevas, es decir, relaciones entre términos, a partir de las premisas existentes (también relaciones) en la red. En este artículo se diseña un motor de inferencia para la red léxica JeuxDeMots, la cual contiene términos y relaciones definidas entre términos. En el proyecto JeuxDeMots la red léxica se construye mediante un juego con propósito y miles de jugadores. Términos polisémicos pueden ser refinados en varios significados (un banco puede ser una institución financiara y una mueble) pero como la red se está construyendo de manera infinita (en el contexto del enfoque "Aprendizaje que Nunca Termina"), algunos significados pueden faltar. El enfoque propuesto se basa en el método de triangulación implementando la transitividad semántica con el mecanismo de bloqueo para evitar las propuestas de relaciones nuevas dudosas. Las relaciones inferidas se proponen a los contribuyentes para validarlas. En el proceso de validación se puede emplear la estrategia de reconciliación con el fin de identificar la causa de una inferencia incorrecta: una excepción, un error en las premisas o una confusión de transitividad por la polisemia cuando es necesario identificar los significados apropiados de palabras.

Palabras clave: Inferencia, reconciliación, redes léxicas.

 

DESCARGAR ARTÍCULO EN FORMATO PDF

 

References

1. Dong, Z. & Dong, Q. (2006). HowNet and the Computation of Meaning. WorldScientific, London.         [ Links ]

2. Fellbaum, C. & Miller, G. (1998). (eds) WordNet. The MIT Press.         [ Links ]

3. Joubert, A. & Lafourcade, M. (2008). Jeuxdemots: un prototype ludique pour l'émergence de relations entre termes. In proc of JADT'2008, Ecole normale supérieure Lettres et sciences humaines , Lyon, France, 12-14 mars 2008, 8 p.         [ Links ]

4. Lafourcade, M. (2007). Making people play for lexical acquisition. In Proc. SNLP 2007, 7th Symposium on Natural Language Processing. Pattaya, Thailande, 13-15 December 2007, 8 p.         [ Links ]

5. Lieberman, H., Smith, D. A., & Teeters, A. (2007). Common consensus: a web-based game for collecting commonsense goals. In Proc. of IUI, Hawaii., 12 p.         [ Links ]

6. Marchetti, A., Tesconi, M., Ronzano, F., Mosella, M., & Minutoli, S. (2007). Semkey: A semantic collaborative tagging system. in Procs of WWW2007, Banff, Canada, 9 p.         [ Links ]

7. Mihalcea, R. & Chklovski, T. (2003). Open mindword expert: Creating large annotated data collections with web users help. In Proceedings of the EACL 2003, Workshop on Linguistically Annotated Corpora (LINC 2003), 10 p.         [ Links ]

8. Miller, G., Beckwith, R., Fellbaum, C., Gross, D., & Miller, K. (1990). Introduction to wordnet: an on-line lexical database. International Journal of Lexicography, 3(4), 235-244.         [ Links ]

9. Navigli, R. & Ponzetto, S. (2012). Babelnet: Building a very large multilingual semantic network. In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics, Uppsala, Sweden, 11-16 July 2010, 216-225.         [ Links ]

10. Sagot, B. & Fier, D. (2008). Construction d'un wordnet libre du français ç2 partir de ressources multilingues. TALN 2008, Avignon, France, 2008., 12.         [ Links ]

11. Siorpaes, K. & Hepp, M. (2008). Games with a purpose for the semantic web. In IEEE Intelligent Systems, 23(3), 50-60.         [ Links ]

12. Thaler, S., Siorpaes, K., Simperl, E., & Hofer, C. (2011). A survey on games for knowledge acquisition. STI Technical Report, May 2011, 19.         [ Links ]

13. von Ahn, L. & Dabbish, L. (2008). Designing games with a purpose. Communications of the ACM, 51(8), 58-67.         [ Links ]

14. Vossen, P. (1998). Eurowordnet: a multilingual database with lexical semantic networks, 200.         [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License