<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0187-358X</journal-id>
<journal-title><![CDATA[Investigación bibliotecológica]]></journal-title>
<abbrev-journal-title><![CDATA[Investig. bibl]]></abbrev-journal-title>
<issn>0187-358X</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México, Instituto de Investigaciones Bibliotecológicas y de la Información]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0187-358X2011000200004</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[La ley de Zipf y el punto de transición de Goffman en la indización automática]]></article-title>
<article-title xml:lang="en"><![CDATA[Zipf's law and goffman's transition point in the automatic indexing]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Urbizagástegui Alvarado]]></surname>
<given-names><![CDATA[Rubén]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Restrepo Arango]]></surname>
<given-names><![CDATA[Cristina]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Unversidad Nacional Autónoma de México Centro Universitario de Investigaciones Bibliotecológicas ]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,El Colegio de México Biblioteca Daniel Cosío Villegas ]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>08</month>
<year>2011</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>08</month>
<year>2011</year>
</pub-date>
<volume>25</volume>
<numero>54</numero>
<fpage>71</fpage>
<lpage>92</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S0187-358X2011000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S0187-358X2011000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S0187-358X2011000200004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Con el fin de identificar las palabras con un alto valor semántico en el contenido temático de un artículo científico se explora el punto de transición de Goffman. Esta técnica se aplicó a 1,644 palabras diferentes identificadas en el texto. Las palabras fueron ordenadas en tablas de frecuencias en orden descendente para explorar cuatro posibilidades. En la primera exploración se tuvieron en cuenta tanto las palabras funcionales como las palabras con un alto valor semántico; en la segunda exploración se eliminaron las palabras funcionales; en la tercera exploración se lematizaron tanto las palabras funcionales como las palabras con un alto contenido semántico, en la cuarta exploración se eliminaros las palabras funcionales. Los resultados obtenidos en las cuatro exploraciones coinciden en la identificación de las palabras clave.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[To identify keywords with high semantic value in the thematic content of a scientific paper the Goffman's transition Point is applied. A total of 1,644 different words were identified in the text. These words were arranged in descending order of frequency to explore four possibilities. In the first examination both, functional words and words with high semantic value were taken into account. In the second examination, the functional words were removed; and in the third examination both functional words as well as words with high semantic content, were lemmatized. In the fourth examination only functional word were eliminated. The result shows the identification of specific keywords.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Ley de Zipf]]></kwd>
<kwd lng="es"><![CDATA[Punto de Transición de Goffman]]></kwd>
<kwd lng="es"><![CDATA[Bibliometría]]></kwd>
<kwd lng="es"><![CDATA[Cienciometría]]></kwd>
<kwd lng="es"><![CDATA[Infometría]]></kwd>
<kwd lng="en"><![CDATA[Zipf's law]]></kwd>
<kwd lng="en"><![CDATA[Goffman's Transition Point]]></kwd>
<kwd lng="en"><![CDATA[Bibliometrics]]></kwd>
<kwd lng="en"><![CDATA[Scientometrics]]></kwd>
<kwd lng="en"><![CDATA[Infometrics]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Art&iacute;culos</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>La ley de Zipf y el punto de transici&oacute;n de Goffman en la indizaci&oacute;n autom&aacute;tica</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>Zipf's law and goffman's transition point in the automatic indexing</b></font></p>      <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Rub&eacute;n Urbizag&aacute;stegui Alvarado<a name="n0b"></a><a href="#n0a">*</a> Cristina Restrepo Arango<a name="n00b"></a><a href="#n00a">**</a></b></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i>* Universidad de California en Riverside, USA.</i> <a href="mailto:ruben@ucr.edu">ruben@ucr.edu</a></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>* Pontificia Universidad Javeriana, Colombia.</i> <a href="mailto:crestrepoarango@yahoo.com">crestrepoarango@yahoo.com</a></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Art&iacute;culo recibido: 9 de marzo de 2011.    <br> 	Art&iacute;culo aceptado: 15 de junio de 2011. </font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Con el fin de identificar las palabras con un alto valor sem&aacute;ntico en el contenido tem&aacute;tico de un art&iacute;culo cient&iacute;fico se explora el punto de transici&oacute;n de Goffman. Esta t&eacute;cnica se aplic&oacute; a 1,644 palabras diferentes identificadas en el texto. Las palabras fueron ordenadas en tablas de frecuencias en orden descendente para explorar cuatro posibilidades. En la primera exploraci&oacute;n se tuvieron en cuenta tanto las palabras funcionales como las palabras con un alto valor sem&aacute;ntico; en la segunda exploraci&oacute;n se eliminaron las palabras funcionales; en la tercera exploraci&oacute;n se lematizaron tanto las palabras funcionales como las palabras con un alto contenido sem&aacute;ntico, en la cuarta exploraci&oacute;n se eliminaros las palabras funcionales. Los resultados obtenidos en las cuatro exploraciones coinciden en la identificaci&oacute;n de las palabras clave.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> Ley de Zipf; Punto de Transici&oacute;n de Goffman; Bibliometr&iacute;a; Cienciometr&iacute;a; Infometr&iacute;a.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">To identify keywords with high semantic value in the thematic content of a scientific paper the Goffman's transition Point is applied. A total of 1,644 different words were identified in the text. These words were arranged in descending order of frequency to explore four possibilities. In the first examination both, functional words and words with high semantic value were taken into account. In the second examination, the functional words were removed; and in the third examination both functional words as well as words with high semantic content, were lemmatized. In the fourth examination only functional word were eliminated. The result shows the identification of specific keywords.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Keywords:</b> Zipf's law; Goffman's Transition Point; Bibliometrics; Scientometrics; Infometrics.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">La indizaci&oacute;n es un proceso de identificaci&oacute;n del contenido de un documento y su descripci&oacute;n a trav&eacute;s de t&eacute;rminos verbales. De esa manera los conceptos identificados pueden ser representados por t&eacute;rminos ling&uuml;&iacute;sticos cuidadosamente seleccionados. Es una t&eacute;cnica de an&aacute;lisis sobre el contenido de un documento que busca expresar la informaci&oacute;n m&aacute;s significativa a trav&eacute;s de la asignaci&oacute;n de t&eacute;rminos descriptores y crear as&iacute; un lenguaje de mediaci&oacute;n entre el usuario y el documento. La estrategia de organizaci&oacute;n de esa informaci&oacute;n se basa as&iacute; en <i>descriptores,</i> que son palabras clave cuyos conceptos representan el documento en el que est&aacute;n contenidos. Esos descriptores pueden ser escogidos seg&uacute;n la capacidad del indizador; o bien siguiendo un conjunto de reglas de selecci&oacute;n de las palabras clave de un vocabulario controlado. La indizaci&oacute;n se convierte de este modo en uno de los procesos b&aacute;sicos de la recuperaci&oacute;n de la informaci&oacute;n, y tiene dos formas de expresi&oacute;n: indizaci&oacute;n manual que es realizada por una persona; e indizaci&oacute;n autom&aacute;tica que es realizada a trav&eacute;s de programas especiales ejecutadas por la computadora.</font></p>  	    <p align="justify"><font face="verdana" size="2">Uno de los problemas que enfrenta la indizaci&oacute;n manual es el tiempo disponible para su ejecuci&oacute;n y el volumen de documentos esperando ser indizados. Ciertamente ambos problemas influyen en la calidad y adecuaci&oacute;n del proceso, y otro de ellos se refiere al <i>dominio</i> del texto. La familiaridad y el conocimiento del indizador acerca de la terminolog&iacute;a usada corrientemente en los <i>dominios cient&iacute;ficos</i> son factores que inciden mucho en la calidad de la indizaci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">Ir&oacute;nicamente es en la indizaci&oacute;n manual donde su calidad se viene mostrando inadecuada, puesto que adem&aacute;s de ser un proceso que conlleva jornadas extensas de trabajo y un elevado costo de ejecuci&oacute;n, no puede minimizar la subjetividad del indizador (Bruzinga; Maculan &amp; Lima, 2007). El conocimiento y familiaridad que el indizador tiene sobre el asunto determinar&aacute; el grado de consistencia que alcance la indizaci&oacute;n. Tambi&eacute;n el car&aacute;cter variable de los campos de conocimiento exige una permanente actualizaci&oacute;n de parte del indizador. Igualmente es necesario tener en consideraci&oacute;n las inconsistencias inter&#45;indizadores (diferentes indizadores que les atribuyen diferentes t&eacute;rminos a un mismo concepto/documento) y el intra&#45;indizador (el mismo indizador que le atribuye diferentes t&eacute;rminos a un mismo concepto/documento). Otro factor que perjudica la calidad de la indizaci&oacute;n es la posibilidad de que el indizador no domine el idioma en el cual est&aacute; escrito el documento, por lo que la indizaci&oacute;n manual exigir&iacute;a que el indizador, adem&aacute;s de dominar los idiomas en que est&aacute;n escritos los textos tambi&eacute;n domine las terminolog&iacute;as usadas en cada campo cient&iacute;fico.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para superar los problemas se&ntilde;alados anteriormente se han impulsado las investigaciones en el campo de la indizaci&oacute;n autom&aacute;tica. Este tipo de indizaci&oacute;n consiste en la mecanizaci&oacute;n del proceso de indizaci&oacute;n con el prop&oacute;sito de establecer pr&aacute;cticas que reduzcan la interferencia de la subjetividad del indizador, tanto en el an&aacute;lisis del documento como en la selecci&oacute;n de los t&eacute;rminos significativos para la indizaci&oacute;n (Mamfrim, 1991) lo que minimizar&iacute;a al mismo tiempo los problemas impuestos por el idioma.</font></p>  	    <p align="justify"><font face="verdana" size="2">Uno de los mecanismos que se vienen explorando para identificar y seleccionar las palabras clave de un texto es la ley de Zipf, en especial el punto de transici&oacute;n de Goffman. Hasta d&oacute;nde saben los autores de &eacute;ste art&iacute;culo, en espa&ntilde;ol existen pocos trabajos que se centren en el an&aacute;lisis e identificaci&oacute;n de palabras clave para la indizaci&oacute;n, la construcci&oacute;n de tesauros y las listas de encabezamientos de asuntos que usen la ley de Zipf y el punto de transici&oacute;n de Goffman. Esas exploraciones est&aacute;n reducidas a los textos de Urbizag&aacute;stegui Alvarado (1999), quien aplic&oacute; la ley de Zipf y el punto de transici&oacute;n de Goffman a un art&iacute;culo escrito en ingl&eacute;s de Deanna B. Marcum. Encontr&oacute; aqu&iacute; un total de 1,025 palabras en el texto, pero s&oacute;lo estaban presentes 395 palabras diferentes. Usando el punto de transici&oacute;n de Goffman logr&oacute; identificar 4 palabras clave que describen adecuadamente el contenido del art&iacute;culo. Concluy&oacute; que con esta ley se pueden identificar adecuadamente los t&eacute;rminos de indizaci&oacute;n para un documento. El mismo autor explor&oacute; la aplicaci&oacute;n de la ley de Zipf y el punto de transici&oacute;n de Goffman a la l&iacute;rica textual de una grabaci&oacute;n sonora de Martina Portocarrero (Urbizag&aacute;stegui Alvarado, 2004). Encontr&oacute; 1,999 palabras, de las cuales s&oacute;lo 387 eran palabras diferentes. De estas palabras seleccion&oacute; 11 palabras clave que caracterizan la tem&aacute;tica de la m&uacute;sica ayacuchana cantada por de Martina Portocarrero. Sin embargo, esas palabras clave no son adecuadas para funcionar en la recuperaci&oacute;n de la informaci&oacute;n. La aplicaci&oacute;n de la ley de Zipf a la l&iacute;rica textual en la que sus contenidos sem&aacute;nticos son metaf&oacute;ricos, parece aportar mejores resultados para la antropolog&iacute;a y la etnolog&iacute;a. Tambi&eacute;n Jim&eacute;nez&#45;Salazar; Pinto y Rosso (2005) a trav&eacute;s del punto de transici&oacute;n de Goffman estudiaron el problema de la indizaci&oacute;n en textos cortos. Utilizaron una colecci&oacute;n de 48 res&uacute;menes del campo de la ling&uuml;&iacute;stica computacional y del procesamiento de textos. El total de palabras encontradas fue de 956 con un promedio de 70.4 palabras por cada texto. Los resultados confirmaron que los t&eacute;rminos con ocurrencia media obtenidos a trav&eacute;s del punto de transici&oacute;n de Goffman representan muy bien a los textos analizados.</font></p>  	    <p align="justify"><font face="verdana" size="2">Como se observa m&aacute;s adelante en la revisi&oacute;n de la literatura, la mayor&iacute;a de las exploraciones sobre este asunto est&aacute;n publicadas en portugu&eacute;s e ingl&eacute;s y sobre textos escritos en ambos idiomas. Por ello nuestro inter&eacute;s est&aacute; dirigido a la identificaci&oacute;n de palabras clave como indicadores del contenido sem&aacute;ntico de un documento escrito en espa&ntilde;ol, y que &eacute;stos sirvan para la recuperaci&oacute;n del documento indizado en una base de datos bibliogr&aacute;ficas en lenguaje espa&ntilde;ol. Por eso el objetivo de este trabajo es explorar el punto de transici&oacute;n de Goffman, derivado de la segunda la ley de Zipf para identificar las palabras con un alto valor sem&aacute;ntico en el contenido tem&aacute;tico de un texto, y la posibilidad de usar estos t&eacute;rminos como palabras clave para recuperar la informaci&oacute;n en bases de datos y cat&aacute;logos de sistemas de informaci&oacute;n. Se pretende dar respuesta a la siguiente pregunta:</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&iquest;Es posible identificar palabras clave consistentes para la indizaci&oacute;n de documentos escritos en espa&ntilde;ol aplicando el punto de transici&oacute;n sugerido por Goffman?</font></p>  	    <p align="justify"><font face="verdana" size="2">Para lograr este objetivo este texto est&aacute; organizado en cuatro partes. La primera presenta la introducci&oacute;n y luego una revisi&oacute;n de la literatura de las aplicaciones de la ley de Zipf en la BCI y otros campos del conocimiento; la segunda describe la metodolog&iacute;a empleada en &eacute;l; la tercera presenta los resultados obtenidos con la aplicaci&oacute;n de esta ley, las conclusiones, y la cuarta presenta finalmente la literatura revisada en la elaboraci&oacute;n de este art&iacute;culo.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Revisi&oacute;n de la literatura</b></font></p>  	    <p align="justify"><font face="verdana" size="2">La ley de Zipf ha sido estudiada en diversos campos del conocimiento; por ejemplo, ha sido aplicada para detectar las diferencias sem&aacute;nticas entre los ideogramas del idioma japon&eacute;s y los fonogramas del idioma ingl&eacute;s (Nabeshima y Ukio&#45;Pegio, 2004); en f&iacute;sica ha sido usada para medir la transici&oacute;n de la fase l&iacute;quida del gas (Ma, 2006); en la contabilidad como mecanismo para la detecci&oacute;n de fraudes financieros (Huang, Yen,Yang, y Hua, 2008); en la econom&iacute;a para medir los ingresos (Wyt, 2005); en la demograf&iacute;a para medir la distribuci&oacute;n de las poblaciones (Benguigui y Blumenfeld&#45;Lieberthal, 2009; Cordoba, 2008; Black y Henderson, 2003) y en la biolog&iacute;a para analizar los aspectos relevantes de la evoluci&oacute;n (Bornbergbaue, 1997). La lista de aplicaciones en otros campos del conocimiento diferentes a la ciencia de la informaci&oacute;n es ilimitada y variada.</font></p>  	    <p align="justify"><font face="verdana" size="2">Uno de los primeros en explorar la frecuencia con que las palabras aparec&iacute;an en un texto fue Jean&#45;Baptiste Estoup, quien trabaj&oacute; como taqu&iacute;grafo para el parlamento franc&eacute;s. En el desempe&ntilde;o de sus funciones observ&oacute; las regularidades en la longitud de las palabras en un texto, la aparici&oacute;n de nuevas palabras y la estructura cuantitativa del crecimiento de listas de palabras ordenadas de acuerdo con sus frecuencias de aparici&oacute;n (Estoup, 1908, 1916). Este modelo matem&aacute;tico que estudia la frecuencia de ocurrencias de las palabras en un documento fue tambi&eacute;n examinado por el f&iacute;sico Condon (1928) quien estudi&oacute; los textos de L. P. Ayres y G. Dewey que conten&iacute;an m&aacute;s de cien mil palabras en ingl&eacute;s, con &eacute;stas traz&oacute; el logaritmo de frecuencia de las palabras observadas frente al logaritmo de la frecuencia de apariciones en el texto, y observ&oacute; una distribuci&oacute;n negativa de las palabras sobre una l&iacute;nea recta. En la opini&oacute;n de Condon (1928), la frecuencia de las palabras en un texto seguir&iacute;a una ley cuantitativa de utilidad disminuyente muy similar a la ley de Weber&#45;Fechner en psicolog&iacute;a; por tanto, la frecuencia de uso de una palabra medir&iacute;a el efecto de su utilidad en la transmisi&oacute;n de ideas entre los individuos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Posteriormente George Kingsley Zipf estudi&oacute; tambi&eacute;n la modelaci&oacute;n matem&aacute;tica de la frecuencia con que las palabras aparecen en un texto. Este ling&uuml;ista se interes&oacute; por el estudio de los cambios fon&eacute;ticos, la frecuencia de uso de los fonemas y su tendencia a cambiar en largos periodos de tiempo. En la d&eacute;cada de los a&ntilde;os 30 public&oacute; un libro en el cual propuso el <i>principio de la frecuencia relativa</i> (Zipf, 1932) y otro donde aparece por primera vez el diagrama de Zipf sobre la frecuencia de ocurrencias de las palabras en los escritos en lat&iacute;n de Palutus (Zipf, 1935). A finales de la d&eacute;cada del 40 public&oacute; otro libro en el cual consider&oacute; que la principal raz&oacute;n del comportamiento humano es la teor&iacute;a psicol&oacute;gica conocida como la ley del m&iacute;nimo esfuerzo (Zipf, 1949), la cual establece que los seres humanos tendemos a minimizar el esfuerzo para obtener resultados exitosos. En este libro aplic&oacute; la ley del m&iacute;nimo esfuerzo a las palabras que aparecen en el Ulises de James Joyce, organiz&oacute; las palabras en forma descendente y concluy&oacute; que los individuos tienden a preferir las palabras m&aacute;s habituales sobre las poco utilizadas. Es decir, nos guiamos por el principio del m&iacute;nimo esfuerzo que favorece lo com&uacute;n y dificulta lo desconocido. En general, la mayor&iacute;a de las palabras frecuentes son tambi&eacute;n la m&aacute;s cortas y m&aacute;s f&aacute;ciles de pronunciar (Wyllys, 1981; Bail&oacute;n&#45;Moreno, Jurado&#45;Almeda, Ruiz&#45;Ba&ntilde;os y Courtial, 2005).</font></p>  	    <p align="justify"><font face="verdana" size="2">La propuesta de este ling&uuml;ista (George Kingsley Zipf) se basa en contar el n&uacute;mero de veces que se usa cada palabra en un texto m&aacute;s o menos extenso y ordenar las palabras de las m&aacute;s frecuentes a las menos frecuentes por rangos. Esta tendencia se explica porque siempre es m&aacute;s f&aacute;cil escribir una palabra conocida que usar una menos conocida. Para autores como Erar (2002) la ley de Zipf es la probabilidad de que una palabra ocurra con cierta frecuencia en un documento, lo cual significa que hay mucho de azar en el uso de las palabras cuando transmitimos un mensaje. Tambi&eacute;n refleja la actitud natural de los individuos a minimizar el esfuerzo en el uso del vocabulario y muestra la tendencia humana a inclinarse m&aacute;s por el m&iacute;nimo esfuerzo en el uso de palabras conocidas que por la erudici&oacute;n, ya que con el tiempo hay disminuci&oacute;n en la riqueza del vocabulario que usamos al escribir.</font></p>  	    <p align="justify"><font face="verdana" size="2">Esta ley es usada en el campo del procesamiento del lenguaje natural para desarrollar corpus ling&uuml;&iacute;sticos, ontolog&iacute;as, taxonom&iacute;as y otras aplicaciones, pues le ayuda a identificar el contenido tem&aacute;tico de un documento o un conjunto de documentos. A pesar de esta ventaja la ley ha sido poco utilizada en el proceso de indizaci&oacute;n o elaboraci&oacute;n de tesauros en bibliotecolog&iacute;a y ciencia de la informaci&oacute;n (BCI). Su aplicaci&oacute;n facilitar&iacute;a el desarrollo de herramientas como los tesauros, m&aacute;s a&uacute;n cuando los t&eacute;rminos se extraen de la propia literatura y las frecuencias de las palabras ayudar&iacute;an a identificar los t&eacute;rminos m&aacute;s usados en un &aacute;rea o especialidad del conocimiento, y por tanto identificar&iacute;an el vocabulario corriente de un autor o autores presentes en un corpus de documentos. Se sabe que el lenguaje es fundamental para construir el conocimiento, puesto que el significado de una palabra representa una estrecha relaci&oacute;n entre el pensamiento y el lenguaje que es dif&iacute;cil de discernir al ser un fen&oacute;meno del habla o un fen&oacute;meno del pensamiento (Vigotsky, 1998). Se entiende la construcci&oacute;n del conocimiento y su comunicaci&oacute;n como un proceso din&aacute;mico e inseparable del lenguaje. Es a trav&eacute;s de &eacute;ste como el conocimiento pasa a existir y se consolida como tal. Las exploraciones de la aplicaci&oacute;n de la inform&aacute;tica y la estad&iacute;stica a la documentaci&oacute;n en sus relaciones con la ley de Zipf son revisadas por Moreiro Gonzalez (2002).</font></p>  	    <p align="justify"><font face="verdana" size="2">En esa direcci&oacute;n Luhn (1957) fue uno de los primeros en proponer que la indizaci&oacute;n deber&iacute;a ser justificada por los propios documentos, en otras palabras, que la indizaci&oacute;n deber&iacute;a tener una "garant&iacute;a literaria". Esta garant&iacute;a literaria significa que el vocabulario de los documentos indexados deber&iacute;a ser aceptado como descriptor o t&eacute;rmino preferido en los tesauros, ya que &eacute;stos est&aacute;n garantizados por su uso real en los propios documentos. El m&eacute;todo m&aacute;s simple de identificar los descriptores ser&iacute;a contar el n&uacute;mero de veces que una palabra ocurre en un determinado documento, por esa raz&oacute;n los primeros experimentos volvieron los ojos hacia la ley de Zipf para crear una lista de palabras en orden descendiente de ocurrencias en un texto suficientemente extenso. El propio Luhn (1958) suger&iacute;a que el vocabulario existente en un documento deber&iacute;a constituirse en la base para el an&aacute;lisis de su contenido, pues &eacute;sa ser&iacute;a la mejor manera de recuperarlo. La justificaci&oacute;n para medir la significancia de las palabras por su frecuencia de uso se basaba en el hecho de que "un escritor normalmente repite ciertas palabras a medida que avanza o var&iacute;a sus argumentos conforme profundiza en alg&uacute;n aspecto de su asunto. Este &eacute;nfasis se toma como un indicador de su importancia. Cuanto m&aacute;s frecuentemente se encuentran las palabras en la compa&ntilde;&iacute;a de otras en una oraci&oacute;n, se le puede atribuir mayor significancia a cada una de esas palabras. A pesar de que ciertas palabras deben estar presentes para servir a la importante funci&oacute;n de vinculaci&oacute;n entre esas palabras, el tipo de significancia buscada en este caso no reside en esas palabras " &#91;...&#93; comunes que pueden ser separadas sustancialmente por m&eacute;todos no&#45;intelectuales y ser excluidas" (Luhn, 1958:160). Para el propio autor</font></p>  	    ]]></body>
<body><![CDATA[<blockquote> 		    <p align="justify"><font face="verdana" size="2">existe una probabilidad muy peque&ntilde;a de que una determinada palabra sea usada para reflejar m&aacute;s de un concepto. Tambi&eacute;n la probabilidad de que un autor use diferentes palabras para reflejar el mismo concepto es peque&ntilde;a. Incluso si el autor, por razones estil&iacute;sticas, hace un esfuerzo razonable para seleccionar sin&oacute;nimos, pronto se queda sin alternativas leg&iacute;timas y cae en la repetici&oacute;n si la idea que buscaba est&aacute; siendo cabalmente expresada (Luhn, 1958:160).</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Para ser m&aacute;s claro en su propuesta, Luhn (1958:161) ofrece la siguiente <i><a href="/img/revistas/ib/v25n54/a4f1.jpg" target="_blank">Figura 1</a>.</i></font></p>  	    <p align="justify"><font face="verdana" size="2">En esta figura la presencia de muchas palabras en la regi&oacute;n de m&aacute;s alta frecuencia (a la izquierda de C) tipificadas como "comunes" constituyen "ruido" en el sistema. Este ruido puede ser reducido por una t&eacute;cnica de eliminaci&oacute;n a trav&eacute;s de la cual las palabras "comunes" del texto se comparan con una lista de palabras sin significancia (stop&#45;words). Tambi&eacute;n por m&eacute;todos estad&iacute;sticos se podr&iacute;a establecer un punto de corte de las palabras de alta frecuencia para establecer un "l&iacute;mite de confianza". Si en la <a href="/img/revistas/ib/v25n54/a4f1.jpg" target="_blank">Figura 1</a> la l&iacute;nea C representa ese punto de corte, s&oacute;lo las palabras del lado derecho tendr&iacute;an significado. Como el criterio de corte es la frecuencia de ocurrencia de las palabras se podr&iacute;a establecer la l&iacute;nea D como l&iacute;mite inferior. Entonces las palabras agrupadas entre las l&iacute;neas C y D (la parte sombreada) contendr&iacute;an las palabras m&aacute;s significativas. En otras palabras, un punto medio de transici&oacute;n entre las palabras de alta y baja frecuencia de ocurrencia en un texto.</font></p>  	    <p align="justify"><font face="verdana" size="2">Siguiendo esa propuesta, Maia (1973) aplic&oacute; la ley de Zipf y el punto de transici&oacute;n de Goffman a tres art&iacute;culos en el campo de la bibliograf&iacute;a de autores reconocidos publicados en portugu&eacute;s en revistas brasileras. Para el an&aacute;lisis seleccion&oacute; las palabras compuestas, los nombres de instituciones y los establecimientos p&uacute;blicos, los t&iacute;tulos de publicaciones y los nombres de las conferencias. No incluy&oacute; en su an&aacute;lisis fechas e indicaciones num&eacute;ricas de tiempo y denomin&oacute; los art&iacute;culos como Texto A, Texto B y Texto C. Para el art&iacute;culo A encontr&oacute; 6,395 palabras de las cuales 1,791 eran diferentes; para el art&iacute;culo B encontr&oacute; 2,210 y de ellas 839 eran diferentes; y para el art&iacute;culo C encontr&oacute; 1,290 palabras 535 las cuales eran diferentes. Los resultados que obtuvo con la aplicaci&oacute;n del punto de transici&oacute;n de Goffman fueron: 2, 1.5 y 7 para los textos A, B y C respectivamente. Maia concluye afirmando que la ley de Zipf es v&aacute;lida para la lengua portuguesa, mientras que el punto de transici&oacute;n de Goffman para la lengua portuguesa tiene que sufrir una transformaci&oacute;n y adecuaci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">Ribeiro (1974) estudi&oacute; una muestra de 10,093 unidades de editoriales extra&iacute;das del lenguaje period&iacute;stico que cubr&iacute;an el campo de la pol&iacute;tica, las artes, los deportes, etc. del peri&oacute;dico <i>Jornal do Brasil</i> publicada en el periodo de 1959&#45;1973 en portugu&eacute;s. Como se supuso que el discurso variar&iacute;a con el correr del tiempo, se juzg&oacute; conveniente analizarlo en tres periodos m&aacute;s cortos: 1953&#45;1963, 1964&#45;1968, 1969&#45;1973. Se encontr&oacute; que las palabras clave variaban de acuerdo al el periodo examinado, lo que permiti&oacute; la caracterizaci&oacute;n de acuerdo con los criterios en cuesti&oacute;n. En el primer periodo examinado (1959&#45;1963) se obtuvieron palabras clave como <i>Pol&iacute;tica, Presidente, Brasil.</i> En el segundo periodo (1964&#45;1968) la informaci&oacute;n m&aacute;s importante en comparaci&oacute;n con el per&iacute;odo anterior, fue la aparici&oacute;n de la palabra clave Nacional, que antes no figuraba entre las unidades ling&uuml;&iacute;sticas m&aacute;s frecuentes. Las palabras clave fueron: <i>Gobierno, Inflaci&oacute;n, Nacional</i> y a trav&eacute;s de esa tr&iacute;ada se esboz&oacute; la situaci&oacute;n brasile&ntilde;a de la &eacute;poca, sus preocupaciones y directrices de pol&iacute;ticas: la discusi&oacute;n del problema inflacionario, el culto a lo nacional y la revalorizaci&oacute;n del gobierno del pa&iacute;s. En el tercer periodo (1969&#45;1973) se produjo la desaparici&oacute;n de la palabra <i>Nacional</i> y el aumento de frecuencia de la palabra <i>Inflaci&oacute;n.</i> Estos resultados configuran un examen ideol&oacute;gico del discurso y las variaciones de este discurso durante un periodo de catorce a&ntilde;os. Es dentro de ese marco ideol&oacute;gico como el periodismo brasile&ntilde;o analiza la inflaci&oacute;n, y reafirma y reitera el nacionalismo brasile&ntilde;o.</font></p>  	    <p align="justify"><font face="verdana" size="2">Boyce (1975) analiz&oacute; la efectividad de tres lenguajes de indizaci&oacute;n autom&aacute;tica y sus procedimientos en el &aacute;rea de arritmias card&iacute;acas en textos escritos en ingl&eacute;s. El procedimiento comenz&oacute; con el conteo de las palabras del texto completo de cada documento que orden&oacute; en una lista por el rango de frecuencias de ocurrencia de las palabras en diecinueve documentos que trataban del tema de las arritmias card&iacute;acas, y a &eacute;stas aplic&oacute; el punto de transici&oacute;n de Goffman. La relevancia de los &iacute;ndices la llev&oacute; a cabo un estudiante de medicina del cuarto a&ntilde;o, quien ley&oacute; los diecinueve documentos. Despu&eacute;s de recuperar los documentos midi&oacute; la sensitividad, especificidad y efectividad de ellos y los resultados indicaron que</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">la indizaci&oacute;n autom&aacute;tica basada en la frecuencia de ocurrencia de las palabras en los textos ofrec&iacute;a una potencial utilidad alternativa para la asignaci&oacute;n manual de t&eacute;rminos de indizaci&oacute;n de vocabularios pre&#45;construidos, en especial para la literatura de medicina (Boyce, 1975:384)</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Pao (1977, 1978) partiendo de la ley de Zipf, analiz&oacute; lo que se llama el <i>punto de transici&oacute;n</i> de Goffman para identificar las palabras clave en dos art&iacute;culos en ingl&eacute;s. El primer art&iacute;culo fue <i>On the Geometry of Libraries</i> de A. D. Booth, en el cual encontr&oacute; 559 palabras diferentes y el n&uacute;mero de palabras que ocurrieron una sola vez fue de 256 palabras. Usando el punto de transici&oacute;n de Goffman se logr&oacute; identificar las palabras m&aacute;s significativas para indizar este texto. El segundo art&iacute;culo fue <i>A Law of Ocurrences of Words of Low Frequency</i> de A. D. Booth y encontr&oacute; 327 palabras diferentes 188 de las cuales aparecieron una sola vez. Nuevamente aplicando el punto de transici&oacute;n de Goffman se identificaron las palabras clave que representan este texto. La autora sugiere que la aplicaci&oacute;n de esta ley permite extraer las palabras clave de un texto con la ayuda de la normalizaci&oacute;n, lo cual contribuir&iacute;a a mejorar la recuperaci&oacute;n de la informaci&oacute;n automatizada.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Basilio; Braga y Carvalho (1979) estudiaron dos textos en portugu&eacute;s, uno de ling&uuml;&iacute;stica y otro de procesos de automatizaci&oacute;n en la Biblioteca Nacional del Brasil. A las palabras ordenadas por frecuencias descendientes se les aplic&oacute; el punto de transici&oacute;n de Goffman y los resultados mostraron la plausibilidad del punto de transici&oacute;n de Goffman, y confirmaron que la constante 1 es v&aacute;lida para los textos en lengua portuguesa. Mamfrim (1991) buscando verificar la posibilidad de una indizaci&oacute;n derivativa a partir de textos integrales analiz&oacute;, mediante el punto de transici&oacute;n de Goffman diez art&iacute;culos sobre "bibliometr&iacute;a" publicados en lengua portuguesa en el Brasil. Observ&oacute; que a pesar de variaciones en la longitud de los textos, el 60% del total de palabras en cada texto correspond&iacute;a a palabras distintas en los textos. Tambi&eacute;n el total de las palabras distintas correspond&iacute;a al 30% del total de palabras existentes en los textos. En todos los textos analizados el punto de transici&oacute;n funcion&oacute; adecuadamente concentrando un conjunto de palabras claves que suger&iacute;an el contenido de los documentos. Goffman concluye considerando que</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">a trav&eacute;s de la frecuencia con la cual las palabras aparecen en los documentos, se puede vislumbrar el propio vocabulario de un asunto, lo que puede ser de gran ayuda en la construcci&oacute;n de vocabularios especializados, tesauros, identificaci&oacute;n e incorporaci&oacute;n de nuevos t&eacute;rminos en una disciplina (Mamfrim, 1991:198).</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Guedes (1994) partiendo de la premisa de que la frecuencia de ocurrencia de las palabras en un texto mide la significancia de las palabras en ese texto, realiza un estudio en el campo de mec&aacute;nica de suelos. Seleccion&oacute; once notas t&eacute;cnicas, una literatura de discusi&oacute;n sobre el asunto y un art&iacute;culo, haciendo un total de 13 documentos analizados y escritos en portugu&eacute;s. A la frecuencia ordenada de la ocurrencia de palabras le aplic&oacute; luego el punto de transici&oacute;n de Goffman verificando que la regi&oacute;n identificada incluyera las frecuencias que correspond&iacute;an a las palabras de mayor contenido sem&aacute;ntico. Esas palabras identificadas fueron despu&eacute;s comparadas con las palabras claves seleccionadas por un indizador especialista en mec&aacute;nica de suelos, y se verific&oacute; la correspondencia entre ambos m&eacute;todos de indizaci&oacute;n (manual y automatizado).</font></p>  	    <p align="justify"><font face="verdana" size="2">Quoniam, Balme, Giraud y Dou (1998) aplicaron la ley de Zipf para identificar las palabras clave de 4,703 documentos extra&iacute;dos de la base de datos Pascal en el periodo de 1993 a julio de 1995 sobre la producci&oacute;n cient&iacute;fica de Marseille (Francia). Posteriormente las palabras clave seleccionadas con la ley de Zipf fueron clasificadas en 8 zonas, con el fin de generar consultas que permitieran extraer los t&eacute;rminos que representan el contenido de un documento.</font></p>  	    <p align="justify"><font face="verdana" size="2">Santos (2009) aplic&oacute; la ley de Zipf y el punto de transici&oacute;n de Goffman a los res&uacute;menes de 100 cartas del archivo de Bertha Mar&iacute;a Julia Lutz (18941976) escritos en portugu&eacute;s, con el fin de identificar las palabras que ten&iacute;an con un alto contenido sem&aacute;ntico. Encontr&oacute; 1,902 palabras, de las cuales 618 son palabras diferentes y 406 palabras que s&oacute;lo aparecen una vez. La autora afirma que se alcanz&oacute; el objetivo principal de la investigaci&oacute;n, ya que los resultados de la investigaci&oacute;n apuntan a una zona de concentraci&oacute;n de alto contenido sem&aacute;ntico que puede ser utilizado en la indizaci&oacute;n tem&aacute;tica de la correspondencia de la investigadora estudiada. Lapa y Corr&ecirc;a (2010) aplicaron la ley de Zipf y el punto de transici&oacute;n de Goffman a los res&uacute;menes de las tesis escritos en portugu&eacute;s en la Universidad Federal de Para&iacute;ba en Brasil, con el fin de seleccionar los t&eacute;rminos relevantes para mejorar la recuperaci&oacute;n en la biblioteca digital que almacena estas tesis. Para hacer esta selecci&oacute;n usaron un software de fuente abierta que les permiti&oacute; obtener el listado de palabras generadas a partir de los res&uacute;menes de las tesis. A esta lista de palabras le aplicaron la ley de Zipf y el punto de transici&oacute;n de Goffman. Aunque no detallan los resultados obtenidos con las ecuaciones, concluyeron que la aplicaci&oacute;n de estas f&oacute;rmulas mostr&oacute; un resultado satisfactorio en relaci&oacute;n con la precisi&oacute;n y la exhaustividad para mejorar la recuperaci&oacute;n de la informaci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">Como se puede observar por la literatura revisada, la ley de Zipf y el punto de transici&oacute;n de Goffman parecen producir buenos resultados en la identificaci&oacute;n de palabras con alto valor sem&aacute;ntico en el contenido tem&aacute;tico de un texto y posibilitan usar estos t&eacute;rminos como palabras clave para la recuperaci&oacute;n de la informaci&oacute;n en bases de datos y cat&aacute;logos de sistemas de informaci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>METODOLOG&Iacute;A</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Como unidades de an&aacute;lisis se tomaron las palabras que aparecieron en el art&iacute;culo <i>An&aacute;lisis cariot&iacute;pico de Capcicum pubescens (Solanaceae)</i> "rocoto" publicado por Guevara, Ciles y Bracamonte (2000). Para asegurar la homogeneidad en el conteo de las palabras se adoptaron las siguientes convenciones:</font></p>  	    ]]></body>
<body><![CDATA[<blockquote> 		    <p align="justify"><font face="verdana" size="2">&bull; Una palabra es considerada como una serie de caracteres tipogr&aacute;ficos precedida y seguida de espacios en blanco en el texto;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Las palabras unidas por gui&oacute;n fueron tratadas como una sola palabra;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Las palabras que expresaron formas singulares o plurales fueron contadas como una sola;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Las palabras fon&eacute;ticamente diferentes fueron contadas como diferentes;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Se omitieron los nombres de autores y nombres de instituciones, por ejemplo, Universidad Nacional Agraria La Molina (UNALM), Lima, Per&uacute;;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Se retiraron del texto n&uacute;meros, f&oacute;rmulas y fechas, por ejemplo, 1964; 2,3 cm; 10 am;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Algunas abreviaciones fueron completadas, por ejemplo, C. por Capsicum;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Se retiraron abreviaciones como HCI; HCl 5N; DNA;</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; Se retir&oacute; el nombre de los autores citados en el texto,</font></p>  		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&bull; Se eliminaron las referencias num&eacute;ricas incluidas en la bibliograf&iacute;a citada, por ejemplo, (Darlington &amp; La Cour, 1969).</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Para identificar las palabras clave se us&oacute; el punto de transici&oacute;n de Goffman. La derivaci&oacute;n y formulaci&oacute;n matem&aacute;tica de esta ecuaci&oacute;n puede ser consultada en el trabajo de Boyce (1975), Pao (1977, 1978) y Urbizag&aacute;stegui Alvarado (1999). Aqu&iacute; solamente se ofrece la ecuaci&oacute;n ya derivada y expresada como:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/ib/v25n54/a4e1.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Para el conteo de palabras se us&oacute; el software Hermetic Word Frequency Counter, el cual explora archivos en formato texto ANSI, XML y HTML, pero no reconoce los archivos con extensi&oacute;n .doc. Este software cuenta el n&uacute;mero de ocurrencias de las palabras en un texto y las organiza alfab&eacute;ticamente o por frecuencias. Tambi&eacute;n cuenta frases ordenadas alfab&eacute;ticamente o por frecuencias, de acuerdo con el rango y frecuencia con las que aparecen en el texto.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resultados</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Se encontr&oacute; un total de 1,644 palabras en el texto, pero s&oacute;lo estaban presentes 609 palabras diferentes. Esas palabras listadas de acuerdo con el orden de frecuencia descendente aparecen en la <i><a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t1" target="_blank">Tabla N&uacute;m. 1</a></i> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver <i>Anexos</i></a><i>),</i> donde se muestran las palabras ordenadas desde la primera palabra con 102 ocurrencias, hasta las &uacute;ltimas con s&oacute;lo 1 ocurrencia al final de la lista, para hacer un total de 409 palabras &uacute;nicas. Es evidente que las palabras funcionales (art&iacute;culos, adjetivos, adverbios, preposiciones y conjunciones) son las m&aacute;s frecuentes en el texto y se situaron en el tope de la escala. Tambi&eacute;n es obvio que algunas palabras de gran significado sem&aacute;ntico para el texto est&aacute;n situadas entre o siguiendo a las palabras funcionales. Precisamente se afirma que la ley de Zipf est&aacute; asociada a la identificaci&oacute;n de grupos en los extremos de una lista de rangos de palabras. El primer grupo de las palabras de alta frecuencia y con poco significado sem&aacute;ntico se agrupan en el tope de la lista, y el segundo grupo de palabras de uso menos frecuente se agrupa al final de la lista. Frente a esta situaci&oacute;n Goffman introduce la idea de que las palabras m&aacute;s significativas de un texto se agrupar&iacute;an en una zona donde se encuentran las palabras de alta frecuencia con las de baja frecuencia; es decir, un punto intermedio de transici&oacute;n. Aplicando la ecuaci&oacute;n del punto de transici&oacute;n de Goffman se obtuvo n = 28,11, lo que significa que el punto de transici&oacute;n se ubica entre las palabras que ocurrieron 28 veces, &eacute;sta es la palabra las. No obstante, al rededor de esta palabra ocurren otras palabras como <i>cromosoma</i> y <i>capsicum,</i> las cuales son m&aacute;s apropiadas para representar el contenido del texto, en otras palabras, <i>cromosoma</i> y <i>capsicum</i> ser&iacute;an las palabras clave identificadas en este caso.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para explorar si la eliminaci&oacute;n de las palabras funcionales mostradas en la <i><a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t1" target="_blank">Tabla N&uacute;m. 1</a></i> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver <i>Anexos</i></a>) ayudan a identificar las palabras clave con mayor precisi&oacute;n se elabor&oacute; la <a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t2" target="_blank">Tabla N&uacute;m. 2</a> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver Anexos</a>). Nuevamente el valor del punto de transici&oacute;n fue de 28,11, es decir, que las palabras de mayor significaci&oacute;n sem&aacute;ntica se ubican entre aquellas que ocurren 28 veces en esta tabla, en la cual se identificaron las palabras <i>cromosomas, capsicum, bandas</i> y <i>pubescens.</i> Estas palabras deber&iacute;an ser elegidas como palabras clave.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para explorar si ocurrir&iacute;an cambios en la identificaci&oacute;n de las palabras clave, en la <i><a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t3" target="_blank">Tabla N&uacute;m. 3</a></i> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver <i>Anexos</i></a>) se lematizaron las palabras del texto; en otras palabras, se redujeron o agruparon las diferentes formas flexivas o variaciones morfol&oacute;gicas de una palabra a la forma can&oacute;nica que se selecciona como lema o entrada o palabra clave. Aplic&aacute;ndose el punto de transici&oacute;n se obtuvo que n = 21,64, aproximadamente 22 palabras. Las palabras m&aacute;s significativas ocurren alrededor de aquellas palabras que tienen 22 ocurrencias en la <i><a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t3" target="_blank">Tabla N&uacute;m. 3</a></i> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver <i>Anexos</i></a>). &Eacute;stas fueron las palabras <i>banda, bandas</i> y <i>bandeo.</i> Por lo tanto, las palabras m&aacute;s significativas deben ocurrir alrededor de estas tres palabras y estas fueron identificadas como las palabras <i>cromosoma, cromosomas, cromos&oacute;mica, cromos&oacute;micas, cromos&oacute;mico</i> y <i>capsicum.</i> De este resultado las palabras clave seleccionadas ser&iacute;an <i>cromosoma, banda</i> y <i>capsicum.</i></font></p>  	    <p align="justify"><font face="verdana" size="2">Para experimentar el efecto que puede tener la eliminaci&oacute;n de las palabras funcionales mostradas en la <a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t3" target="_blank">Tabla No. 3</a> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver anexos</a>) se elabor&oacute; la <a href="/img/revistas/ib/v25n54/html/a4anexos.htm#t4" target="_blank">Tabla N&uacute;m. 4</a> (<a href="/img/revistas/ib/v25n54/html/a4anexos.htm" target="_blank">Ver anexos</a>). Como se puede observar en esa tabla, las 3 primeras palabras coinciden con los resultados obtenidos en los 3 experimentos anteriores. Por lo tanto las palabras que identifican el contenido del art&iacute;culo y que podr&iacute;an ser seleccionadas como palabras clave, son <i>cromosomas, capsicum, banda</i> y <i>pubescens.</i></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Conclusiones</b></font></p>  	    <p align="justify"><font face="verdana" size="2">La ley de Zipf a trav&eacute;s de la aplicaci&oacute;n del punto de transici&oacute;n de Goffman, de acuerdo con los resultados obtenidos en este trabajo facilita la identificaci&oacute;n de las palabras clave de un documento o un conjunto de documentos. La eficiencia de este modelo se refleja en la lista de palabras lematizadas, de la cual se obtuvieron varias palabras que podr&iacute;an ser utilizadas para hacer la indizaci&oacute;n del documento estudiado. &Eacute;stas son las palabras <i>cromosomas, capsicum, banda</i> y <i>pubescens</i> que facilitar&iacute;an la recuperaci&oacute;n de informaci&oacute;n en bases de datos bibliogr&aacute;ficas en espa&ntilde;ol. Asimismo, los datos que se obtuvieron en este trabajo corroboran la explicaci&oacute;n de Zipf sobre las altas ocurrencias de palabras funcionales, ya que en este caso la palabra con el mayor n&uacute;mero de ocurrencias fue el art&iacute;culo "las". Esto confirma lo manifestado por la teor&iacute;a del m&iacute;nimo esfuerzo, la cual sostiene que los seres humanos tendemos a minimizar el esfuerzo, en otras palabras, preferimos el uso de las palabras m&aacute;s conocidas y m&aacute;s f&aacute;ciles de pronunciar sobre las menos conocidas.</font></p>  	    <p align="justify"><font face="verdana" size="2">En el campo de la ciencia de la informaci&oacute;n y la bibliotecolog&iacute;a se deber&iacute;an seguir explorando las posibilidades del uso de la ley de Zipf y el punto de transici&oacute;n de Goffman en la indizaci&oacute;n autom&aacute;tica. De esta manera evitar&iacute;amos el llamado de atenci&oacute;n hecho por Braga (1996) acerca de que la ley de Zipf es una de las m&aacute;s conocidas y, curiosamente, de menor aplicaci&oacute;n pr&aacute;ctica en sistemas de informaci&oacute;n. Ella afirma que lo correcto ser&iacute;a hablar de dos leyes de la ley de Zipf: la de alta frecuencia y la de baja frecuencia. Ambas leyes tal como son enunciadas, son meras "curiosidades" para los sistemas de recuperaci&oacute;n de la informaci&oacute;n ya que es casi nula su aplicaci&oacute;n pr&aacute;ctica en los problemas que enfrentan los sistemas de recuperaci&oacute;n de la informaci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Bibliograf&iacute;a</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Bail&oacute;n&#45;Moreno, R.; Jurado&#45;Almeda, E.; Ruiz&#45;Ba&ntilde;os, R. y Courtial, J. P., "Bibliometric laws: empirical flaws of fit", en <i>Scientometrics,</i> 63(2):209&#45;229, 2005.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483447&pid=S0187-358X201100020000400001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Basilio, Margarida Maria de Paula; Braga, Lilian Maria; Pierotti y Maria de Lourdes Carvalho, "Estrutura de textos cient&iacute;ficos em l&iacute;ngua portuguesa: estudo bibliom&eacute;trico&#45;lingu&iacute;stico", en <i>Reuni&atilde;o Brasileira de Ci&ecirc;ncia da Informa&ccedil;&atilde;o</i> (2. : 1979 : Rio de Janeiro), &#91;trabalhos apresentados&#93;, R&iacute;o de Janeiro: IBICT, 1979.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483449&pid=S0187-358X201100020000400002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Benguigui, L. y Blumenfeld&#45;Lieberthal, E., <i>The temporal evolution of the city size distribution. Physica A: Statistical Mechanics and Its Applications,</i> 388(7):1187&#45;1195, 2009.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483451&pid=S0187-358X201100020000400003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Black, D. y Henderson, V., "Urban evolution in the USA", en <i>Journal of Economic Geography,</i> 3 (4):343&#45;372, 2003.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483453&pid=S0187-358X201100020000400004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Bornbergbauer, E., "How are model protein structures distributed in sequence space?", en <i>Biophysical Journal,</i> 73(5):2393&#45;2403, 1997.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483455&pid=S0187-358X201100020000400005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Boyce, Bert, "Automatic and manual indexing performance in a small file of medical literature", en <i>Bulletin of the Medical Library Association,</i> 63(4):378&#45;385, 1975.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483457&pid=S0187-358X201100020000400006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Braga, Gilda Maria, "A representa&ccedil;&atilde;o da informa&ccedil;&atilde;o na descontru&ccedil;&atilde;o do contexto", <i>Informare: Cadernos do Programa de P&oacute;s&#45;Gradua&ccedil;&atilde;o em Ciencia da Informa&ccedil;&atilde;o,</i> 2(2):53&#45;57, 1996.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483459&pid=S0187-358X201100020000400007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Bruzinga, Graciane Silva; Maculan, Benildes Coura Moreira dos Santos y Lima, Gercina &Acirc;ngela Bor&eacute;m de Oliveira. "Indexa&ccedil;&atilde;o autom&aacute;tica e sem&acirc;ntica: estudo da an&aacute;lise do conte&uacute;do de teses e disserta&ccedil;&ouml;es", en <i>VIIIENANCIB</i> <i>&#45; Encontro Nacional de Pesquisa em Ci&ecirc;ncia da Informa&ccedil;&atilde;o,</i> 28 a 31 de outubro de 2007, Salvador, Bahia, Brasil.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483461&pid=S0187-358X201100020000400008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font>	</p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Condon, E. U. ,"Statistics of vocabulary", en <i>Science,</i> 68:1733, 1928.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483463&pid=S0187-358X201100020000400009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Cordoba, J. C., "On the distribution of city sizes", <i>Journal of Urban Economics,</i> 63(1):177&#45;197, 2008.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483465&pid=S0187-358X201100020000400010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Erar, Aydin, "Bibliometrics or informetrics: displaying regularity in scientific patterns by using statistical distributions", en <i>Hacettepe Journal of Mathematics and Statistics,</i> 31:113&#45;125, 2002.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483467&pid=S0187-358X201100020000400011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Estoup, J. B., <i>Gammes st&eacute;nographique,</i> Par&iacute;s, Institut St&eacute;nographique, 1916.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483469&pid=S0187-358X201100020000400012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2"><i>&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;</i>, <i>Gammes st&eacute;nographiques: recueil de textes choisis pour</i> <i>l'acquisition m&eacute;thodique de la vitesse, pr&eacute;c&eacute;d&eacute; d'une introduction,</i> Par&iacute;s: Institut St&eacute;nographique, 1908.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483471&pid=S0187-358X201100020000400013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Guedes, V&acirc;nia Lisb&ouml;a da Silveira, "Estudo de um crit&eacute;rio para indexa&ccedil;&atilde;o autom&aacute;tica derivativa de textos cient&iacute;ficos e tecnol&oacute;gicos", en <i>Ciencia da Informa&ccedil;&atilde;o,</i> 23(3):318&#45;326, 1994.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483473&pid=S0187-358X201100020000400014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Guevara, Misael; Ciles, Mar&iacute;a y Bracamonte, Olga, "An&aacute;lisis cariot&iacute;pico de Capsicum pubescens (Solanaceae) 'rocoto' ", en <i>Revista Peruana de Biolog&iacute;a,</i> 7(2):1&#45;10, 2000.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483475&pid=S0187-358X201100020000400015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Huang, S. M.; Yen, D. C.; Yang, L. W.; Hua, J. S., "An Investigation of Zipf's law for fraud detection", en <i>Decision Support Systems,</i> 46(1):70&#45;83, 2008.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483477&pid=S0187-358X201100020000400016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Jim&eacute;nez Salazar, H&eacute;ctor; Pinto, David y Rosso, Paolo, "Uso del punto de transici&oacute;n en la selecci&oacute;n de t&eacute;rminos &iacute;ndice para agrupamiento de textos cortos", en <i>Procesamiento del Lenguaje Natural,</i> 35:383&#45;390, 2005.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483479&pid=S0187-358X201100020000400017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Lapa, Remi Correia y Corr&ecirc;a, Renato Fernandes, "Sele&ccedil;&atilde;o de descritores para a indexa&ccedil;&atilde;o autom&aacute;tica de teses e disserta&ccedil;&ouml;es da UFPE", en Encontro Nacional de Estudantes de Biblioteconomia, <i>Documenta&ccedil;&atilde;o, Gest&atilde;o, e Ci&ecirc;ncia da Informa&ccedil;&atilde;o Os desafios do profissional da informa&ccedil;&atilde;o frente &agrave;s tecnologias e suportes informacionais do s&eacute;culo</i> <i>XXI:</i> <i>lugares de mem&oacute;ria para a biblioteconomia 18 a 24 de julho de 2010,</i> Brasil: Universidade Federal da Para&iacute;ba.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483481&pid=S0187-358X201100020000400018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Luhn, Hans Peter, "A statistical approach to mechanized encoding and searching of literary information", en <i>IBM</i> <i>Journal of Research and Development,</i> 1(4):309&#45;317, 1957.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483483&pid=S0187-358X201100020000400019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;, "The automatic creation of literature abstracts", en <i>IBM</i> <i>Journal of Research and Development,</i> 2(2): 157&#45;165, 1958.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483485&pid=S0187-358X201100020000400020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Ma, Y. G. Moment analysis and Zipf law, <i>The European Physical Jour</i>nal, 30:227&#45;242, 2006, disponible en: &lt;<a href="http://cyclotron.tamu.edu/wci3/newer/chapV_5.pdf" target="_blank">http://cyclotron.tamu.edu/wci3/newer/chapV_5.pdf</a>&gt;. acceso el 30 de septiembre de 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483487&pid=S0187-358X201100020000400021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Maia, Elza Lima e Silva, "Comportamento bibliom&eacute;trico da l&iacute;ngua portuguesa, como ve&iacute;culo de representa&ccedil;&atilde;o da informa&ccedil;&atilde;o", en <i>Ci&ecirc;ncia da Informa&ccedil;&atilde;o,</i> 2(2):99&#45;138, 1973.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483489&pid=S0187-358X201100020000400022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Mamfrim, Flavia Pereira Braga, "Representa&ccedil;&atilde;o de conte&uacute;do via indexa&ccedil;&atilde;o autom&aacute;tica em textos integrais de l&iacute;ngua portuguesa", en <i>Ci&ecirc;ncia da Informa&ccedil;&atilde;o,</i> 20(2):191&#45;203, 1991.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483491&pid=S0187-358X201100020000400023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Moreiro Gonz&aacute;lez, Jos&eacute; Antonio, "Aplicaciones al an&aacute;lisis autom&aacute;tico del contenido provenientes de la teor&iacute;a matem&aacute;tica de la informaci&oacute;n", en <i>Anales de Documentaci&oacute;n,</i> 5:273&#45;286, 2002.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483493&pid=S0187-358X201100020000400024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Nabeshima, Terutaka y Ukio&#45;Pegio, Gungi, "Zipf's law in phonograms and Weibull distribution in ideograms: comparison of English with Japanese", en <i>BioSystems,</i> 73:131&#45;139, 2004.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483495&pid=S0187-358X201100020000400025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Pao, Miranda Lee, "Automatic indexing based on Goffman's transition of word occurrences", en <i>American Society for Information Science,</i> Meeting (40th : 1977 : Chicago, Ill.); <i>Information management in the 1980's : proceedings of the</i> <i>ASIS</i> <i>annual meeting 1977,</i> Volume 14 : 40th annual meeting, Chicago, Illinois, September 26&#45;October 1, 1977; y Bernard M. Fry, compiler, Clayton A. White Plains, N.Y. <i>Knowledge Industry Publications for American Society for Information Science,</i> c1977, traducido por Rub&eacute;n Urbizag&aacute;stegui Alvarado.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483497&pid=S0187-358X201100020000400026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;, "Automatic text analysis based on Transition Phenomena of word occurrences", en <i>Journal of the American Society for Information Science,</i> 29(3):121&#45;124, 1978.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483499&pid=S0187-358X201100020000400027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Quoniam, L.; Balme, F.; Rostamg, H.; Giraud, E. y Dou, J. M., "Bibliometric law used for information retrieval", en <i>Scientometrics,</i> 41(1&#45;2):83&#45;91, 1998.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483501&pid=S0187-358X201100020000400028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Ribeiro, Lais A., "Aplica&ccedil;&atilde;o dos m&eacute;todos estat&iacute;sticos e da teoria da informa&ccedil;&atilde;o e da Comunica&ccedil;&atilde;o na an&aacute;lise ling&uuml;&iacute;stica: estudo da linguagem jornal&iacute;stica", en <i>Ci&ecirc;ncia da informa&ccedil;&atilde;o,</i> 3(2):151&#45;154, 1974.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483503&pid=S0187-358X201100020000400029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Santos, Mar&iacute;a Jos&eacute; V. C., Correspond&ecirc;ncia cient&iacute;fica de Bertha Lutz: um estudo de aplica&ccedil;&atilde;o da lei de Zipf e ponto de transi&ccedil;&atilde;o de Goffman em um arquivo pessoal, Ponto de Acesso, Salvador, 3(3):317&#45;326, 2009.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483505&pid=S0187-358X201100020000400030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Urbizag&aacute;stegui Alvarado, Rub&eacute;n, "Las posibilidades de la ley de zipf en la indizaci&oacute;n autom&aacute;tica", en <i>B3:</i> <i>Ciencias de la Informaci&oacute;n,</i> &#91;1999?&#93;, disponible en: <a href="http://b3.bibliotecologia.cl/ruben2.htm" target="_blank">http://b3.bibliotecologia.cl/ruben2.htm</a>, acceso en: 20 de septiembre de 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483507&pid=S0187-358X201100020000400031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;, "Martina Portocarrero: un acercamiento a trav&eacute;s de la ley de Zipf", en <i>III</i> <i>Encuentro Internacional de Invierno,</i> ECI2004, &#91;Lima&#93;, ECI, 2004, disponible en: &lt;<a href="http://www.encuentrocientificointernacional.org/eci2004i/libroderesumenes.pdf" target="_blank">http://www.encuentrocientificointernacional.org/eci2004i/libroderesumenes.pdf</a>&gt;, acceso 3 de enero de 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483509&pid=S0187-358X201100020000400032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Vigotsky, L., <i>Pensamiento y Lenguaje,</i> Obras Escogidas, T II. Madrid: Visor, 1988.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483511&pid=S0187-358X201100020000400033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Wyllys, Ronald E., "Empirical and theoretical bases of Zipf's law", en <i>Library Trends,</i> 30(1):53&#45;64, 1981.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483513&pid=S0187-358X201100020000400034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Wyt, Gerrit de, "Zipf's law in economics", <i>SCALES&#45;Paper</i> N200503, 2005, disponible en: <a href="http://www.ondernemerschap.nl/pdf-ez/N200503.pdf" target="_blank">http://www.ondernemerschap.nl/pdf&#45;ez/N200503.pdf</a>, acceso en: 28 de septiembre de 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483515&pid=S0187-358X201100020000400035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Zipf, George Kingsley, <i>Human behaviour and the principle of least effort,</i> Cambridge, Mass, Adisson&#45;Wesley Press, 1949.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483517&pid=S0187-358X201100020000400036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;, <i>The psycho&#45;biology of language,</i> Boston: Houghton Company, 1935.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483519&pid=S0187-358X201100020000400037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2"><i>&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;&#45;</i>, <i>Selected studies of the principle of relative Frequency in language,</i> Cambridge, Mass, Harvard University Press, 1932.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4483521&pid=S0187-358X201100020000400038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Informaci&oacute;n sobre los autores</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><a name="n0a"></a><a href="#n0b">*</a>Rub&eacute;n Urbizag&aacute;stegui Alvarado</i></font></p>  	    <p align="justify"><font face="verdana" size="2">Centro Universitario de Investigaciones Bibliotecol&oacute;gicas de la UNAM. Torre II de Humanidades, Piso 12, Circuito Interior, Cd. Universitaria, Col. Copilco Universidad, Delg. Coyoac&aacute;n, C.P.: 04510, M&eacute;xico, D.F., Tel: 562 30344. E&#45;mail: <a href="mailto:rmfe@servidor.unam.mx">rmfe@servidor.unam.mx</a></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><a name="n00a"></a><a href="#n00b">**</a>Cristina Restrepo Arango</i></font></p>  	    <p align="justify"><font face="verdana" size="2">Biblioteca Daniel Cos&iacute;o Villegas, El Colegio de M&eacute;xico, M&eacute;xico D.F. E&#45;mail: <a href="mailto:Irestrepo@colemex.mx">Irestrepo@colemex.mx</a></font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bailón-Moreno]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Jurado-Almeda]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Ruiz-Baños]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Courtial]]></surname>
<given-names><![CDATA[J. P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bibliometric laws: empirical flaws of fit]]></article-title>
<source><![CDATA[Scientometrics]]></source>
<year>2005</year>
<volume>63</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>209-229</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Basilio]]></surname>
<given-names><![CDATA[Margarida Maria de Paula]]></given-names>
</name>
<name>
<surname><![CDATA[Braga]]></surname>
<given-names><![CDATA[Lilian Maria]]></given-names>
</name>
<name>
<surname><![CDATA[Carvalho]]></surname>
<given-names><![CDATA[Pierotti y Maria de Lourdes]]></given-names>
</name>
</person-group>
<source><![CDATA[Estrutura de textos científicos em língua portuguesa: estudo bibliométrico-linguístico]]></source>
<year></year>
<conf-name><![CDATA[ Reunião Brasileira de Ciência da Informação]]></conf-name>
<conf-date>1979</conf-date>
<conf-loc>Rio de Janeiro </conf-loc>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Benguigui]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Blumenfeld-Lieberthal]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The temporal evolution of the city size distribution]]></article-title>
<source><![CDATA[Physica A: Statistical Mechanics and Its Applications]]></source>
<year>2009</year>
<volume>388</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>1187-1195</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Black]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Henderson]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Urban evolution in the USA]]></article-title>
<source><![CDATA[Journal of Economic Geography]]></source>
<year>2003</year>
<volume>3</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>343-372</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bornbergbauer]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[How are model protein structures distributed in sequence space?]]></article-title>
<source><![CDATA[Biophysical Journal]]></source>
<year>1997</year>
<volume>73</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>2393-2403</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Boyce]]></surname>
<given-names><![CDATA[Bert]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Automatic and manual indexing performance in a small file of medical literature]]></article-title>
<source><![CDATA[Bulletin of the Medical Library Association]]></source>
<year>1975</year>
<volume>63</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>378-385</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Braga]]></surname>
<given-names><![CDATA[Gilda Maria]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[A representação da informação na descontrução do contexto]]></article-title>
<source><![CDATA[Informare: Cadernos do Programa de Pós-Graduação em Ciencia da Informação]]></source>
<year>1996</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>53-57</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bruzinga]]></surname>
<given-names><![CDATA[Graciane Silva]]></given-names>
</name>
<name>
<surname><![CDATA[Maculan]]></surname>
<given-names><![CDATA[Benildes Coura Moreira dos Santos]]></given-names>
</name>
<name>
<surname><![CDATA[Lima]]></surname>
<given-names><![CDATA[Gercina Ângela Borém de Oliveira]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Indexação automática e semântica: estudo da análise do conteúdo de teses e dissertaçöes]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ VIIIENANCIB - Encontro Nacional de Pesquisa em Ciência da Informação]]></conf-name>
<conf-date>28 a 31 de outubro de 2007</conf-date>
<conf-loc>Salvador Bahia</conf-loc>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Condon]]></surname>
<given-names><![CDATA[E. U.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistics of vocabulary]]></article-title>
<source><![CDATA[Science]]></source>
<year></year>
<volume>68</volume>
<page-range>1733, 1928</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cordoba]]></surname>
<given-names><![CDATA[J. C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the distribution of city sizes]]></article-title>
<source><![CDATA[Journal of Urban Economics]]></source>
<year>2008</year>
<volume>63</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>177-197</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Erar]]></surname>
<given-names><![CDATA[Aydin]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bibliometrics or informetrics: displaying regularity in scientific patterns by using statistical distributions]]></article-title>
<source><![CDATA[Hacettepe Journal of Mathematics and Statistics]]></source>
<year>2002</year>
<volume>31</volume>
<page-range>113-125</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Estoup]]></surname>
<given-names><![CDATA[J. B.]]></given-names>
</name>
</person-group>
<source><![CDATA[Gammes sténographique]]></source>
<year>1916</year>
<publisher-loc><![CDATA[París ]]></publisher-loc>
<publisher-name><![CDATA[Institut Sténographique]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Estoup]]></surname>
<given-names><![CDATA[J. B.]]></given-names>
</name>
</person-group>
<person-group person-group-type="editor">
<name>
</name>
</person-group>
<source><![CDATA[Gammes sténographiques: recueil de textes choisis pour l'acquisition méthodique de la vitesse, précédé d'une introduction]]></source>
<year>1908</year>
<publisher-loc><![CDATA[París ]]></publisher-loc>
<publisher-name><![CDATA[Institut Sténographique]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guedes]]></surname>
<given-names><![CDATA[Vânia Lisböa da Silveira]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Estudo de um critério para indexação automática derivativa de textos científicos e tecnológicos]]></article-title>
<source><![CDATA[Ciencia da Informação]]></source>
<year>1994</year>
<volume>23</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>318-326</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guevara]]></surname>
<given-names><![CDATA[Misael]]></given-names>
</name>
<name>
<surname><![CDATA[Ciles]]></surname>
<given-names><![CDATA[María]]></given-names>
</name>
<name>
<surname><![CDATA[Bracamonte]]></surname>
<given-names><![CDATA[Olga]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Análisis cariotípico de Capsicum pubescens (Solanaceae) 'rocoto]]></article-title>
<source><![CDATA[Revista Peruana de Biología]]></source>
<year>2000</year>
<volume>7</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>1-10</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[S. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Yen]]></surname>
<given-names><![CDATA[D. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Yang]]></surname>
<given-names><![CDATA[L. W.]]></given-names>
</name>
<name>
<surname><![CDATA[Hua]]></surname>
<given-names><![CDATA[J. S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Investigation of Zipf's law for fraud detection]]></article-title>
<source><![CDATA[Decision Support Systems]]></source>
<year>2008</year>
<volume>46</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>70-83</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jiménez Salazar]]></surname>
<given-names><![CDATA[Héctor]]></given-names>
</name>
<name>
<surname><![CDATA[Pinto]]></surname>
<given-names><![CDATA[David]]></given-names>
</name>
<name>
<surname><![CDATA[Rosso]]></surname>
<given-names><![CDATA[Paolo]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Uso del punto de transición en la selección de términos índice para agrupamiento de textos cortos]]></article-title>
<source><![CDATA[Procesamiento del Lenguaje Natural]]></source>
<year>2005</year>
<volume>35</volume>
<page-range>383-390</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lapa]]></surname>
<given-names><![CDATA[Remi Correia]]></given-names>
</name>
<name>
<surname><![CDATA[Corrêa]]></surname>
<given-names><![CDATA[Renato Fernandes]]></given-names>
</name>
</person-group>
<source><![CDATA[Seleção de descritores para a indexação automática de teses e dissertaçöes da UFPE]]></source>
<year></year>
<conf-name><![CDATA[ Encontro Nacional de Estudantes de Biblioteconomia, Documentação, Gestão, e Ciência da Informação Os desafios do profissional da informação frente às tecnologias e suportes informacionais do século XXI: lugares de memória para a biblioteconomia]]></conf-name>
<conf-date>18 a 24 de julho de 2010</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Luhn]]></surname>
<given-names><![CDATA[Hans Peter]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A statistical approach to mechanized encoding and searching of literary information]]></article-title>
<source><![CDATA[IBM Journal of Research and Development]]></source>
<year>1957</year>
<volume>1</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>309-317</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Luhn]]></surname>
<given-names><![CDATA[Hans Peter]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The automatic creation of literature abstracts]]></article-title>
<source><![CDATA[IBM Journal of Research and Development]]></source>
<year>1958</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>157-165</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ma]]></surname>
<given-names><![CDATA[Y. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Moment analysis and Zipf law]]></article-title>
<source><![CDATA[The European Physical Journal]]></source>
<year>2006</year>
<volume>30</volume>
<page-range>227-242</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Maia]]></surname>
<given-names><![CDATA[Elza Lima e Silva]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Comportamento bibliométrico da língua portuguesa, como veículo de representação da informação]]></article-title>
<source><![CDATA[Ciência da Informação]]></source>
<year>1973</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>99-138</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mamfrim]]></surname>
<given-names><![CDATA[Flavia Pereira Braga]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Representação de conteúdo via indexação automática em textos integrais de língua portuguesa]]></article-title>
<source><![CDATA[Ciência da Informação]]></source>
<year>1991</year>
<volume>20</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>191-203</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Moreiro González]]></surname>
<given-names><![CDATA[José Antonio]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información]]></article-title>
<source><![CDATA[Anales de Documentación]]></source>
<year>2002</year>
<volume>5</volume>
<page-range>273-286</page-range></nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nabeshima]]></surname>
<given-names><![CDATA[Terutaka]]></given-names>
</name>
<name>
<surname><![CDATA[Gungi]]></surname>
<given-names><![CDATA[Ukio-Pegio]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Zipf's law in phonograms and Weibull distribution in ideograms: comparison of English with Japanese]]></article-title>
<source><![CDATA[BioSystems]]></source>
<year>2004</year>
<volume>73</volume>
<page-range>131-139</page-range></nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pao]]></surname>
<given-names><![CDATA[Miranda Lee]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Automatic indexing based on Goffman's transition of word occurrences]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Fry]]></surname>
<given-names><![CDATA[Bernard M.]]></given-names>
</name>
<name>
<surname><![CDATA[Clayton]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[White Plains]]></surname>
<given-names><![CDATA[N.Y.]]></given-names>
</name>
</person-group>
<source><![CDATA[American Society for Information Science, Meeting (40th : 1977 : Chicago, Ill.); Information management in the 1980's : proceedings of the ASIS annual meeting 1977]]></source>
<year></year>
<publisher-loc><![CDATA[Chicago^eIllinois Illinois]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pao]]></surname>
<given-names><![CDATA[Miranda Lee]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Automatic text analysis based on Transition Phenomena of word occurrences]]></article-title>
<source><![CDATA[Journal of the American Society for Information Science]]></source>
<year>1978</year>
<volume>29</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>121-124</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Quoniam]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Balme]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Rostamg]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Giraud]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Dou]]></surname>
<given-names><![CDATA[J. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bibliometric law used for information retrieval]]></article-title>
<source><![CDATA[Scientometrics]]></source>
<year>1998</year>
<volume>41</volume>
<numero>1-2</numero>
<issue>1-2</issue>
<page-range>83-91</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ribeiro]]></surname>
<given-names><![CDATA[Lais A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Aplicação dos métodos estatísticos e da teoria da informação e da Comunicação na análise lingüística: estudo da linguagem jornalística]]></article-title>
<source><![CDATA[Ciência da informação]]></source>
<year>1974</year>
<volume>3</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>151-154</page-range></nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Santos]]></surname>
<given-names><![CDATA[María José V. C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Correspondência científica de Bertha Lutz: um estudo de aplicação da lei de Zipf e ponto de transição de Goffman em um arquivo pessoal, Ponto de Acesso]]></article-title>
<source><![CDATA[Salvador]]></source>
<year>2009</year>
<volume>3</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>317-326</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Urbizagástegui Alvarado]]></surname>
<given-names><![CDATA[Rubén]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Las posibilidades de la ley de zipf en la indización automática]]></article-title>
<source><![CDATA[B3: Ciencias de la Información]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Urbizagástegui Alvarado]]></surname>
<given-names><![CDATA[Rubén]]></given-names>
</name>
</person-group>
<person-group person-group-type="editor">
<name>
</name>
</person-group>
<source><![CDATA[Martina Portocarrero: un acercamiento a través de la ley de Zipf]]></source>
<year></year>
<conf-name><![CDATA[III Encuentro Internacional de Invierno]]></conf-name>
<conf-loc>Lima </conf-loc>
</nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vigotsky]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Pensamiento y Lenguaje]]></source>
<year>1988</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Visor]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wyllys]]></surname>
<given-names><![CDATA[Ronald E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Empirical and theoretical bases of Zipf's law]]></article-title>
<source><![CDATA[Library Trends]]></source>
<year>1981</year>
<volume>30</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>53-64</page-range></nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wyt]]></surname>
<given-names><![CDATA[Gerrit de]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Zipf's law in economics]]></article-title>
<source><![CDATA[SCALES-Paper N200503]]></source>
<year>2005</year>
</nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zipf]]></surname>
<given-names><![CDATA[George Kingsley]]></given-names>
</name>
</person-group>
<source><![CDATA[Human behaviour and the principle of least effort]]></source>
<year>1949</year>
<publisher-loc><![CDATA[Cambridge^eMass Mass]]></publisher-loc>
<publisher-name><![CDATA[Adisson-Wesley Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zipf]]></surname>
<given-names><![CDATA[George Kingsley]]></given-names>
</name>
</person-group>
<person-group person-group-type="editor">
<name>
</name>
</person-group>
<source><![CDATA[The psycho-biology of language]]></source>
<year>1935</year>
<publisher-loc><![CDATA[Boston ]]></publisher-loc>
<publisher-name><![CDATA[Houghton Company]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zipf]]></surname>
<given-names><![CDATA[George Kingsley]]></given-names>
</name>
</person-group>
<person-group person-group-type="editor">
<name>
</name>
</person-group>
<source><![CDATA[Selected studies of the principle of relative Frequency in language]]></source>
<year>1932</year>
<publisher-loc><![CDATA[Cambridge^eMass Mass]]></publisher-loc>
<publisher-name><![CDATA[Harvard University Press]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
