Análisis comparativo de pruebas de tamiz para la detección de problemas en el desarrollo diseñadas y validadas en México

Orcajo-Castelán, Rodrigo; Sidonio-Aguayo, Beatriz; Alcacio-Mendoza, Jorge Augusto; López-Díaz, Giovana Lucía; Orcajo-Castelán, Rodrigo; Sidonio-Aguayo, Beatriz; Alcacio-Mendoza, Jorge Augusto; López-Díaz, Giovana Lucía

doi:10.1016/j.bmhimx.2015.11.004

Servicios Personalizados

Revista

Articulo

Indicadores

Citado por SciELO
Accesos

Links relacionados

Similares en SciELO

Otros
Otros

Permalink

Boletín médico del Hospital Infantil de México

versión impresa ISSN 1665-1146

Bol. Med. Hosp. Infant. Mex. vol.72 no.6 México nov./dic. 2015

https://doi.org/10.1016/j.bmhimx.2015.11.004

Artículo de revisión

Análisis comparativo de pruebas de tamiz para la detección de problemas en el desarrollo diseñadas y validadas en México

Comparative analysis of child development screening tools designed and validated in Mexico

Rodrigo Orcajo-Castelán^a^d^e^*

Beatriz Sidonio-Aguayo^b

Jorge Augusto Alcacio-Mendoza^c

Giovana Lucía López-Díaz^c

^{^a} Unidad Médica de Alta Especialidad Hospital Regional de Psiquiatría Unidad Morelos, Instituto Mexicano del Seguro Social, México D.F., México

^{^b} Departamento de Rehabilitación Pediátrica, Hospital Infantil de México Federico Gómez, México D.F., México

^{^c} Facultad Mexicana de Medicina, Universidad La Salle, México D.F., México

^{^d} Principles and Practice of Clinical Research Course, Spaulding Rehabilitation Center, Massachusetts General Hospital, Harvard Medical School, Cambridge, Massachusetts, U.S.A.

^{^e} Centre For Global Mental Health, King's College London/London School Of Hygiene and Tropical Medicine, Londres, Reino Unido

Resumen

Introducción:

En los últimos años se han desarrollado varias pruebas de tamiz para el desarrollo infantil temprano (DIT) en menores de 5 años en México. El objetivo de esta revisión fue comparar la calidad del reporte de validación publicado y riesgo de sesgo entre diferentes pruebas desarrolladas y validadas en México.

Métodos:

Se realizó una búsqueda en bases de datos, literatura gris y referencia cruzada documental. Se efectuó un análisis comparativo de la calidad del reporte (STARD) y el riesgo de sesgo (QUADAS y QUADAS-2).

Resultados:

Se incluyeron las siguientes cinco pruebas: Valoración Neuroconductual del Desarrollo del Lactante (VANEDELA), Evaluación del Desarrollo Infantil (EDI), Prueba de Tamiz del Neurodesarrollo Infantil (PTNI), Cartillas de Vigilancia para identificar alteraciones en el Desarrollo del Lactante (CVDL) e Indicadores de riesgo del Perfil de Conductas de Desarrollo (INDIPCD-R). Ninguna cumplió el 100% de los ítems de acuerdo con STARD. Las más completas en su descripción fueron VANEDELA y EDI. El área de procedimientos de muestreo fue en la que hubo menor cumplimiento (VANEDELA, PTNI, CVDL, INDIPCD-R). En QUADAS, todas las pruebas presentaron algún riesgo de sesgo. Las más importantes fueron la selección de la muestra y la elección del estándar de oro, que en dos estudios se identificó que no era el más adecuado (PTNI, INDIPCD-R).

Conclusiones:

Las pruebas de tamiz mexicanas para el DIT varían en la calidad de reporte publicado y riesgo de sesgo. La de mejor calidad de reporte de validación es VANEDELA y la de menor riesgo de sesgo en los datos publicados es la prueba EDI.

Palabras clave: Neurodesarrollo; Pruebas de tamiz; Riesgo de sesgo; Validación; México

Abstract

Background:

In recent years a number of child development screening tools have been developed in Mexico; however, their properties have not been compared. The objective of this review was to compare the report quality and risk bias of the screening tools developed and validated in Mexico in their published versions.

Methods:

A search was conducted in databases, gray literature and cross references. The resultant tests were compared and analyzed using STARD, QUADAS and QUADAS-2 criteria.

Results:

"Valoración Neuroconductual del Desarrollo del Lactante" (VANEDELA), "Evaluación del Desarrollo Infantil or EDI" (CDE in English), "Prueba de Tamiz del Neurodesarrollo infantil" (PTNI), "Cartillas de Vigilancia para identificar alteraciones en el Desarrollo del Lactante" (CVDL) and "Indicadores de riesgo del Perfil de Conductas de Desarrollo" (INDIPCD-R) were included for the comparison. No test fulfilled all STARD items. The most complete in their methodological description were VANEDELA and EDI. The areas lacking more data on the reports were recruiting and patient selection (VANEDELA, PTNI, CVDL, INDIPCD-R). In QUADAS evaluation, all had some risk bias, but some serious concerns of risk bias were raised by patient sampling and by the choice of gold standard in two tests (PTNI, INDIPCD-R).

Conclusions:

Child development screening tests created and validated in Mexico have variable report quality and risk bias. The test with the best validation report quality is VANEDELA and the one with the lowest risk of bias is EDI.

Keywords: Child development; Screening test; Bias risk; Validation; Mexico

1. Introducción

La identificación temprana de las alteraciones en el desarrollo infantil es esencial para el bienestar de los niños y sus familias, pues permite que se proporcione un diagnóstico adecuado y una pronta intervención en aquellos que presenten alguna alteración¹. Para quien las recibe, dichas intervenciones están asociadas con una mejor funcionalidad en la vida adulta en múltiples esferas², además de que presentan una relación costo-beneficio muy alta³.

La comparación de las características clínicas de cada prueba es importante para auxiliar en la elección del instrumento más adecuado en la evaluación del desarrollo. Además, resulta importante comparar la calidad de reporte y el riesgo de sesgo de las mismas, puesto que los reportes de resultados de exámenes diagnóstico o de tamiz sesgados pueden dar como resultado la adopción generalizada de pruebas que produzcan una clasificación de riesgo imprecisa, y por tanto llevar al personal de salud a tomar decisiones de referencia, diagnóstico o tratamiento, incorrectas⁴.

En una revisión sistemática y análisis comparativo de la literatura, realizados en 2012 por Romo-Pardo y colaboradores, se encontraron 13 pruebas de tamiz creadas y validadas en América para la identificación oportuna de problemas en el desarrollo infantil, pero ninguna con datos publicados en revistas científicas para México (excepto Denver-II) ⁽⁴. En los últimos años se ha creado un número importante de pruebas de tamiz, algunas de las cuales ya se aplican a la población menor de 5 años en México, y cuya información sobre validación y propiedades no se encuentra publicada en revistas indizadas. Tampoco se ha realizado una comparación entre las mismas.

Con base en lo anterior, el objetivo del presente artículo fue comparar la calidad del reporte de validación publicado y el riesgo de sesgo entre las pruebas de tamiz desarrolladas y validadas en México.

2. Métodos

2.1. Búsqueda y análisis

Dado que parte de la información sobre las pruebas de México no está disponible en motores de búsqueda de revistas científicas, durante octubre de 2015 se realizó una búsqueda exhaustiva de herramientas de escrutinio para el desarrollo infantil en menores de 5 años, desarrolladas y validadas en México, desde 1980 a la fecha. Se llevó a cabo una estrategia simple utilizando los términos "neurodesarrollo" o "desarrollo infantil" y "tamiz", así como los términos "child development" y "screening", en PubMed/MEDLINE, Scopus, Web Of Science, EMBASE, EBSCO, Google Scholar, LiLACS y SciELO limitando los resultados a pruebas realizadas en México.

Mediante las distintas búsquedas, la referencia cruzada documental y de preguntar a expertos en el tema, se identificaron siete pruebas de tamiz elaboradas en México para evaluar el neurodesarrollo. Con el nombre de las pruebas, se realizó una búsqueda exhaustiva de publicaciones que reportaran la validación de las mismas. Además de las fuentes consultadas previamente, se investigó en la literatura gris. Para el análisis, se incluyeron solamente aquellas pruebas en las cuales se encontró validación.

2.2. Instrumentos utilizados para la evaluación de las pruebas

2.2.1. STARD

Los estándares para reportar la precisión diagnóstica (STARD, por sus siglas en inglés) ⁵^,⁶ fueron diseñados con el objetivo de mejorar la calidad de reporte en los estudios de precisión diagnóstica. Consisten en una lista de cotejo de 25 ítems y un diagrama de flujo que informa sobre el método de selección de los pacientes, el orden de realización de las pruebas y el número de pacientes que deben evaluarse mediante la prueba índice y la prueba de referencia. Evalúa que las publicaciones proporcionen información suficiente que permita detectar el sesgo potencial en un estudio y juzgar la potencial generalización y aplicabilidad de los resultados.

2.2.2. QUADAS

La herramienta de calidad de la evaluación de los estudios de precisión diagnóstica en revisiones sistematizadas (QUADAS, por sus siglas en inglés)⁷ fue desarrollada para auxiliar en la evaluación del riesgo de sesgo de las publicaciones de precisión diagnóstica. Fue elaborada basándose en tres exámenes de pruebas existentes y un proceso con metodología Delphi con la participación de un grupo de nueve expertos. Consta de una lista de 14 ítems cualitativos que incluye las características de los pacientes, el estándar de referencia, el sesgo de progresión de la enfermedad, el sesgo de verificación, el sesgo de revisión, el sesgo de revisión clínica, el sesgo de incorporación, la prueba de ejecución y los resultados indeterminados. Estos ítems deben ser calificados mediante la respuesta "sí", si se considera que el estudio analizado cuenta con las características descritas en cada ítem; "no", si no cumple con las características; o "poco claro", si el texto no contiene la información suficiente para establecer un juicio.

2.2.3. QUADAS-2

El instrumento QUADAS-2⁸ se diseñó con el objetivo de evaluar el riesgo de sesgo en los estudios de precisión diagnóstica. Consta de un cuestionario estructurado con preguntas abiertas agrupadas en cuatro dominios, que incluyen la selección de pacientes, la prueba índice, el estándar de referencia y el tiempo transcurrido entre la prueba índice y el estándar de referencia. La herramienta debe ser completada en cuatro fases: la primera pretende establecer la pregunta de revisión; la segunda, desarrollar una guía específica de revisión; posteriormente, evaluar el diagrama de flujo publicado o, en caso de no haber sido publicado, realizar uno con los datos proporcionados; y, finalmente, establecer un juicio de sesgo y aplicabilidad. Cada dominio se evalúa en términos del riesgo de sesgo y los tres primeros también son evaluados en términos de preocupaciones con respecto a la aplicabilidad. Para ayudar a establecer un juicio sobre el riesgo de sesgo, se incluyen preguntas de señalización. Esta herramienta permite realizar una presentación tabular para cada estudio evaluado, calificando cada ítem como bajo riesgo, alto riesgo o riesgo poco claro.

2.3. Procedimiento de la evaluación

El análisis se efectuó en fases. En una primera fase, cada uno de los autores evaluó, por separado y de forma independiente, la calidad del reporte de validación, mediante el uso de la herramienta STARD⁶, y el riesgo de sesgo en estudios, mediante las herramientas QUADAS⁷ y QUADAS-2⁸. Los resultados de dicha evaluación, incluyendo flujogramas y listas de cotejo, fueron recolectados utilizando los formatos desarrollados para cada instrumento. En una segunda fase, se compararon los formatos de evaluación de cada uno de los autores. Las discrepancias fueron resueltas por consenso. Se produjo una evaluación final que fue vaciada en los formatos antes mencionados y transformada para su presentación gráfica.

3. Resultados

3.1. Identificación de las pruebas de tamiz

Se identificaron siete pruebas de tamiz de alteraciones en el neurodesarrollo creadas en México: la Escala de Desarrollo Integral del Niño⁹, la Evaluación del Neurodesarrollo del Neonato (EVANENE)¹⁰, la Valoración Neuroconductual del Desarrollo del Lactante (VANEDELA)¹¹, Evaluación del Desarrollo Infantil (EDI)¹², Prueba de Tamiz del Neurodesarrollo infantil (PTNI)¹³, Cartillas de Vigilancia para identificar alteraciones en el Desarrollo del Lactante (CVDL)¹⁴ e Indicadores de riesgo del Perfil de Conductas de Desarrollo (INDIPCD-R)¹⁵.

Todos las publicaciones que se encontraron en los motores de búsqueda fueron relacionadas con la prueba EDI¹⁶^-¹⁸, con excepción de una relacionada con NPED (Neuropediatric Development) ⁽¹⁹, la cual fue excluida ya que evaluaba un instrumento desarrollado en Cuba y no tenía un diseño de validación concurrente. El resto fue localizado en publicaciones científicas no indizadas ni indexadas (INDIPCD-R¹⁵, CVDL²⁰⁾⁾, en páginas web (PTNI²¹⁾⁾, o como libros, manuales, protocolos institucionales de investigación o tesis de grado (EVANENE²², VANEDELA²³, EDI¹⁶^-¹⁸, PTNI²¹⁾⁾.

Tres contaban con artículos de validación publicados, una contaba con datos de la validación publicados en línea y otra como reporte de tesis. Finalmente, se incluyeron cinco pruebas para ser evaluadas. Se excluyeron de este estudio la Escala de Desarrollo Integral del Niño, por no encontrar datos sobre su validación, y EVANENE, por el mismo motivo, ya que se localizó solamente una tesis de validación de la misma pero como instrumento de tamiz de daño cerebral.

3.2. Características generales de las pruebas evaluadas

Las características generales de las pruebas evaluadas se describen en la Tabla 1. Se encontró una gran variedad de rango de edades evaluadas. EDI es la prueba que evalúa el rango de edad más amplio (1-59 meses). La mayoría de las pruebas utiliza la observación directa como modalidad de evaluación excepto EDI, que tiene una modalidad de evaluación mixta: observación directa/interrogatorio dirigido. Ninguna utiliza la modalidad exclusiva de interrogatorio a través del llenado de un cuestionario por los padres. Las áreas evaluadas muestran una gran variabilidad, aunque en general se ajustan a las áreas recomendadas por la literatura: motora, lenguaje, adaptativo o cognitivo, personal o social²⁴^,²⁵.

Tabla 1 Descripción general de las pruebas de tamiz comparadas en el estudio

m: meses; a: años; DE: desviación estándar.

Solamente INDIPCD-R, EDI y VANEDELA presentan la evaluación de signos neurológicos. Los sistemas de calificación utilizados difieren ampliamente, pero están adecuadamente descritos. Lo mismo se puede afirmar de los criterios de anormalidad, con excepción de los del INDIPCD-R, cuya definición publicada resulta confusa ya que no es claro cómo se compara el puntaje obtenido con el del estándar de oro. Las propiedades de las pruebas de tamiz reportadas en los estudios de validación revisados se encuentran resumidas en la Tabla 2.

VANEDELA: Valoración Neuroconductual del Desarrollo del Lactante; EDI: Evaluación del Desarrollo Infantil; PTNI: Prueba de Tamiz del Neurodesarrollo Infantil; CVDL: Cartillas de Vigilancia para identificar alteraciones en el Desarrollo del Lactante; INDIPCD-R: Indicadores de riesgo del Perfil de Conductas de Desarrollo Revisado; VPP: valor predictivo positivo; VPN: valor predictivo negativo; m: meses; INP: Instituto Nacional de Pediatría; UAM-X: Universidad Autónoma Metropolitana plantel Xochimilco; DE: desviaciones estándar; IDB-2: Inventario de Desarrollo de Battelle 2ª. ed. en español; CTD: cociente toral de desarrollo; EEG: Examen evolutivo de Gessell; CDD: cociente de desarrollo del dominio; PCD-R: perfil de conductas del desarrollo; CENDI: centro de desarrollo infantil.

Los tamaños de muestra para realizar las validaciones variaron. El más amplio fue el reportado por la PTNI. La selección de la muestra también varió, ya que se encontraron dos pruebas que se validaron en poblaciones provenientes de instituciones de salud (VANEDELA e INDIPCD-R), dos que obtuvieron su muestra en poblaciones específicas (PTNI en rural y CVDL en urbana) y una que presentó una selección de muestra intencionadamente balanceada en cuanto a características demográficas y factores de riesgo biológico (EDI).

El estándar de oro utilizado en la validación también fue diferente para las diversas pruebas: tres pruebas utilizaron una prueba diagnóstica del neurodesarrollo, como el Examen Evolutivo de Gessell (EEG)²⁶ o el Inventario de Desarrollo de Battelle-2 (IDB-2)²⁷ (VANEDELA, EDI, CVDL). Una prueba utilizó la prueba diagnóstica de la cual deriva (PCD-R)²⁸^,²⁹. Otra prueba utilizó como indicador proxy una serie de medidas de estado nutricional, anemia y crecimiento, a solas y como puntaje compuesto (PTNI).

Todas las pruebas reportaron valores de sensibilidad y especificidad así como valores predictivos positivos (VPP) y negativos (VPN) adecuados con lo recomendado por la literatura²⁴, aunque hubo pruebas que presentaron una amplia variación, dependiendo del grupo de edad evaluado (VANEDELA) o del estándar de oro utilizado (PTNI). En algunos rangos de edad fueron demasiado bajos para ser utilizados. Tres pruebas no describieron intervalos de confianza de sus datos (VANEDELA, PTNI, CVDL).

3.3. Resultados de la evaluación de la calidad del reporte

En la Tabla 3 se muestra la lista de cotejo de la herramienta STARD. Ninguna de las pruebas cumplió con la totalidad de los ítems a reportar. Las más completas en su descripción de métodos fueron VANEDELA y EDI. Las áreas en las que se encontraron más pruebas con datos faltantes o incompletos fueron las referentes a la descripción del procedimiento de muestreo y selección de pacientes (VANEDELA, PTNI, CVDL, INDIPCD-R), los métodos mediante los cuales se describieron los datos faltantes y los casos que se perdieron al seguimiento (todas), la descripción de los participantes y el flujograma del estudio (PTNI, CVDL, INDIPCD-R, EDI) y los métodos establecidos para medir la reproducibilidad de la prueba (INDIPCD-R).

Tabla 3 Lista de cotejo STARD para evaluar calidad de reporte de estudios de precisión diagnóstica

STARD: Standards for Reporting of Diagnostic Accuracy; VANEDELA: Valoración Neuroconductual del Desarrollo del Lactante; EDI: Evaluación del Desarrollo Infantil; PTNI: Prueba de Tamiz del Neurodesarrollo Infantil; CVDL: Cartillas de Vigilancia para identificar alteraciones en el Desarrollo del Lactante; INDIPCD-R: Indicadores de riesgo del Perfil de Conductas de Desarrollo Revisado.

3.4. Resultados de la evaluación del riesgo de sesgo

La Tabla 4 muestra los resultados de la aplicación de la herramienta de evaluación de riesgo de sesgo QUADAS. Ninguna prueba cumplió al 100% los criterios evaluados. Solo una prueba evaluó un espectro de pacientes representativo de la población (EDI). Ninguna reportó manejo de resultados no interpretados, abandono del estudio u otras pérdidas de casos. Los resultados de la evaluación QUADAS-2 se muestran el Tabla 5 y son una valoración cualitativa final que representa el consenso de la opinión de los autores sobre qué tanto riesgo de sesgo presenta cada una de las pruebas. Debido a la validación mediante el estándar de oro proxy, la PTNI presenta un alto riesgo de sesgo con respecto a su estándar de referencia (peso para la edad, talla para la edad, anemia y estimulación temprana que no es independiente a la prueba). La INDIPCD-R presenta un alto riesgo de sesgo de su prueba índice y estándar de oro ya que se valida contra sí misma. Al tratarse de muestras por conveniencia, sin ningún tipo de ajuste, todas las pruebas presentan un alto riesgo de sesgo con respecto a la selección de sus pacientes. La que menos riesgo tuvo fue EDI ya que, intencionalmente, balanceó los grupos evaluados.

Tabla 4 Cuestionario para evaluar riesgo de sesgos en estudios de precisión diagnóstica QUADAS

Tabla 5 Consenso de resultados de la aplicación de la herramienta de evaluación de riesgo de sesgo QUADAS-2

4. Discusión

En previas revisiones⁴ y reportes¹⁴^,¹⁵ es repetitivo el comentario sobre las escasas o nulas menciones de pruebas mexicanas en la literatura, así como la dificultad de encontrar las validaciones de pruebas latinoamericanas. El escaso número de resultados obtenido al realizar búsquedas sencillas limitando los resultados a México podría explicarse por dos factores: el primero sería el bajo nivel de visibilidad de las revistas latinoamericanas, ya que muchas no se encuentran indexadas e indizadas, y por tanto no aparecen en los motores de búsqueda³⁰. El segundo, por una mezcla entre un probable "temor" a las publicaciones internacionales y un efecto de "malinchismo" hacia las nacionales³¹, que dificulta la decisión de iniciar el laborioso proceso de transformación de textos de tesis de grado en artículos científicos³².

Como no existe una prueba de tamiz del desarrollo ideal, se puede decir que las características generales de las pruebas las hacen adecuadas para su uso en México. Antes de considerar los aspectos de la calidad de validación, la decisión de utilizar una sobre otra debe considerar su flexibilidad de uso²⁴. En este sentido, el rango de edades evaluadas, la variedad en modalidades de evaluación y la sencillez del sistema visual de calificación por "semáforo" favorecen a la prueba EDI.

Ningún estudio se encuentra libre de fallas en la calidad de su reporte. El más completo fue el reporte de VANEDELA, muy amplio y completo al ser una tesis de 180 páginas. Si bien se encuentran casi todos los datos requeridos por STARD para valorar la confiabilidad de los datos reportados, hay aspectos metodológicos que limitan su validez externa, como el tamaño de muestra pequeño de cada uno de los grupos etarios evaluados y el proceso de reclutamiento de la muestra, que fue por conveniencia en una población urbana proveniente de ambientes clínico-hospitalarios. Otros reportes de validación, como el del INDIPCD-R, omiten datos importantes para poder evaluar su validez, lo que dificulta su evaluación objetiva. Una posible solución a este fenómeno podría ser el extender el uso de las herramientas de evaluación utilizadas en este artículo como una lista de cotejo guía para garantizar que los escritos científicos estén completos antes de publicarse³³.

No existe publicación científica que esté libre de sesgos; sin embargo, existen procedimientos para reducirlos. Los resultados de las dos evaluaciones finales (QUADAS y QUADAS-2) muestran que, si bien los datos de sensibilidad y especificidad son, a grosso modo, similares entre las pruebas comparadas, la validez de estos datos está comprometida en distintos grados. Algunas de las publicaciones evaluadas omiten datos básicos, como las medidas de dispersión de datos o precisión de la medición, y otras comprometen el procedimiento de validación concurrente al comparar la prueba contra sí misma o una medición proxy. Otras pruebas, como VANEDELA, también presentan alto riesgo de sesgo por lo pequeño de la muestra.

De manera similar a lo concluido en revisiones comparativas de pruebas de tamiz del desarrollo realizadas en otras partes del mundo³⁴, se encontró que de entre las pruebas para tamiz del neurodesarrollo creadas en México no hay ninguna que sea perfecta. La más flexible en su aplicación y con menor riesgo de sesgo en sus resultados de validación fue la prueba EDI.

Las pruebas de tamiz del neurodesarrollo, creadas y validadas en México, son, en general, adecuadas para su uso, aunque presentan calidades de reporte de publicación y riesgo de sesgo variables, y ninguna es perfecta. La prueba con mejor calidad de reporte de validación es VANEDELA, seguida de EDI, y la de menor riesgo de sesgo en los datos publicados es la prueba EDI. Se requerirá de un estudio comparativo entre las pruebas de tamiz contra el estándar de oro para poder establecer cuál de ellas es la que tiene las mejores propiedades.

Financiamiento

Este trabajo no contó con financiamiento alguno.

Agradecimientos

Se agradece al Lic. Josué Laguna Hernández de la Sección de Archivo Histórico, Biblioteca Dr. Ramón Villarreal Pérez, Universidad Autónoma Metropolitana-plantel Xochimilco, por el apoyo brindado en la localización de una de las tesis evaluadas en este estudio.

Referencias

1. Council on Children with Disabilities; Section on Developmental Behavioral Pediatrics; Bright Futures Steering Committee; Medical Home Initiatives for Children with Special Needs Project Advisory Committee. Identifying infants and young children with developmental disorders in the medical home: an algorithm for developmental surveillance and screening. Pediatrics. 2006;118:405-20. [ Links ]

2. Hamilton S. Screening for developmental delay: reliable, easy-to-use tools. J Fam Pract. 2006;55:415-22. [ Links ]

3. Glascoe F.P., Foster E.M., Wolraich M.L. An economic analysis of developmental detection methods. Pediatrics. 1997;99:830-7. [ Links ]

4. Romo-Pardo B., Liendo-Vallejos S., Rizzoli-Córdoba G., Vargas-López A., Buenrostro-Márquez G. Global neurodevelopmental screening tests for children under 5 years of age in the United States and Latin America: systematic review and comparative analysis. Bol Med Hosp Infant Mex. 2012;69:450-62. [ Links ]

5. Bossuyt P.M., Reitsma J.B., Bruns D.E., Gatsonis C.A., Glasziou P.P., Irwig L.M., et al. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. BMJ. 2003;326:41-4. [ Links ]

6. Bossuyt P., Reitsma J.B., Bruns D.E., Gatsonis C.A., Glasziou P.P., Irwig L.M., et al. The STARD statement for reporting studies of diagnostic accuracy: explanation and elaboration. Clin Chem. 2003;49:7-18. [ Links ]

7. Whiting P.F., Rutjes A.W.S., Reitsma J.B., Bossuyt P.M., Kleijmen J. The development of QUADAS: a tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews. BMC Med Res Methodol. 2003;3:25. [ Links ]

8. Whiting P.F., Rutjes A.W.S., Westwood M.E., Mallett S., Deeks J.J., Reitsma J.B., et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011;155:529-36. [ Links ]

9. Atkin L.C., Supervielle T., Sawyer R., Cantón P. Paso a paso: cómo evaluar el crecimiento y desarrollo de los niños. UNICEF, Editorial Pax, (1987) . [ Links ]

10. Alvarado-Ruiz GA, Sánchez-Pérez MC, Mandujano-Valdés MA. EVANENE. Evaluación del Neurodesarrollo del Neonato. México D.F.: Universidad Autónoma Metropolitana Unidad Xochimilco; 2013. [ Links ]

11. Sánchez-Pérez M.C., Benavides-González H., Mandujano-Valdés M., Rivera-González I.R., Martínez-Vázquez R.I., Alvarado-Ruiz G.A. Valoración Neuroconductual del Desarrollo del Lactante (VANEDELA). Universidad Autónoma Metropolitana, (2007) . [ Links ]

12. Comisión Nacional de Protección Social en Salud. Manual para la Aplicación de la Prueba Evaluación del Desarrollo Infantil EDI. México, D.F.: Secretaría de Salud; 2013. 100p. Disponible en: http://www.himfg.edu.mx/descargas/documentos/EDI/ManualparalaPruebadeEvaluaciondelDesarrolloInfantil-EDI.pdf. [ Links ]

13. Ávila-Curiel CA, Álvarez-Izazaga MA, Lopez-Arce Coria AM, Medina-Carranza BE. Prueba de Tamiz del Neurodesarrollo Infantil. México, 2008. Instituto Nacional de Ciencias Médicas y Nutrición Salvador Zubirán. No. de registro 03-2008-120312060800. [ Links ]

14. Rivera R. Vigilancia del desarrollo en el primer nivel de atención. Vigilancia del desarrollo integral del niño., Editores de Textos Mexicanos, 2009. pp. 9-15. [ Links ]

15. Bolaños C., Mina-Lara M.M., Ramos-Ortega G. Indicadores de riesgo del Perfil de Conductas de Desarrollo como instrumento para la detección temprana de retrasos y alteraciones en el desarrollo. Acta Pediatr Mex. 2015;36:135-46. [ Links ]

16. Rizzoli-Córdoba A., Schnass-Arrieta L., Liendo-Vallejos S., Buenrostro-Márquez G., Romo-Pardo B., Carreón-García J., et al. Validación de un instrumento para la detección oportuna de problemas del desarrollo en menores de 5 años en México. Bol Med Hosp Inf Mex. 2013;70:195-208. [ Links ]

17. Rizzoli-Córdoba A., Ortega-Ríosvelasco F., Villasís-Keever M.A., Pizarro-Castellanos M., Buenrostro-Márquez G., Aceves-Villagrán D., et al. Reliability for detection of developmental problems using the semaphore from the Child Development Evaluation test: Is a yellow result different from a red result. Bol Med Hosp Infant Mex. 2014;71:277-85. [ Links ]

18. Rizzoli-Córdoba A., Schnaas-Arrieta L., Ortega-Ríosvelasco F., Rodríguez-Ortega E., Villasís-Keever M.A., Aceves-Villagrán D., et al. Child Development Evaluation Test analysis by field improves detection of developmental problems in children. Bol Med Hosp Infant Mex. 2014;71:154-62. [ Links ]

19. Guadarrama-Celaya F., Otero-Ojeda G.A., Pliego-Rivero F.B., Porcayo-Mercado M.R., Ricardo-Garcell J., Perez-Ábalo M.C. Screening of neurodevelopmental delays in four communities of Mexico and Cuba. Public Health Nurs. 2012;29:105-15. [ Links ]

20. Rivera-González R., Villanueva-Romero Y., Amaro-López L., Sánchez-Pérez C., Figueroa-Olea M., Soler-Limón K.M. Validez concurrente de las cartillas vigilancia para identificar alteraciones en el desarrollo del lactante. Ciencias Clínicas. 2014;15:22-9. [ Links ]

21. Ávila-Curiel A, Álvarez-Izazaga MA, Reidl-Martinez L, López-Arce AM. Vigilancia Epidemiológica del Neurodesarrollo Infantil en Comunidades Marginales de México. Capitulo III Elaboración de la prueba de tamiz del neurodesarrollo infantil (PTNI). Disponible en: http://www.nutricionenmexico.org.mx/encuestas/neuro%20web.pdf. [ Links ]

22. Palma-Reyes CR. Valor diagnóstico de dos instrumentos clínicos en la detección de daño cerebral perinatal en prematuros. Informe preliminar (Tesis de Licenciatura). Universidad Autónoma de Querétaro. Querétaro, Querétaro, México; 2014. [ Links ]

23. Martínez-Vázquez RI. Evaluación de la sensibilidad y especificidad del instrumento de detección: Valoración Neuroconductual del Desarrollo del Lactante. (VANEDELA) (Tesis de Maestría). Universidad Autónoma Metropolitana-Xochimilco. México D.F., México; 2001. [ Links ]

24. Rydz D., Shevell M.I., Majnemer A., Oskoui M. Developmental screening. J Child Neurol. 2005;20:4-21. [ Links ]

25. Shevell M., Majnemer A., Platt R.W., Webster R., Birnbaum R. Developmental and functional outcomes in children with global developmental delay or developmental language impairment. Dev Med Child Neurol. 2005;47:678-83. [ Links ]

26. Ball R.S. The Gesell developmental schedules: Arnold Gesell (1880-1961). J Abnorm Child Psych. 1977;5:233-9. [ Links ]

27. Newborg J. Development and standardization. Battelle Developmental Inventory., Riverside Publishing, 2004. pp. 95-148. [ Links ]

28. Bolaños C. Manual del Perfil de Conductas de Desarrollo Revisado. Instituto de Terapia Ocupacional, (2005) . [ Links ]

29. Bolaños C. Estudio de validación del perfil de conductas de desarrollo (PCD) como instrumento para evaluar el nivel de desarrollo de los niños de 0-4 años. Bol Med Hosp Infant Mex. 2003;60:79-89. [ Links ]

30. Romero-Torres M., Acosta-Moreno L.A., Tejada-Gómez M.A. Ranking de revistas científicas en Latinoamérica mediante el índice h: estudio de caso Colombia. Rev Esp Document Cient. 2013;36:e003. [ Links ]

31. Cicero-Sabido R. ¿Por qué los autores mexicanos no envían trabajos importantes a las revistas médicas mexicanas? Un comentario breve. Gac Med Mex. 2006;142:128-9. [ Links ]

32. Gross L., Watkins M.P. Reporting the results of clinical research. Foundations of Clinical Research. Applications to Practice, Pearson Prentice Hall, (2008) pp. 879-900. [ Links ]

33. Cook C., Cleland J., Huijbregts P. Creation and critique of studies of diagnostic accuracy: use of the STARD and QUADAS methodological quality assessment tools. J Man Manip Ther. 2007;15:93-102. [ Links ]

34. Bedford H, Walton S, Ahn J; Policy Research Unit in the Health of Children, Young People and Families; Centre for Paediatric Epidemiology and Biostatistics, UCL Institute of Child Health. Measures of Child Development: A Review. London: University College London (UCL); 2013. 103p. Disponible en: https://www.ucl.ac.uk/cpru/documents/review_of_measures_of_child_development. [ Links ]

Recibido: 02 de Noviembre de 2015; Aprobado: 03 de Noviembre de 2015

*Autor para correspondencia: Correo electrónico: rodrigo_aquilino.orcajo_castelan@kcl.ac.uk (R. Orcajo-Castelán).

^{Conflicto de intereses}

Los autores declaran no tener ningún conflicto de intereses.

This is an open-access article distributed under the terms of the Creative Commons Attribution License