SciELO - Scientific Electronic Library Online

 
vol.97 número4¿Por qué continuar realizando listados florísticos en México? El caso de la Región Terrestre Prioritaria Tacaná-Boquerón, ChiapasInventario florístico de la Reserva de la Biosfera Sierra del Abra Tanchipa, San Luis Potosí, México índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


Botanical Sciences

versão On-line ISSN 2007-4476versão impressa ISSN 2007-4298

Resumo

RUIZ-SANCHEZ, Eduardo et al. Datataxa: un nuevo script para extraer la información de los metadatos de secuencias de GenBank: la Flora del Bajío como un caso de estudio. Bot. sci [online]. 2019, vol.97, n.4, pp.754-760.  Epub 04-Fev-2020. ISSN 2007-4476.  https://doi.org/10.17129/botsci.2226.

Antecedentes:

GenBank es un repositorio público de millones de secuencias nucleotídicas. Se han desarrollado varios programas para extraer la información almacenada en GenBank. Ninguno de ellos es útil para extraer y organizar información de los metadatos de las entradas de GenBank. Desarrollamos un nuevo script llamado Datataxa, que extrae metainformación de Genbank. El listado de la Flora del Bajío y de Regiones Adyacentes (FBRA) fue utilizado como caso de estudio, para probar nuestro script.

Pregunta:

¿Cuántas especies de la FBRA tienen registros en GenBank? y ¿Qué porcentaje de esos registros se han utilizado en estudios de filogenética, filogeografía, filogenómica, código de barras, diversidad genética y biogeografía?.

Métodos:

Datataxa está escrito en lenguaje AutoIt Scripting Language para facilitar la extracción de información de GenBank. La información extraída de GenBank fue clasificada en seis categorías. La lista preliminar de especies de la FBRA fue utilizada como caso de estudio para aplicar nuestro script. Estas categorías fueron aplicadas a la lista de especies de la FBRA.

Resultados:

El script nos permitió extraer y organizar la información de lo metadatos, como los títulos de publicación de 2,558 especies que están incluidas en la FBRA, 1,575 de esas especies tienen registros en GenBank. 1,322 fueron de estudios filogenéticos, seguido de código de barras (326) y biogeografía (298). Filogenómica (41), filogeografía (34) y diversidad genética (34), tuvieron menos representación.

Conclusiones:

Datataxa trabajó muy bien extrayendo los metadatos de las secuencias de Genbank. Datataxa puede ser utilizado en cualquier lista de especies para extraer los metadatos de GenBank.

Palavras-chave : API; checklist; entrez; GenBank; plantas vasculares; tratamiento florístico.

        · resumo em Inglês     · texto em Inglês     · Inglês ( pdf )