Comparativa de aplicaciones de inteligencia artificial para la selección documental en los archivos televisivos

Caldera-Serrano, Jorge; Caldera-Serrano, Jorge

doi:10.22201/iibi.24488321xe.2025.103.58963

SciELO

SciELO

Permalink

Investigación bibliotecológica

ISSN 2448-8321 ISSN 0187-358X

Investig. bibl vol.39 no.103 Ciudad de México abr./jun. 2025 31--2025

https://doi.org/10.22201/iibi.24488321xe.2025.103.58963

Artículos

Comparativa de aplicaciones de inteligencia artificial para la selección documental en los archivos televisivos

Comparison of Artificial Intelligence Applications for Document Selection in Television Archives

Jorge Caldera-Serrano^*

^{^*}Departamento de Información y Comunicación, Facultad de Ciencias de la Documentación y la Comunicación, Universidad de Extremadura, España, jcalser@unex.es

Resumen

El artículo desarrolla cómo la inteligencia artificial puede ayudar a la selección de documentos audiovisuales en las cadenas de televisión con la finalidad de agilizar la labor documental. Por lo tanto, el objetivo es mostrar en qué, cómo y con cuáles aplicaciones la inteligencia artificial puede intervenir para la optimización del proceso de selección audiovisual en programas informativos. Para ello, se lleva a cabo una revisión bibliográfica y un estado de la cuestión en las empresas audiovisuales españolas, infiriendo de qué manera podría ayudar la inteligencia artificial a la automatización del proceso de selección y cuáles son las herramientas actuales que podrían optimizar dicho proceso. Como resultados, puede apreciarse que, aunque todavía deben desarrollarse mejores algoritmos, existen potencialidades en el marco de la tecnología de la inteligencia artificial para automatizar el proceso.

Palabras clave: Selección documental; Archivos de televisión; Automatización; Inteligencia artificial

Abstract

This paper analyzes how artificial intelligence can assist in selecting audiovisual documents in television networks to streamline the documentation process. The objective is to demonstrate how, where, and with which applications artificial intelligence can intervene to optimize the audiovisual selection process, particularly in news programs. To achieve this, we conducted a literature review and a state-of-the-art analysis of Spanish audiovisual companies, inferring how artificial intelligence could aid in automating the selection process and identifying current tools that could enhance this process. The results show that although better algorithms still need to be developed, there are potentialities within artificial intelligence technology to automate the process.

Keywords: Document Selection; Television Archives; Automation; Artificial Intelligence

Introducción

La televisión ha sido uno de los medios de comunicación más influyentes desde su creación y ha desempeñado un papel crucial en la difusión de información, entretenimiento y cultura. Su impacto en la sociedad es innegable, pues llega a millones de personas en todo el mundo y moldea la opinión pública y las tendencias culturales. En un contexto donde la demanda de contenido es constante y creciente, este medio ha tenido que adaptarse para satisfacer las expectativas de su audiencia y mantenerse relevante.

Para gestionar eficazmente esta demanda, las cadenas de televisión requieren departamentos de documentación robustos que aseguren la organización, preservación y accesibilidad del vasto archivo de material audiovisual. Estos departamentos son esenciales para la operatividad diaria, ya que facilitan el acceso rápido y eficiente a contenidos históricos y actuales, que son vitales para la producción de programas, noticias y otros segmentos televisivos. La gestión adecuada no solo preserva el patrimonio audiovisual, sino que también optimiza los recursos y tiempos de producción, permitiendo a los equipos creativos centrarse en la generación de nuevos contenidos (^{Caldera-Serrano y Arranz Escacha, 2012}).

La selección de material audiovisual se enfrenta al desafío del volumen masivo de información que ingresa constantemente a estos servicios (^{Giménez Rayo, 2007: 83}). Con la digitalización y el aumento de la producción de contenido, las cadenas de televisión acumulan terabytes de datos diariamente. Este volumen abrumador requiere métodos eficaces para filtrar, catalogar y recuperar información relevante de manera oportuna. La necesidad de una selección precisa y rápida del material se vuelve imperativa para mantener la competitividad y calidad en la producción televisiva (^{Caldera-Serrano y Arranz Escacha, 2013: 17}).

En los últimos años, la inteligencia artificial (IA) ha mostrado un progreso significativo en diversos campos del conocimiento, incluyendo la sanidad (^{Sánchez Rosado y Díez Parra, 2022}), la educación (^{Incio Flores et al., 2022}) y el análisis de datos (^{Rouhiainen, 2018: 26}). La IA ofrece herramientas avanzadas que pueden transformar la manera en que se gestionan y procesan grandes volúmenes de información (^{Ponce Gallegos et al., 2014}). Sus capacidades para el aprendizaje automático, el reconocimiento de patrones y la toma de decisiones autónomas han demostrado ser valiosas en la optimización de procesos y la mejora de la eficiencia en variadas industrias.

Existen múltiples posibilidades para aplicar técnicas de IA en la selección de material audiovisual televisivo. Algoritmos de aprendizaje automático pueden ser entrenados para identificar y clasificar contenido relevante con alta precisión, reduciendo el tiempo y el esfuerzo humano necesario en estos procesos. Técnicas como el procesamiento de lenguaje natural y la visión por computadora pueden analizar y etiquetar automáticamente grandes volúmenes de vídeo y audio, optimizando la accesibilidad y la organización del archivo.

La implementación de IA en los archivos de televisión además de agilizar la selección y el acceso a material audiovisual también abre nuevas oportunidades para la innovación en la producción de contenido. Por ejemplo, la IA puede analizar tendencias actuales en redes sociales y otros medios para anticipar las necesidades de la audiencia y sugerir temas relevantes para futuros programas. Asimismo, su capacidad para procesar y analizar grandes cantidades de datos en tiempo real puede mejorar la cobertura de noticias, lo cual permite a los periodistas y productores reaccionar rápidamente a eventos emergentes con información precisa y relevante (^{Bazán-Gil, 2023}).

Sin embargo, la adopción de IA también plantea desafíos que deben considerarse, como la calidad y la ética de los algoritmos utilizados para la toma de decisiones (^{Larsson, 2020}). Es crucial que las cadenas de televisión implementen medidas de supervisión y evaluación continua para garantizar la transparencia y la responsabilidad en el uso de IA. Además, es necesario invertir en la formación y capacitación de los profesionales del sector para que puedan trabajar eficazmente con estas nuevas tecnologías y maximizar su potencial.

Objetivo, objetos y metodología

El presente trabajo tiene como objetivo principal analizar las posibilidades que ofrece la IA para la automatización del proceso documental en la selección de contenidos en archivos televisivos. Esta investigación se enmarca en la creciente necesidad de las empresas televisivas de optimizar la gestión de sus recursos documentales, considerando el volumen creciente de datos que deben procesarse y organizarse en un entorno cada vez más digitalizado. El trabajo cuenta con los siguientes objetivos específicos: analizar el estado del arte de las aplicaciones de IA utilizadas en la selección documental en archivos televisivos; identificar las características técnicas esenciales de las herramientas de IA más adecuadas para la selección de contenidos en archivos audiovisuales, incluyendo sus capacidades de procesamiento de lenguaje natural, reconocimiento visual y análisis de metadatos; y realizar un análisis comparativo de las herramientas de IA existentes con el fin de evaluar su adecuación a las necesidades de los departamentos de documentación de las empresas televisivas.

Los objetos de estudio seleccionados para abordar este objetivo son tres. En primer lugar, se consideran los archivos de televisión, específicamente los departamentos de documentación de las empresas televisivas, donde se lleva a cabo el proceso de selección documental. Estos departamentos son fundamentales para la organización y recuperación de información audiovisual, y su funcionamiento depende en gran medida de la eficacia con la que se gestionan los contenidos documentales. En segundo lugar, se aborda la IA como una tecnología disruptiva, con particular énfasis en su capacidad para mejorar la gestión en los archivos de televisión. Esto comprende el análisis de los desarrollos más recientes en IA, tales como algoritmos de aprendizaje automático, reconocimiento de patrones y procesamiento de lenguaje natural, que tienen el potencial de automatizar procesos que tradicionalmente han sido manuales, como la clasificación y la indexación de contenido audiovisual. Por último, el proceso documental propiamente dicho, centrado en la selección documental. Este proceso incluye la evaluación de los criterios y métodos utilizados para seleccionar qué materiales deben ser conservados, digitalizados o eliminados, y cómo la IA podría intervenir para automatizar y optimizar estas decisiones.

La metodología empleada en esta investigación se basa en un enfoque riguroso y sistemático propio de las ciencias sociales, con una fuerte orientación hacia la revisión bibliográfica. Se ha realizado una búsqueda exhaustiva de literatura en bases de datos académicas de reconocido prestigio, tales como Scopus, Web of Science (WoS) y Google Académico, llevada a cabo en agosto de 2024, utilizando los siguientes términos en español y en inglés: “inteligencia artificial” (“artificial intelligence”), “IA” (“AI”), “selección documental” (“document selection”), “televisión” (“television”), “archivos audiovisuales” (“audiovisual archives”), “archivos de televisión” (“television archives”) y “gestión documental” (“document management”), utilizando además operadores booleanos para la búsqueda conjunta de elementos.

Este proceso de revisión ha implicado una selección crítica de los trabajos más relevantes para el tema de estudio, priorizando aquellos que ofrecen contribuciones significativas sobre la intersección entre IA y gestión documental en entornos televisivos. Para analizar las mejores herramientas y aplicaciones para llevar a cabo la selección de documentos audiovisuales televisivos, se han realizado búsquedas genéricas en las principales empresas de aplicaciones de IA, obteniendo la información de la documentación existente en sus páginas web y los aportes realizados por las propias empresas desarrolladoras. Al ser, en muchos casos, aplicaciones novedosas no han sido tratadas en la literatura académica y científica, por lo que fue fundamental la consulta de blogs y web especializados en IA, así como el acceso a las páginas de los desarrolladores de los servicios de IA. Paralelamente, se ha desarrollado una labor de observación, aunque no sistemática, de centros de documentación televisivos; se contactó con sus profesionales, quienes aportaron en torno a la escasa integración de la IA en sus servicios documentales.

La selección documental en televisión

Las televisiones operan sin interrupción, las veinticuatro horas del día, los siete días de la semana, a lo largo de todo el año, generando una vasta cantidad de información y contenido audiovisual. Este enorme volumen plantea el desafío de discriminar entre el material relevante del que no lo es para formar parte del archivo audiovisual, lo que representa un problema de difícil solución en la gestión documental (^{Giménez Rayo, 2007: 77-79}).

La selección es un eslabón de la cadena documental que, en los servicios de documentación de las cadenas televisivas, se encuentra enmarcado después de la adquisición, al contrario que en otras unidades documentales. Los recursos audiovisuales, procedentes de la realidad, ingresan en el sistema de televisión, son utilizados en algunos casos por periodistas, y después pasan a formar parte del sistema de gestión documental de la cadena. Será en ese momento en el que se valore la necesidad de ser seleccionado, analizado y conservado de forma permanente.

Es fundamental reconocer que no todo el contenido generado por las televisiones es útil, y que almacenar todo el material podría sobrecargar y paralizar el funcionamiento de los servicios de documentación. Ante esta situación, es imprescindible llevar a cabo una selección rigurosa del material emitido y de las grabaciones asociadas (^{Caldera-Serrano y Arranz Escacha, 2013: 18-19}). Por ejemplo, un breve segmento de un informativo puede estar respaldado por horas de grabación que deben ser cuidadosamente revisadas para determinar su valor potencial para usos futuros.

Esta tarea de selección de información en programas informativos recae en el documentalista audiovisual, quien decide si un material debe conservarse de forma permanente, temporal, o si debe eliminarse, siempre alineándose con las directrices establecidas por las unidades de documentación. Aunque estos criterios pueden variar en precisión (^{Hanford, 1986}), los documentalistas suelen disponer de un margen considerable para tomar decisiones sobre qué contenido preservar.

Los criterios de selección se establecen teniendo en cuenta las necesidades periodísticas actuales y futuras de la cadena, así como el uso que los periodistas de los informativos hacen de las imágenes. Igualmente se analiza su futuro valor para la comercialización de estos materiales (^{León-Moreno y Caldera-Serrano, 2010}). En algunos casos, los periodistas, bajo la dirección de la cadena, pueden influir directamente en la decisión de conservar ciertas imágenes. Esta decisión requiere una comunicación explícita con el departamento de documentación para asegurar que las imágenes seleccionadas no sean eliminadas (^{Caldera-Serrano y Arranz Escacha, 2013: 18}).

El proceso de selección es, sin duda, uno de los aspectos más complejos en la labor de los documentalistas en los medios de comunicación. Este proceso está condicionado por diversos factores, como el carácter público o privado del medio, y las motivaciones para la conservación del material audiovisual, que pueden variar significativamente. Además de los factores de su utilidad futura, y con consciencia de que los criterios periodísticos son fundamentales, existen cuestiones como el valor histórico del material, el valor especial por su unicidad, por ser imágenes que sirven para conservar tradiciones sociales, etcétera. El potencial de venta del material, por lo tanto, su valor económico, es un factor relevante en un momento en el que los archivos se están rentabilizando por la venta de material. Y sin duda, la selección de material por su valor patrimonial, tanto interna como de la sociedad en la que se enmarca, es un criterio que dirige la selección y el valor presente y futuro de las colecciones audiovisuales televisivas.

Los servicios de documentación existen para gestionar y optimizar el uso futuro del material, reduciendo así los costos de producción. La selección de material en programas informativos se enfoca en conservar aquello que podría ser útil para próximas producciones audiovisuales (^{Póveda-López, Caldera-Serrano y Polo-Carrión, 2010}). Además de esta función, es importante considerar la preservación del patrimonio audiovisual de la cadena, que a su vez contribuye al acervo cultural de un país (^{Hidalgo Goyanes, 2013}).

En las televisiones públicas y autonómicas suele conservarse todo el material emitido y una parte selecta del material no emitido, que se considera relevante. Esta selección sucede en un escenario donde existen pocas normativas legislativas, más allá de la obligación de conservar el material audiovisual emitido por un periodo de seis meses, por posibles requerimientos legales.

La selección implica discriminar entre los elementos que serán útiles y aquellos que no aportan valor, de acuerdo con las políticas de la empresa en el contexto de la conservación patrimonial. Sin embargo, establecer criterios de selección es complejo, ya que son definidos por cada unidad de documentación. La Federación Internacional de Archivos de Televisión (FIAT/IFTA) <https://fiatifta.org> es una entidad clave en la normalización de archivos audiovisuales y sugiere conservar todo lo emitido y todo lo grabado para emisión al menos durante cinco años. Aunque conservar el material emitido parece lógico, almacenar todo lo grabado genera un ‘ruido documental’ que dificulta la recuperación eficiente de la información. La FIAT/IFTA propone que la decisión sobre la eliminación del material debiera ser tomada por un equipo interdisciplinar, lo que aliviaría la carga de los documentalistas. No obstante, en la práctica, estos equipos pueden establecer pautas, pero no decidir qué material conservar.

^{Caldera-Serrano y Arranz Escacha (2013)} argumentan que una política de selección clara elimina la necesidad de negociaciones constantes con la dirección. Además, proponen que el proceso de eliminación de material debe estar bien reglamentado, considerando que muchos de estos materiales son únicos e irrepetibles. Finalmente, la creación de una política de selección clara debe considerar varios parámetros (^{Giménez Rayo, 2018: 50}): el entorno empresarial, las necesidades de los usuarios, la adecuación del archivo y el material a seleccionar.

El nuevo paradigma digital en la producción y conservación de noticias ha propiciado un aumento en la cantidad de materiales preservados, gracias a la reducción de costes y la eliminación de limitaciones espaciales, lo que a su vez ha mejorado el acceso a la información por parte de los periodistas de informativos, quienes ahora están más involucrados en la selección de contenido, favorecidos por el acceso digital y una mayor consciencia sobre la importancia de conservar materiales valiosos.

Resultados y análisis

La IA ha emergido como una herramienta poderosa para la automatización de procesos en la selección y clasificación de documentos, lo que permite gestionar grandes volúmenes de información de manera eficiente y precisa. Estos avances han sido posibles gracias a la integración de algoritmos avanzados de procesamiento de lenguaje natural (^{Ordóñez Palma y Gutiérrez García, 2023: 37}), aprendizaje automático y análisis semántico, que han encontrado aplicación en diversos sectores (^{Soto Ortigoza, Morillo Montoya y Monpué, 2024: 38}), como el legal, los recursos humanos, la investigación académica, el sector financiero, la administración pública, la medicina, entre otros.

La selección de documentos audiovisuales televisivos mediante IA representa un desafío tecnológico que requiere la integración de múltiples disciplinas. Estas tecnologías facilitan analizar, clasificar y seleccionar contenido audiovisual de manera eficaz, al tiempo de abordar las complejidades inherentes a la naturaleza multimodal de los datos audiovisuales.

A continuación, presentamos las principales tecnologías implicadas en este proceso y destacamos su relevancia en la automatización de la gestión de contenido televisivo.

El procesamiento del lenguaje natural (PLN) es fundamental para que los sistemas de IA comprendan y así procesen el lenguaje humano, tanto en texto como en audio. En el entorno de los documentos audiovisuales, el PLN sirve para transcribir diálogos y comentarios presentes en los vídeos, lo que permite identificar y clasificar contenido basado en palabras clave o temas (^{Jurafsky y Martin, 2022}). Esto es crucial en la producción de resúmenes automáticos de programas televisivos o en la extracción de fragmentos relevantes para su posterior análisis.

El reconocimiento automático del habla (RAH) convierte el habla en texto y es esencial para transcribir el contenido sonoro de los documentos audiovisuales y no solo abrevia el proceso de la transcripción, sino que también posibilita el análisis posterior de los diálogos, incrementando la eficiencia en la gestión del contenido (^{Graves, Mohamed y Hinton, 2013}). La combinación de PLN y RAH es particularmente útil en la clasificación de contenido basado en el diálogo, como en piezas de informativos televisivos o programas de entrevistas.

La identificación de sentimientos y contexto favorece la evaluación del tono y la emoción presentes en el contenido audiovisual. De igual manera, es crucial para la clasificación de documentos en función del sentimiento expresado y el contexto temático, lo que resulta práctico para segmentar la programación televisiva según el perfil de la audiencia (^{Cambria et al., 2020}); esto sería útil como apoyo para la selección.

La visión por computadora habilita a los sistemas de IA analizar y comprender imágenes y vídeos (^{Wang et al., 2023}). Esta tecnología incluye el reconocimiento de objetos, personas, escenas y acciones dentro del contenido audiovisual, lo que facilita el reconocimiento de escenas relevantes y la detección de rostros o logotipos en los vídeos (^{Goodfellow, Bengio y Courville, 2016}). Las aplicaciones de visión por computadora son extensas y se utilizan en la clasificación automática de contenido visual, permitiendo a las televisiones seleccionar automáticamente fragmentos que contienen elementos específicos de interés o controlar redundancias o similitudes.

El reconocimiento de objetos y escenas dentro del vídeo es un componente crucial de la visión por computadora, pues asiste en la identificación y etiquetado de objetos y escenarios específicos, lo cual contribuye a la clasificación del contenido basado en la presencia de ciertos elementos visuales (^{Simonyan y Zisserman, 2014}).

El análisis de audio, más allá de la simple transcripción, es también vital. Esta tecnología permite localizar y clasificar diferentes tipos de sonido, como música, efectos de sonido y cambios en la dinámica del audio, lo que contribuye a una clasificación más precisa del contenido audiovisual (^{Purwins et al., 2019}). Este tipo de análisis es útil en la selección de contenido musical o en la detección de momentos clave. La identificación por audio de los personajes implicados será muy útil para determinar la posible redundancia de la imagen, y la repetición de diálogo podrá facilitar la pista de material duplicado.

Las redes neuronales convolucionales integradas en la tecnología de aprendizaje profundo (^{Iman, Arabnia y Rasheed, 2023}; ^{Khoei, Slimane y Kaabouch, 2023}) son fundamentales para la extracción de características complejas y la clasificación de imágenes y vídeos (^{He, Seng y Ang, 2023}). Estas tecnologías asisten a la IA en el aprendizaje de patrones complejos en los datos visuales, aumentando la precisión en la selección y clasificación de contenido (^{LeCun, Bengio y Hinton, 2015}). Estas técnicas son ampliamente utilizadas en la segmentación de contenido televisivo por temáticas y en la mejora continua de los sistemas de recomendación.

La indexación y recuperación de información multimodal es otra tecnología clave que apoya a gestionar y acceder eficazmente a información de múltiples fuentes, como texto, audio y vídeo. Este enfoque facilita la búsqueda y selección de contenido audiovisual basado en una combinación de datos textuales y visuales, mejorando la eficiencia en la gestión de grandes volúmenes de datos (^{Atrey et al., 2010: 346}).

Finalmente, las tecnologías de almacenamiento y procesamiento de datos masivos son esenciales dada la gran cantidad de datos presentes en los documentos audiovisuales televisivos. Estas tecnologías permiten almacenar, procesar y analizar grandes volúmenes de información en tiempo real, asegurando la disponibilidad y accesibilidad del contenido para su selección (^{Zikopoulos et al., 2012: 5}).

Atiendo a los elementos planteados anteriormente y a una selección de lo que entendemos como las principales aplicaciones. A continuación, la Tabla 1 desarrolla una comparativa de las tecnologías y servicios contemplados.

Tabla 1 Servicios de IA para la selección de material audiovisual y sus tecnologías

	Servicios
Tecnologías	IBM Watson Media	Google Cloud Video Intelligence	Adobe Sensei	Veritone Digital Media Hub	Clarifai
Procesamiento del lenguaje natural (PLN)	✓	-	✓	✓	-
Reconocimiento automático del habla (RAH)	✓	✓	-	✓	-
Análisis de sentimientos y contexto	✓	✓	-	✓	-
Visión por computadora	✓	✓	✓	✓	✓
Reconocimiento de objetos y escenas	✓	✓	✓	✓	✓
Análisis de audio	✓	✓	✓	✓	✓
Aprendizaje profundo y redes neuronales convolucionales	✓	✓	✓	✓	✓
Indexación y recuperación de información multimodal	✓	✓	✓	✓	✓
Análisis de metadatos	✓	✓	✓	✓	✓
Aprendizaje automático	✓	✓	✓	✓	✓
Tecnologías de almacenamiento y datos masivos	✓	✓	✓	✓	✓

Fuente: elaboración del autor (2024)

Las aplicaciones analizadas en la Tabla 1 para la selección de documentos audiovisuales, atendiendo a los criterios planteados, se describen analizando diferentes parámetros, tales como sus peculiaridades, ventajas, inconvenientes, adaptación a lo audiovisual, requerimientos técnicos, coste y facilidad de uso. Por otro lado, la Tabla 2 presenta las características de cada servicio.

Tabla 2 Características de las aplicaciones seleccionadas

	IBM Watson Media	Google Cloud Video Intelligence	Adobe Sensei	Veritone Digital Media Hub	Clarifai
URL	https://www.ibm.com/es-es/products/video-streaming	https://cloud.google.com/video-intelligence	https://www.adobe.com/sensei.html	https://www.veritone.com/applications/digital-media-hub/	https://www.clarifai.com/
Características	Ofrece herramientas de análisis de vídeo basadas en IA, como transcripción automática, análisis de sentimiento, detección de objetos y reconocimiento de rostros.	Ofrece análisis avanzado de vídeo mediante aprendizaje automático, incluyendo detección de objetos, reconocimiento de texto y clasificación automática.	Plataforma integrada en la suite de Adobe, que permite la selección automatizada de clips, etiquetado de contenido y edición de vídeo basada en IA.	Plataforma de gestión de activos digitales con capacidades de IA para análisis de vídeo, búsqueda avanzada, transcripción y metadatos automáticos.	Plataforma de reconocimiento de vídeo que utiliza aprendizaje profundo, incluyendo etiquetado automático, detección de objetos y búsqueda de vídeos.
Ventajas	Alta precisión en la transcrición y análisis de contenido, integración con otras plataformas de IBM, soporte para múltiples idiomas.	Integración con otros servicios de Google Cloud, escalabilidad, y una API fácil de usar para desarrolladores.	Integración perfecta con otras herramientas de Adobe, como Premiere Pro y After Effects; interfaz de usuario intuitiva; fuerte soporte para la creación de contenido multimedia.	Herramienta integral para la gestión de grandes volúmenes de contenido audiovisual, análisis automatizado en tiempo real, buena integración con sistemas de transmisión.	Potente motor de IA con alta precisión en el reconocimiento de imágenes y vídeos, fácil integración mediante API, escalabilidad.
Inconvenientes	Costo elevado, complejidad en su configuración.	Requiere conocimiento técnico avanzado.	Requiere suscripción a la suite de Adobe, el costo es elevado para usuarios individuales o pequeñas empresas.	Costoso para pequeñas empresas.	Costoso para un uso extensivo, requiere conocimientos técnicos para una integración completa.
Adaptación AV	Muy alto, con soporte avanzado para diferentes formatos y tipos de contenido audiovisual.	Muy alto, con soporte para una amplia gama de formatos de vídeo y capacidades de análisis detalladas.	Alto, especialmente para usuarios que ya trabajan con la suite de Adobe.	Alto, diseñado específicamente para la gestión de contenido audiovisual.	Muy alto, con capacidades avanzadas de adaptación.
Requerimientos técnicos	Conexión a la nube de IBM, capacidad de almacenamiento en la nube, integracióncon otros sistemas.	Acceso a Google Cloud Platform, conocimientos de programación para la integración de API.	Requiere suscripción a Adobe Creative Cloud y equipo con especificaciones avanzadas.	Infraestructura en la nube o híbrida, capacidad de almacenamiento significativo, API para integración.	Plataforma Clarifai y capacidades de desarrollo para integrar la API.
Coste	Depende del uso.	Basado en el uso por minuto de vídeo procesado.	Parte de la suscripción a Adobe Creative Cloud.	Personalizado según las necesidades del usuario, con costos que varían considerablemente según el volumen.	Bajo, basado en el uso.
Facilidad de uso	Moderada, requiere capacitación.	Alta para usuarios con experiencia técnica. Puede usarse de manera básica sin configuración compleja.	Alta.	Moderada, requiere formación inicial para configuraciones avanzadas.	Alta para tareas básicas, pero requiere conocimientos técnicos para aprovechar todas las capacidades.
Idiomas	Más de treinta, incluido el español.	Más de cien, incluido el español.	Más de diez, incluido el español.	Más de cincuenta, incluido el español.	Más de veinte, incluido el español.

Fuente: elaboración del autor (2024)

Identificamos al servicio IBM Watson Media como el más completo, ya que su incorporación de tecnologías clave, como procesamiento del lenguaje natural, reconocimiento automático del habla, análisis de sentimiento y contexto, y visión por computadora, se completa con funcionalidades que lo convierten en una herramienta versátil y eficaz, pudiéndose integrar con otros sistemas de IBM. Aunque trabaja con más de treinta idiomas diferentes, el subtitulado y transcripción automática es limitado.

Seguido de Veritone Digital Media Hub, ya que esta abarca la tecnología para la selección de documentos audiovisuales, incluyendo procesamiento del lenguaje natural, reconocimiento automático del habla, visión por computadora y redes neuronales convolucionales. Su fuerte enfoque en la gestión de grandes volúmenes de contenido y su capacidad para el análisis en tiempo real lo sitúan como una excelente opción. Soporta más de cincuenta idiomas al integrarse con sistemas de Microsoft Azure y Google Cloud.

Google Cloud Video Intelligence es una potente herramienta con una sólida capacidad de análisis de vídeo; engloba aprendizaje profundo y visión por computadora. Aunque carece de algunas características avanzadas como el procesamiento del lenguaje natural y el reconocimiento automático del habla, su integración con Google Cloud y la facilidad de uso la convierten en una alternativa válida. Su flexibilidad y escalabilidad, en cierta manera, compensa algunas de sus carencias. Soporta más de cien idiomas, con amplio soporte en tareas de transcripción y análisis de voz.

Adobe Sensei resulta útil para usuarios acostumbrados al ecosistema Adobe. Ofrece visión por computadora y análisis de audio de alta calidad, y su integración con herramientas como Premiere Pro lo hacen muy aprooiado para la edición y gestión. Sin embargo, su ausencia de reconocimiento automático del habla y análisis de sentimiento limita su capacidad para la selección de documentos audiovisuales en un entorno televisivo. Su enfoque está más orientado a la creación de contenido que a la gestión y selección automatizada, lo que lo sitúa en la cuarta posición. El número de idiomas que ofrece es limitado ya que se integra en Adobe Transcription Service; su mayor potencial está en el inglés y el español.

Y la menos recomendable de la selección es Clarifai Video Recognition. Poderosa herramienta para el reconocimiento y clasificación de contenido visual, pues usa aprendizaje profundo y redes neuronales. Aunque, debido a que su enfoque está más limitado al análisis visual, carece de las capacidades de procesamiento del lenguaje natural, reconocimiento automático del habla y análisis de sentimiento. Esto restringe su aplicabilidad en la selección de documentos audiovisuales en un entorno televisivo complejo.

Por lo tanto, IBM Watson Media y Veritone Digital Media Hub destacan por su robustez y capacidad para manejar un espectro completo de tecnologías avanzadas necesarias en la selección de documentos audiovisuales televisivos. Google Cloud Video Intelligence y Adobe Sensei ofrecen soluciones potentes, pero con ciertas limitaciones en cuanto a la amplitud de tecnologías. Clarifai Video Recognition, aunque muy eficaz en su nicho, carece de varias herramientas críticas, lo que reduce su utilidad en comparación con las otras opciones.

Conclusiones

En un entorno donde la cantidad de contenido audiovisual crece exponencialmente, la selección documental eficiente es fundamental para evitar la sobrecarga de información y garantizar que solo los documentos más relevantes ingresen al sistema documental. Esto asegura que los recursos de almacenamiento y procesamiento se utilicen de manera óptima y que los usuarios finales reciban contenidos alineados con sus necesidades (^{Giménez Rayo, 2007}). La selección correcta no solo optimiza la organización interna, sino que también maximiza la satisfacción del usuario, mejorando así la calidad del servicio y la toma de decisiones basadas en información precisa.

La IA ha transformado significativamente la manera en que se maneja la selección de documentos audiovisuales. Herramientas avanzadas como IBM Watson Media y Veritone Digital Media Hub han integrado múltiples tecnologías, como el procesamiento del lenguaje natural, el reconocimiento automático del habla y la visión por computadora para automatizar tareas que anteriormente requerían intervención humana exhaustiva. Empero, a pesar de tales avances, estas herramientas aún enfrentan desafíos y limitaciones. Es por lo tanto complejo realizar una identificación de la mejor aplicación o servicio de IA para las televisiones, ya que en el marco de la oferta habrá de optarse por aquella que más se adapte a los requerimientos del servicio de documentación de la cadena.

La precisión en la clasificación de contenidos, el análisis contextual y la capacidad de adaptarse a nuevas formas de contenido son áreas en las que la IA necesita seguir desarrollándose. Las herramientas actuales, aunque poderosas, todavía no alcanzan una autonomía completa y requieren ajustes constantes y supervisión para garantizar su efectividad.

El avance en tecnologías como las redes neuronales convolucionales y la indexación multimodal requiere una formación continua tanto para los profesionales de la documentación como para aquellos involucrados en el desarrollo tecnológico. La automatización de procesos que hasta hace poco eran impensables, como el análisis de sentimiento en contenido audiovisual o la recuperación de información en tiempo real, demanda una actualización constante de habilidades. Los profesionales en estos campos deben estar preparados para trabajar con sistemas complejos y adaptarse a las nuevas herramientas que emergen continuamente. Esta formación no solo incluye la adquisición de conocimientos técnicos, sino también el desarrollo de una comprensión profunda de cómo estas tecnologías pueden aplicarse de manera efectiva en entornos documentales.

Resulta difícil determinar qué desarrollos están haciendo las cadenas, pues son muy recelosos en la comunicación de aplicaciones que aún están en desarrollo y no informan, en muchos casos, su existencia hasta después de ser testadas y validadas. Por medio de contactos off the record somos conocedores de que algunas de las cadenas más importantes de España aún no están desarrollando la IA para la selección, pese a eso, parece evidente que existe una carrera hacia la asunción de esta tecnología.

La IA ofrece grandes posibilidades para la gestión y optimización de archivos audiovisuales televisivos, donde el volumen de datos y la complejidad de las operaciones demandan soluciones efectivas. La automatización del etiquetado y clasificación de contenido por medio de sistemas de reconocimiento de imágenes, audio y lenguaje natural parece lo más factible en el corto plazo. Estos desarrollos facilitarán la búsqueda y recuperación rápida de material, enriqueciendo la eficacia en la gestión de archivos que tradicionalmente requerían un gran esfuerzo humano. Igualmente ayudará a la generación de datos enriquecidos, ya que otorgará descripciones más precisas y en varios niveles. Otro reto de la IA será la mejora de la preservación digital y la restauración automática.

Se ha de ser conscientes que estos desarrollos son tan futuribles como la capacidad de inversión en investigación y desarrollo en las empresas audiovisuales televisivas. Los costos siguen siendo elevados; es necesaria la inversión en infraestructura, desarrollo de software y formación de los documentalistas. No obstante, a largo plazo, los costes operativos de los archivos de televisión son más rentables y, sin lugar a dudas, más eficientes desde el punto de vista documental.

Agradecimientos

Esta investigación contó con el apoyo de la Junta de Extremadura y Fondos FEDER “Una manera de hacer Europa” [Grupo de Investigación QUINARI SEJ013 GR18130].

REFERENCIAS

Atrey, Pradeep, Anwar Hossain, Abdulmotaleb El Saddik y Mohan Kankanhalli. 2010. “Multimodal Fusion for Multimedia Analysis: A Survey”. Multimedia Systems 16 (6): 345-79. https://doi.org/10.1007/s00530-010-0182-0 [ Links ]

Bazán-Gil, Virginia. 2023. “Artificial Intelligence Applications in Media Archives”. Profesional de la Información 31 (5), e320517. https://doi.org/10.3145/epi.2023.sep.17 [ Links ]

Caldera-Serrano, Jorge, y Pilar Arranz Escacha . 2012. Documentación audiovisual en televisión. Barcelona: Editorial Universidad Oberta de Cataluña. [ Links ]

Caldera-Serrano, Jorge, y Pilar Arranz Escacha . 2013. “Cambios en los métodos de selección documental en los sistemas de información digital en las televisiones”. Investigación Bibliotecológica: archivonomía, bibliotecología e información 27(60): 15-26. https://doi.org/10.1016/S0187-358X(13)72541-3 [ Links ]

Cambria, Erik, Yang Li, Frank Xing, Soujanya Poria y Kenneth Kwok. 2020. “SenticNet 6: Ensemble Application of Symbolic and Subsymbolic AI for Sentiment Analysis”. CIKM ’20: Proceedings of the 29th ACM International Conference on Information and Knowledge Management, 105-14. Nueva York: Association for Computing Machinery. https://doi.org/10.1145/3340531.3412003 [ Links ]

Giménez Rayo, Mabel. 2007. Documentación audiovisual de televisión / La selección del material. Gijón: Ediciones Trea. [ Links ]

Giménez Rayo, Mabel. 2018. “La selección del material audiovisual de televisión en el entorno digital: perspectivas y realidad”. Documentación de las Ciencias de la Información 41: 47-59. https://doi.org/10.5209/DCIN.61456 [ Links ]

Goodfellow, Ian, Yoshua Bengio y Aaron Courville. 2016. Deep Learning. Massachusetts: Massachusetts Institute of Technology Press. [ Links ]

Graves, Alex, Abdel-rahman Mohamed y Geoffrey Hinton. 2013. “Speech Recognition with Deep Recurrent Neural Networks”. Prepublicación Arxiv. https://doi.org/10.48550/arXiv.1303.5778 [ Links ]

Hanford, Anne. 1986. “Normas recomendadas y procedimientos para seleccionar material de televisión”. En Panorama de los archivos audiovisuales / Contribución a la puesta al día de las técnicas de archivo internacionales, 125-30. Madrid: Servicio de Publicaciones de RTVE. [ Links ]

He, Yibo, Kah Phooi Seng y Li Minn Ang. 2023. “Generative Adversarial Networks (GANs) for Audio-Visual Speech Recognition in Artificial Intelligence IoT”. Information 14 (10), 575. https://doi.org/10.3390/info14100575 [ Links ]

Hidalgo Goyanes, Paloma. 2013. “Patrimonio audiovisual en televisión”. En Gestión del patrimonio audiovisual en medios de comunicación, coordinado por Juan Carlos Marcos Recio, 53-82. Madrid: Editorial Síntesis. [ Links ]

Iman, Mohammadreza, Hamid Reza Arabnia y Khaled Rasheed. 2023. “A Review of Deep Transfer Learning and Recent Advancements”. Technologies 11 (2), 40. https://doi.org/10.3390/technologies11020040 [ Links ]

Incio Flores, Fernando Alain, Dulce Lucero Capuña y Sánchez, Ronald Omar Estela Urbina, Miguel Ángel Valles Coral, Segundo Edilberto Vergara Medrano y Duberli Geomar Elera Gonzáles. 2022. “Inteligencia artificial en educación: una revisión de la literatura en revistas científicas internacionales”. Apuntes Universitarios 12 (1): 353-72. https://doi.org/10.17162/au.v12i1.974 [ Links ]

Jurafsky, Dan, y James Martin. 2022. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition with Language Models (manuscrito en línea), 3.ª ed. https://web.stanford.edu/~jurafsky/slp3/ [ Links ]

Khoei, Tala Talaei, Hadjar Ould Slimane y Naima Kaabouch. 2023. “Deep Learning: Systematic Review, Models, Challenges, and Research Directions”. Neural Computing and Applications 35: 23103-124. https://doi.org/10.1007/s00521-023-08957-4 [ Links ]

Larsson, Stefan. 2020. “On the Governance of Artificial Intelligence Through Ethics Guidelines”. Asian Journal of Law and Society 7 (3): 437-51. https://doi.org/10.1017/als.2020.19 [ Links ]

LeCun, Yann, Yoshua Bengio y Geoffrey Hinton. 2015. “Deep Learning”. Nature 521: 436-44. https://doi.org/10.1038/nature14539 [ Links ]

León-Moreno, José Antonio, y Jorge Caldera-Serrano. 2010. “Análisis de la comercialización de los archivos audiovisuales televisivos por la red: posibilidades e implicaciones”. Investigación Bibliotecológica: archivonomía, bibliotecología e información 24 (52): 217-35. https://doi.org/10.22201/iibi.0187358xp.2010.52.27461 [ Links ]

Ordóñez Palma, María José, y Jimmy Leonardo Gutiérrez García. 2023. “Prototipos de procesamiento de lenguaje natural bajo el modelo de técnicas de aprendizaje automático”. Journal TechInnovation 2 (2): 34-43. https://doi.org/10.47230/Journal.TechInnovation.v2.n2.2023.34-43 [ Links ]

Ponce Gallegos, Julio César, Aurora Torres Soto, Fátima Sayuri Quezada Aguilera, Antonio Silva Sprock, Ember Ubeimar Martínez Flor, Ana Casali, Eliana Scheihing, et al. 2014. Inteligencia artificial. Iniciativa Latinoamericana de Libros de Texto Abiertos. http://hdl.handle.net/2133/17686 [ Links ]

Póveda-López, Inés del Carmen, Jorge Caldera-Serrano y José-Antonio Polo-Carrión. 2010. “Definición del objeto de trabajo y conceptualización de los sistemas de información audiovisual en televisión”. Investigación Bibliotecológica: archivonomía, bibliotecología e información 24(50): 15-34. https://doi.org/10.22201/iibi.0187358xp.2010.50.21409 [ Links ]

Purwins, Hendrik, Bo Li, Tuomas Virtanen, Jan Schlüter, Shou-Yiin Chang y Tara Sainath. 2019. “Deep Learning for Audio Signal Processing”. IEEE Journal of Selected Topics in Signal Processing 13 (2): 206-19. https://ieeexplore.ieee.org/document/8678825 [ Links ]

Rouhiainen, Lasse. 2018. Inteligencia artificial / 101 cosas que debes saber hoy sobre nuestro futuro. Barcelona: Alienta Editorial. [ Links ]

Sánchez Rosado, Juan Carlos, y Mikel Díez Parra. 2022. “Impacto de la inteligencia artificial en la transformación de la sanidad: beneficios y retos”. Economía Industrial (423): 129-44. https://dialnet.unirioja.es/servlet/articulo?codigo=8750554 [ Links ]

Simonyan, Karen, y Andrew Zisserman . 2014. “Very Deep Convolutional Networks for Large-Scale Image Recognition”. Prepublicación Arxiv. https://doi.org/10.48550/arXiv.1409.1556 [ Links ]

Soto Ortigoza, Maricamen, Robert Morillo Montoya y Galí Monpué. 2024. “Desentrañando el lenguaje: impacto de la PNL en la era de la inteligencia artificial”. Revista Saperes Universitas 7 (1): 30-47. https://doi.org/10.53485/rsu.v7i1.415 [ Links ]

Wang, Haotian, Yuxuan Xi, Hang Chen, Jun Du, Yan Song, Qing Wang, Hengshun Zhou, Chenxi Wang, Jiefeng Ma, Pengfei Hu, Ya Jing, Shi Cheng, Jie Zhang y Yuzhe Weng. 2023. “Hierarchical Audio-Visual Information Fusion with Multi-Label Joint Decoding for MER 2023”. Prepublicación Arxiv.https://doi.org/10.48550/arXiv.2309.07925 [ Links ]

Zikopoulos, Paul, Chris Eaton, Dirk deRoos, Thomas Deutsch y George Lapis. 2012. Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data. Nueva York: McGraw-Hill. https://personal.utdallas.edu/~axn112530/cs6350/Understanding_BigData.pdf [ Links ]

Para citar este texto:

Caldera-Serrano, Jorge. 2025. “Comparativa de aplicaciones de inteligencia artificial para la selección documental en los archivos televisivos”. Investigación Bibliotecológica: archivonomía, bibliotecología e información 39 (103): 67-84. http://dx.doi.org/10.22201/iibi.24488321xe.2025.103.58963

Recibido: 19 de Agosto de 2024; Aprobado: 17 de Febrero de 2025

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons