4.5. Bancos de imágenes y sonido en la Web
Lluís Codina
Las imágenes en particular y los documentos audiovisuales en general constituyen una de las nuevas fronteras de la Documentación. Todo parece indicar que esa importancia no ha hecho más que empezar y que, en el futuro, veremos un aumento de actividad sin precedentes en este terreno, porque muchos actores potenciales del sector estaban necesitando la oportunidad de difusión de sus fondos audiovisuales que solamente podía proporcionar Internet.
Es necesario diferenciar dos conceptos fundamentales: bancos de imágenes y motores de indización.
Los bancos de imagen y sonido en Internet, contienen (o proporcionan acceso directo a colecciones bien definidas de documentos originales, no solamente a su descripción. Por lo tanto, contienen documentos secundarios (referencias) y más documentos primarios (o sea, el documento en sí mismo). Los documentos son icónicos, fotografías principalmente (pero no únicamente), y/o sonidos: transcripciones de programas de radio y televisión o efectos sonoros. La empresa productora de la base de datos es propietaria o es depositaria de las colecciones de imágenes y sonido o actúa por convenio formal con los propietarios de las imágenes y sonidos.
Los motores de indización de imágenes y sonido, indizan documentos de la WWW que contienen ficheros de imagen o sonido. No producen documentos secundarios. No mantienen ninguna relación con los propietarios de las imágenes y sonidos.
Con el impulso de la Web 2.0, ha aparecido una categoría intermedia, los repositorios o depósito digitales. No son exactamente bases de datos porque carecen de algunos elementos típicos de estas, como los registros con tratamiento documental profesional. Pero tampoco son motores, poque tienen control sobre la colección, aunque parcial, porque dependen de la actividad de los usuarios, y en los mejores casos, pero no siempre, los derechos de propiedad están bien establecidos. Los mejores ejemplos son YouTube (para vídeo) y Flickr (para imagen).
Existe una tipología muy diversa de bancos de datos que no se analizará aqui. Lo que nos interesa resaltar es que en el banco de imágenes, cada una de las imágenes que formen parte de la colección habrá sido seleccionada y filtrada previamente de acuerdo con algún criterio de oportunidad o de calidad, y cada una de las imágenes digitalizadas quedará asociada a un registro que contiene una descripción de los aspectos formales y semánticos de la imagen. Cada uno de los términos o palabras de ese registro será un punto de acceso a la imagen.
En un banco de imágenes, las imágenes entrarán a formar parte del sistema a partir de alguna clase de proceso de selección o adquisición. Serán adquiridas de acuerdo con alguna política de selección y adquisición. Posteriormente, serán registradas, descritas y digitalizadas siguiendo el proceso habitual de la cadena documental.
Los mejores centros de producción de bancos de imágenes utilizan modelos de registro que contienen hasta cinco grandes conjuntos de atributos o campos,
Conjunto de campos n. 1 Datos de identificación: autor, fecha, número, etc.
Conjunto de campos n. 2 Datos de descripción formal: cromatismo, formato, tipo de plano, ángulo, enfoque, estilo, género, etc. En general, estos campos podrán ser controlados con algún cuadro de clasificación o lista cerrada de valores admitidos.
Conjunto de campos n. 3 Datos de descripción de las características técnicas del soporte: tipo de fotografía, emulsión o soporte, clase y dimensiones del original, estado de conservación, etc.
Conjunto de campos n. 4 Datos de descripción semántica que, a su vez, se pueden dividir en dos subconjuntos de campos (no siempre diferenciados de forma explícita):
- Elementos icónicos . Los elementos icónicos son las cosas que podemos ver en la fotografía. Por ejemplo, seres vivos (personas, animales, cosas), cosas inanimadas (coches, piedras), elementos del paisaje (nubes, árboles), etc. Corresponde, si se quiere, al nivel de la denotación, o "lo que veo".
- Elementos conceptuales . Los elementos conceptuales son las ideas, conceptos, connotaciones, sentimientos, sensaciones, etc., que se desprenden de las imágenes. Corresponde al nivel de la denotación, o "lo que sé".
Conjunto de campos n. 5 Datos de control y administración: fecha de alta, fecha de modificación, número de registro, etc.
Los motores de búsqueda de documentos audiovisuales, el acceso a la información es exactamente la misma que para encontrar documentos. Copian el texto de las sedes web como paso previo para crear su índice. Dicho texto está codificado en HTML.
Como cada formato audiovisual posee unas extensiones bien determinadas, es fácil saber si el objeto es un sonido (wav), una imagen (gif, jpg), una imagen animada (avi), etc.
Ejemplos de bancos audiovisuales:
- Corbis
- Age Fotostock
- FindSounds
- Microstock
La Documentación audiovisual tiene aplicaciones potenciales de enorme valor en sectores como la salud, el arte, la museística y la comunicación social, por mencionar solamente algunos de ellos.