12 millones de imágenes históricas en Flickr y sin copyright

Redes Sociales

Por Sophimania Redacción
29 de Agosto de 2014 a las 17:44
Compartir Twittear Compartir
12 millones de imágenes históricas en Flickr y sin copyright

Un académico estadounidense, Kalev Leetaru, está creando una base de datos de 12 millones de imágenes históricas sin copyright. Hasta el momento ha subido 2,6 millones de fotos a Flickr, que son investigables gracias a las etiquetas que se han añadido de forma automática.

 

Las fotos y dibujos provienen de más de 600 millones de páginas escaneadas de libros de la biblioteca en la organización Internet Archive. Las imágenes han sido de difícil acceso hasta ahora.

 

Sr. Leetaru dijo que hasta ahora los proyectos de digitalización se habían centrado en las palabras y las imágenes ignoradas.

 

"Durante todos estos años todas las bibliotecas han ido digitalizando sus libros, las han estado subiendo como archivos PDF o de texto trabajos de búsqueda", dijo a la BBC.

 

"Ellos se han centrado en los libros como una colección de palabras. Esto invierte eso. Estirar la mitad de un milenio, es increíble para ver la gama total de las imágenes y cómo las representaciones de las cosas han cambiado con el tiempo.

 

"La mayoría de las imágenes que se encuentran en los libros no se encuentran en ninguna de las galerías de arte del mundo - las copias originales han sido hace mucho tiempo."

 

Las imágenes van desde el año1500 hasta 1922, cuando las restricciones de derechos de autor entrón en juego.

 

1fli1

 

Programa Piggyback

 

 

Sr. Leetaru comenzó a trabajar en el proyecto, mientras que la investigación de la tecnología de comunicaciones en la Universidad de Georgetown en Washington DC, como parte de una beca patrocinada por Yahoo, el dueño del servicio para compartir fotos Flickr.

 

Para lograr su objetivo, el Sr. Leetaru escribió su propio software para evitar la forma en que los libros originalmente habían sido digitalizados.

 

El Archivo de Internet había utilizado un programa de reconocimiento óptico de caracteres (OCR) para analizar cada uno de sus 600 millones de páginas escaneadas con el fin de convertir la imagen de cada palabra en búsquedas de texto.

 

Como parte del proceso, el software reconoce qué partes de una página eran las imágenes con el fin de deshacerse de ellos. El código del señor Leetaru utiliza esta información para volver a las exploraciones originales, extraer las regiones que el programa OCR había ignorado, y luego guardar cada uno como un archivo separado en el formato de imagen JPEG.

 

El software también copió el título para cada imagen y el texto de los párrafos anteriores y posteriores en el libro. Cada JPEG y su texto asociado se envió a una nueva página de Flickr, que permite al público encontrarlas utilizando la herramienta de búsqueda del sitio.

 

"Creo que una de las cosas más grandes que la gente va a hacer es viajar en el tiempo a través de las imágenes", dijo el Sr. Leetaru.

 

Se puede ver un avance cultural y social a lo largo de los años al mirar las imágenes,  por ejemplo al buscar la palabra “ferrocarril”, “las primeras imágenes que se trataba la innovación y el progreso que se va a cambiar el mundo, entonces ves su evolución, ya que se convierte en parte de la vida cotidiana."

 

1fli2

 

 

El sueño de enriquecer todas las páginas

 

Los archiveros dijeron que estaban impresionados con el proyecto.

 

"Encontrar imágenes dentro de los textos y el etiquetado de las grandes colecciones de imágenes son muy difíciles", dijo el Dr. Alison Pearn, un archivero mayor de la Universidad de Cambridge y director asociado del Proyecto de Correspondencia Darwin.

 

"Esta es una forma inteligente de proporcionar la cantidad y la capacidad de búsqueda, y es genial que esté disponible libremente para que cualquiera lo use. La identificación de la imagen ha recuperado cosas como sellos de la biblioteca y garabatos en los márgenes, y el etiquetado es un poco impredecible, pero la investigación ha sido siempre, al menos en parte, sobre la serendipia, y quién sabe lo que la gente hará con ello. "

 

La propia ambición del señor Leetaru da como resultado una alianza con la más famosa enciclopedia de internet una vez que su proyecto esté terminado el próximo año.

 

"Lo que quiero ver es ... Wikipedia tiene un día nacional de ir a través de este para ilustrar los artículos de Wikipedia," dijo. “Tome una página al azar sobre un evento histórico y que probablemente hay una buena probabilidad de que usted va a encontrar una imagen en la que lleva aquí de alguna manera en ese evento o lugar. Ser capaz de enriquecer básicamente eso sería enorme."

 

Agregó que también planea ofrecer su código a otros.

 

"Cualquier biblioteca podría repetir este proceso", explicó. “Eso es realmente mi esperanza, que las bibliotecas de todo el mundo lleva este mismo proceso de sus libros digitalizados de ampliar constantemente el universo de las imágenes."

 

Fuente: BBC


Compartir Twittear Compartir