Este blog ha sido creado para la asignatura Web Social del máster de Bibliotecas y Servicios de Información Digital de la UCIIIM

jueves, 2 de junio de 2011

Los archivos de Twitter en la Biblioteca del Congreso





La noticia de la adquisición de los archivos de Twitter por la Libray of Congress  con el objetivo de preservarlos y garantizar el acceso a futuros investigadores (publicada el 14/4/2010) me parece, de entrada, muy interesante ya que facilitará una visión diferente de determinados acontecimientos o hechos históricos. Podrá proporcionar tanto el punto de vista del autor del mensaje, como la reacción de su entorno más inmediato e incluso del resto de sus seguidores ubicados en cualquier rincón del mundo.

De este modo, obtendríamos una cierta perspectiva sociológica; estaríamos hablando de interpretar posibles datos históricos a partir de anécdotas, de reflexiones producto de situaciones cotidianas, de reacciones ante determinados desastres naturales o de protestas sociales, entre muchas otras posibilidades. Por lo tanto, además de valor histórico, los archivos poseerían un valor sociológico e incluso cierto interés desde el punto de vista de la presencia o evolución de nuevos medios de comunicación como Twitter, cuya información es volátil. Dos ejemplos clarísimos de su utilidad en este sentido son la Primavera Arabe o el movimiento 15 M o Democracia Social, que ya cuenta incluso con su propio centro de documentación.

Sin embargo, creemos que también es necesario considerar otros aspectos:

-   El conjunto de tweets no representa la opinión de diferentes muestras de población sino la de un segmento concreto, es decir, la del grupo de individuos familiarizados con las redes sociales.

-    De darse una selección en el material (a la hora de crear la base de datos de acceso universal) siempre perdurará un punto de vista subjetivo; en este caso, el del propio país que acoge a la biblioteca. Si la Library of Congress ha bloqueado el acceso a WikiLeaks desde sus ordenadores, ¿podemos estar seguros de que proporcionará acceso a material del archivo contrario o crítico con su propio gobierno?

-    El proyecto se subvenciona con dinero público ¿está realmente justificado un gasto de esta envergadura en un momento de recesión económica como éste?

- ¿Qué uso se le va a dar a la información? ¿Exclusivamente para la investigación o intervendrán otros factores o intereses desconocidos?

-   ¿Quién va ser el beneficiario de los derechos de explotación de los datos?

-  ¿Se va a considerar la posibilidad de catalogar de algún modo las hashtags como colección? En mi opinión, pueden proporcionar mucha más información que cada uno de los tweets por separado, puesto que en la mayoría de los casos estos pueden quedar descontextualizados.

-    Suponemos que también habrán tenido en cuenta que en la inmensa mayoría de los tweets aparece una url que complementa o apunta hacia una información determinada cuyo contenido también habrá que preservar para garantizar su coherencia en el futuro, ¿no?


En definitiva: sí a la preservación y a la clasificación y expurgo, pero por encima de todo, a la ética de la información.

7 comentarios:

  1. Buena reflexión, Susanna. Me parecen muy interesantes las dudas que planteas, el tema de WikiLeaks es espinoso, pero llevas toda la razón (como archivo de biblioteca debería registrar TODAS las partes), y en cuanto a la colección de hashtags, totalmente de acuerdo, creo que tendría mucho más valor.

    ResponderEliminar
  2. Una vez más, agradecerte tu visita!

    ResponderEliminar
  3. Sobre la catalogación de los hashtags: hay que tener en cuenta que, dado el número de hashtags que se usan a diario, es absolutamente inviable hacer una catalogación manual. Sería necesario diseñar algún sistema de clasificación automatizada que extrajese las hashtags más frecuentes, las que más a menudo se usan juntas, etc.

    En caso de que no se establezca ese sistema, la recuperación sería más compleja pero no imposible: lanzando una búsqueda por palabra clave y recuperando una primera serie de tweets, podríamos ir detectando hashtags, y a partir de ahí lanzar búsquedas sucesivas por hastags, y así ir afinando la búsqueda. Sería bastante más laborioso, pero sería una opción.

    En todo caso, esto son cuestiones que siempre pueden plantearse a posteriori: una vez que se dispone del archivo completo de tweets, siempre pueden diseñarse aplicaciones que hagan clasificación automática, etc. Pero lo prioritario es conservar los tweets, que si no desaparecerán en poco tiempo, y los instrumentos de clasificación del archivo pueden irse elaborando con más tiempo y más presupuesto.

    El tema de preservar las páginas enlazadas, en lo cual tienes razón, es mucho más complejo: implicaría preservar todo Internet, con las distintas versiones que pueda ir teniendo cada página. Eso sí que será imposible en la práctica, y más hoy en día, con las tecnologías de páginas web dinámicas, de web 2.0 con contribuciones de los usuarios, etc. Sería lo deseable para poder hacer en el futuro una investigación completa, en efecto, pero eso sí que me parece un proyecto inabarcable; la conservación de todos los tweets generados ya va a ser compleja y va a exigir unos recursos importantes.

    Respecto a que el archivo de tweets no representa a toda la población, eso por supuesto. Pero su utilidad principal sería para realizar estudios sobre el papel de las redes sociales en determinados fenómenos, no para estudiar a la población en su conjunto. Será una herramienta útil siempre que los investigadores la conozcan y sean conscientes de esas limitaciones; que es justamente lo que ocurre con cualquier otro documento de archivo que puedan utilizar los historiadores profesionales.

    ResponderEliminar
  4. A mí también me resulta interesante ver como la Library of Congress resolverá el tema de los tweets que los usuarios utilizamos para informar sobre determinas noticias, herramientas, etc., por medio de la inclusión de URLs ya que todos hemos experimentado en alguna ocasión la necesidad de utilizar una determinada URL y comprobar que con el paso del tiempo está en desuso, ha desparecido, etc.

    Yo, soy optimista y creo que con la adquisición del archivo asistiremos a nuevas líneas de investigación muy interesantes y que estoy segura nos sorprenderá no solo por los resultados que se puedan obtener sino también por las técnicas que los expertos investigadores puedan utilizar.

    Un saludo

    ResponderEliminar
  5. Luis,

    Esperemos que en un futuro (no demasiado lejano) se puedan catalogar hashtags y conservar las páginas enlazadas...
    Todavía recuerdo como Jesús Robledano en la asignatura de Digitalización y Preservación insistía en la necesidad de preservar tanto el documento original como cualquier objeto digital asociado a él, con el fin de garantizar su coherencia o incluso su validez (pensemos en las firmas digitales, por ejemplo)

    Gracias por comentar!

    ResponderEliminar
  6. Maria José,

    Comparto tu actitud optimista, y también espero que el archivo nos depare sorpresas!

    Gracias por pasar!

    ResponderEliminar
  7. Cecilia:comparto contigo tus cuestionamientos, que me parecen muy válidos y también las aportaciones de Isa, Luis y María José: de hecho, el debate generado en los comentarios de los posts es imprescindible para nuestro aprendizado!
    Pero, más que nada, me gustó el bies sociologico que das al hecho... creo que el valor que pueden llegar a tener los tuits en el futuro historicamente es aún inmensurable, y por eso es tan importante la preservación de los datos contenidos en cada uno de ellos, junto a sus enlaces, obvio.
    Salu2!

    ResponderEliminar