Catálogo de Amazon, Plegado de Información, Visualización de Información y conocimiento
Amazon catalog, information folding, information visualization and knowledge
Automatic translation of the text to english
Chris Harrison a partir de de un conjunto de datos proporcionados por Aaron Swartz en enero de 2008 de más de 700.000 libros de Amazon y más de 10 millones de relaciones temáticas entre los mismos hizo un mosaico visual de las portadas digitalizadas asignando a cada portada un código de color. Los resultados fueron algunas de las espectaculares imágenes que podéis ver más abajo.
Éstas, son un bellísimo ejemplo de:
- Comparativas informativas de múltiples pequeños. Si descendemos a una microlectura informativa en la portada de cada libro están explícitas entre 2 y 4 variables informativas, quizá más: título, autor, editorial y colección, que están implícitas en la base de datos de Amazon o de cualquier biblioteca y que son utilizadas para la recuperación de información en los OPACs. El código de color correspondiente a cada temática asigna una variable informativa nueva al mismo tiempo que constituye una potente capa explícita de conocimiento que la relaciona con las cuatro anteriores. Al menos y dependiendo de la información recogida en cada portada de cada libro tendremos entre 2 y 5 (o más) variables, facetas o dimensiones informativas recogidas en una imagen plana bidimensional.
- Pero la verdadera potencia se encuentra en el Plegado de Información (el término es mío). El mundo digital permite plegar la información de múltiples formas, ya sea mediante técnicas de zoom inmersivo ya mediante la superposición de capas como sucede con cualquier combo desplegable o con cualquier checkbox que activa una capa informativa superpuesta a un mapa o imagen como sucede en los sistemas de información geográficos. Nos ofrece muchas mas posibilidades a la hora de presentar un número N de variables informativas que la tierra plana que es el papel.
Aumentando el nivel de zoom, vamos haciendo explícito conocimiento que permanecía oculto bajo pequeños grupos de datos o conjuntos informativos (múltiples pequeños):

y disminuyéndolo podemos inferirlo de agrupaciones arbitrariamente definidas:

aquí por ejemplo, la temática entretenimiento:

o a nivel global del gigantesco conjunto de información que es la base de datos completa. Los datos de por sí no valen nada si nos somos capaces de extraer información de ellos e inferir y explicitar conocimiento. Las técnicas de Visualización de Información nos proporcionan la herramienta para ello.

Ahora imaginemos un escenario en el que por citar tan sólo un ejemplo como otro cualquiera, durante un discurso a la presidencia de un país y en tiempo real o a la finalización del mismo entre dos candidatos a presidente, un buscador recibiese 8 millones de consultas por minuto sobre lo que están hablando o sobre el debate producido y fuera posible extraer el conocimiento del impacto de las declaraciones realizadas en tiempo real o diferido 24 horas después.
¿Francamente interesante verdad? Y eso, que la política es un campo como otro cualquiera. En esto están trabajando algunos buscadores. Al menos y como comentó Nikesh Arora, Google.
¿Se pueden hacer cosas más espectaculares? Sí, dado que como destacaba más arriba estamos manejándonos en una interfaz bidimensional. Mediando un entorno digital no tenemos porqué reducirnos a las dos dimensiones física de altura y anchura ni a la codificación de variables por los recursos tradicionales de texto o diseño de información explicitados por Tufte, Wong o mucha más gente. Para ello, son mucho más interesantes los entornos tridimensionales visualizados en superficies bidimensionales y…
…en mi próximo post del lunes por la noche, más
Vía: Infosthetics