Big Data, cuando la cantidad importa

Grafo con los perfiles en Facebook de 2500 periodistas

Grafo con los perfiles en Facebook de 2500 periodistas

Para un periodista, la información es la materia prima con la que trabajar. La moldea e interpreta para acabar produciendo una noticia. Para un ciudadano es un elemento básico en el proceso de toma de decisiones. Para las empresas e instituciones es la clave para predecir un comportamiento, evitar la incertidumbre.

Desde mi ventana veo un bosque, y observo detalle como uno de los arboles suelta una hoja. Es un hecho aislado, sin relevancia, pero es información, un hecho que me advierte de que una hoja se está precipitando hacia el suelo, si lo vemos con objetividad. Al cabo de unos segundos se precipita una segunda hoja, a la que siguen otras, en intervalos más o menos regulares, y así durante horas y días. El hecho irrelevante ha cobrado un nuevo sentido: ha llegado el otoño. Bienvenidos al “big data”, o cómo el análisis conjunto de grandes cantidades de pequeñas unidades de información (datos) pueden ser interpretadas para obtener una explicación sobre lo que ocurre a nuestro alrededor.

Cuando la información somos nosotros

La metáfora anterior es extrapolable a las personas. Cada mañana salimos de casa a una hora más o menos regular, viajamos, realizamos compras, llamadas telefónicas, mandamos emails o comemos en un restaurante que nos gusta. Todos estos datos, analizados por separado pueden no ser relevantes, pero si recopilamos la cantidad suficiente podemos establecer un patrón que nos permita predecir cuál será nuestro siguiente movimiento. La agudeza de la predictibilidad de nuestro comportamiento es aún más apabullante si pensamos que nuestro teléfono deja constancia de su ubicación en todo momento, que nuestros correos electrónicos son leídos e interpretados por inteligencias artificiales, que nuestra tarjeta de crédito proporciona a nuestro banco datos exactos sobre nuestro hábito de consumo o que hemos informado de lo que hacemos en Facebook.

La realidad supera la ficción y todo es mucho más complejo de lo que parece. Porque usted y yo no somos los únicos que proporcionamos información sobre nuestras vidas. Todos dejamos un rastro de datos que pueden ser recopilados e incorporados al fichero. Al final, lo que obtienen las partes “interesadas”, es una visión macro a partir de datos micro, una visión de magnitud obtenida a partir de la reducción, simplificación y generalización de pequeños datos individuales.

Quién y porqué

Empresas, gobierno o instituciones, desde el uso científico hasta el estudio de mercado. La lista de interesados en la recopilación de datos para generar ficheros “Big Data” es amplia. La finalidad de la recopilación de datos es generar paradigmas, información que permita predecir comportamientos futuros. El CERN recopila datos e información de todos sus experimentos creando un fichero Big Data, con información suficiente como para deducir patrones interpretables para la elaboración de teorías científicas. Los gobiernos atesoran información de sus ciudadanos para detectar comportamientos de consumo, problemas sociales o conocer la intención de voto, y las empresas quieren saber cuál será la tendencia de un mercado, anticipación. Todo nos lleva a la misma conclusión, entender con certeza y objetividad lo que ocurre y ocurrirá.

La certeza de los datos: objetivizar al sujeto

La idea de que el comportamiento humano puede ser destilado hasta la obtención de un dato objetivo no es nuevo. Si nos fijamos en la tradición periodística nos damos cuenta que durante mucho tiempo se creyó con firmeza en la posibilidad de elaborar información e interpretar hechos sin que el periodista inculcara un prejuicio o una opinión, una corriente objetivista que ha dominado la profesión casi desde su nacimiento. Esta creencia, que aún existe y se defiende, pero disuelta poco a poco gracias a la aportación filosófica de personajes como John Austin a partir de los años 50, ha dado lugar al periodismo de datos, una variante periodística en auge desde los años 60, que trata de extraer historias a partir del análisis de datos estadísticos. Los números son irrefutables, pero el comportamiento de un individuo siempre está sujeto la interpretación del observador, algo advertido por aquellos quienes se dedican a las ciencias sociales.

Pero, ¿y si no observamos a un solo sujeto? Los debates sobre la objetividad en la observación de un solo sujeto desaparecen cuando observamos un colectivo. La creencia de que la “masa” o “grupo” sigue una lógica distinta a la del sujeto se fundamenta en la observación y existencia de patrones de conducta, y nos permite elaborar generalizaciones, algo que puede registrarse como dato objetivo, periodismo de datos.

Así, la creación de bases de datos, estadísticas y, en definitiva, el Big Data, buscan la obtención de datos objetivos, medibles y cuantificables, tres calificativos que nos permiten extraer información certera sobre el comportamiento humano o elaborar teorías sobre el mundo que nos rodea, un intento de objetivizar el sujeto.

La incertidumbre del Big Data

¿Qué hacemos con un mundo datificado? Todo, desde el comportamiento humano hasta la naturaleza de la materia, el funcionamiento de las ciudades o la comunicación social ha sido convertido en datos. La gran pregunta es cómo tratamos esos datos y qué hacemos con ellos. Este es el momento en el que nos encontramos, un punto de inflexión donde confluyen multitud de disciplinas. Ha quedado demostrado que el Big Data nos permite elaborar noticias, predecir atascos de tráfico, saber cómo se va a comportar un virus o entender mejor el Boson de Higgs. Pero a la vez que avanzamos hacia una sociedad que elabora teorías de predicción y anticipación, dos conceptos de gran importancia para una economía de mercado, caemos en el error de obviar o subestimar el factor humano, lo impredecible, la carencia de lógica en algunas de las decisiones que tomamos y la imposibilidad de introducir las emociones en la ecuación. La enorme cantidad de datos recabados hasta la fecha sobre el comportamiento de las cosas pueden proporcionar una falsa sensación de control, una capacidad de decisión frente a retos futuros que en realidad no tenemos, pues algunas de las decisiones que tomamos no están fundamentadas en valores cuantitativos, sino cualitativos. Esta disyuntiva nos lleva a preguntarnos si el Big Data es realmente la solución a nuestros problemas, si realmente es capaz de predecir el comportamiento humano.

Para obtener un dato hace falta simplificar los hechos, y es en ese proceso de simplificación donde la complejidad del factor humano se pierde, donde no interviene la política y donde se puede cometer el error de creer que obtenemos un dato irrefutable. No solo se trata de obtener un dato, sino comprender como se ha obtenido dicha información, con qué métodos, en qué circunstancias y adivinar su validez futura.

Datos, eficiencia y marketing digital

Para aquellos quienes se dedican a la comunicación online, ya sea en su vertiente de marketing o en la elaboración de contenidos, el concepto del Big Data no es desconocido. De algún modo u otro sabemos cuál es el mejor momento para publicar, controlamos al milímetro el mensaje y el lugar para maximizar el impacto. Todo ello ha sido gracias a los datos que con el tiempo hemos recopilado, y que llegados a un punto son suficientes como para predecir el comportamiento de nuestra audiencia y hacer nuestra comunicación mucho más eficiente. Nuestro Big Data particular, ya sea a través de las herramientas de tracking, la visualización de datos mediante infografías o la propia experiencia nos ofrece la posibilidad de poder elaborar teorías sobre lo que ocurrirá cuando lanzamos un contenido a la red o ponemos un nuevo producto en circulación.

El concepto de eficiencia en la comunicación online es central. El usuario debe encontrar lo que busca o, de lo contrario, lo perdemos. Las famosas “cookies” nos permiten ofrecer al usuario una experiencia mucho más personalizada almacenando sus preferencias. Google interpreta los intereses de sus usuarios, ofreciendo respuestas personalizadas para cada uno de nosotros conforme a nuestros intereses y patrones de búsqueda. Interpretar los datos que el usuario nos ofrece permite ubicar mejor la publicidad, mostrar un mensaje personalizado y, en definitiva, ofrecer una respuesta eficiente, maximizando el impacto y captando la atención de nuestro target.

Pero además de toda la información que los usuarios generan de forma involuntaria o pasiva, debemos poner en valor la gran cantidad contenidos éstos vuelcan a la red de forma voluntaria, y que nos proporciona una visión cualitativa de lo que ocurre en nuestro entorno a tiempo real. Twitter, Facebook, instagram, Foursquare, etc, la lista de medios sociales que nos proporcionan información sobre los hábitos de nuestro público objetivo es amplio. Gracias a ellos podemos valorar el impacto que ha tenido nuestro mensaje o producto más allá de las cifras. Lo último en minería de datos nos permite extraer twits o posts de Facebook (entre otros), de los que se desprenden valoraciones, estados de ánimo y palabras clave, asociaciones que los internautas realizan con una marca, producto o contenido, y que nos permiten conocer la imagen de una marca o el valor que los usuarios otorgan a un producto.

Por último, prestar atención a lo que ocurre en las redes sociales y contenidos que generan los usuarios nos brinda la posibilidad de anticiparnos, prever tendencias, modas o amenazas. Con las herramientas adecuadas y la cantidad de datos suficientes podemos radiografiar nuestro entorno para interpretar qué ocurrirá. En resumen, el análisis de los datos que generan los usuarios es información, y la información conocimiento, una herramienta valiosa si queremos tomar las decisiones correctas.

¿Es el Big Data la respuesta a todo?

El reto al que nos enfrentamos ahora es convertir el Big Data en información cualitativa, capaz de ofrecer respuestas sobre los problemas y también posibles soluciones. Podemos tomar el pulso de una ciudad, conocer los problemas de sus ciudadanos, podemos ser más eficientes en nuestra comunicación o mejorar la imagen de una marca, pero para ello debemos ser capaces de interpretar los datos de forma correcta y encontrar las preguntas adecuadas. Debemos discernir entre lo relevante e irrelevante y abandonar la falacia de que cualquier elemento de nuestras vidas puede ser registrado. El peligro es generar demasiado ruido. Podemos datificar el mundo, lo estamos haciendo, pero ¿Debemos?

¡Deja el primer comentario, no seas tímido!

Únete a la discusión

Puedes utilizar los siguientes HTML tags y atributos: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>