Definición de Big Data

Big data es un término que describe un gran volumen de datos – estructurados y no estructurados – que actualmente es utilizado tanto por instituciones gubernamentales como no gubernamentales. Estos datos se producen en forma masiva diariamente, de forma tal que, a los equipos de software tradicionales se les hace imposible poder analizar toda esta información. Por esto es que se debe recurrir a métodos más avanzados de análisis.

Actualmente es una de las herramientas más importantes para todo tipo de objetivos, que pueden ir desde mejorar el marketing de una empresa a través de la hiper segmentación del usuario, a algo mucho más peligroso para la sociedad, como puede ser la manipulación de las personas.

El pasado de los datos: Las encuestas.

La manipulación de los datos ha ido evolucionando con el paso de los años. Digamos que el proceso para obtener información era el siguiente.

Primero se recolectaban datos a través de encuestas, cuya información era colocada en hojas de cálculos como excel. Luego eran analizadas tratando de buscar patrones de conducta, generando parámetros y cuantificarlos. para así poder determinar la mejor decisión. Generalmente estas decisiones las tomaba alguien muy experimentado en el campo.

Pero esto… Presenta algunos inconvenientes.

Primero, es que vamos a estar totalmente limitados a la cantidad de encuestas que nuestro equipo pudiese elaborar. Segundo, lleva tiempo adquirirlas y crear una base de datos. Tercero, estamos sujetos a que los entrevistados puedan llegar a mentirnos, ya sea de forma voluntaria, o bien, por que realmente no sabe lo que quiere.

Otro de los grandes problemas es que aunque se podrían extraer muchos datos de distintas fuentes, era muy difícil hacer un análisis de datos no estructurados numéricamente, como lo puede ser un video, el cuerpo de un mail, etc.

Por eso, es que para ir mejorando la influencia sobre el objetivo, se han ido almacenando cada vez más y más datos, y se han ido perfeccionando los métodos de análisis para hacer cada vez más eficiente la toma de decisiones en el menor tiempo posible. Esto llevó a que la manipulación de los datos sea un gran negocio.

El término Big Data.

Como vemos la manipulación de los datos y su tratamiento no es nuevo realmente, pero el término lo popularizó el analista de la industria Doug Laney. quien articuló la definición ahora muy popular del big data como las tres V’s:

Volumen. 

Actualmente todo lo que hacemos en internet importa. Las empresas lo saben. Transacciones, likes, visualizaciones, mails, todo importa para ellos.  Por eso es que recopilan datos de diversas fuentes. 

Velocidad. 

Los datos se transmiten a una alta velocidad, y la evolución de las nuevas tecnologías de internet no hacen más que incrementarla, como es el caso de la tecnología 5G.

Variedad. 

Los datos vienen en toda clase de formatos – desde datos numéricos estructurados en bases de datos tradicionales hasta documentos de texto no estructurados, correo electrónico, video, audio, datos de teletipo bursátil y transacciones financieras.

Actualmente el concepto se ha ampliado y se le han otorgado otras características a la big data:

Veracidad

Implica extraer los datos de alta calidad y dejar de lado aquellos que presentan una mayor imprevisibilidad. Digamos que comprar seguidores en instagram no suma a la big data, por que se reconocen estos y no generarán datos veraces. 

Valor

Hace referencia a la importancia de sacar datos a la luz los datos relevantes para cada uso concreto y poder rentabilizarlos.

¿Y que hacemos con estos datos?

Todos conocemos las grandes empresas tecnológicas que hacen dinero con la obtención de información. Ahí están por supuesto Google, Facebook, Microsoft, ByteDance (Creadores de Tik Tok), y mucas otras más. Pero ¿nunca te has preguntado que como generan tanto dinero si son de uso gratuito?

Para resolver esta pregunta me gusta mucho una frase:

«Cuando un producto es gratis, el producto eres tú.»

Ahora, los verdaderos usuarios de estas herramientas son las empresas, que compran información de sus productos (osea, de los mortales como nosotros) para poder así elaborar sus estrategias y alcanzar sus objetivos. No es que facebook les venda tus datos, si no que les ofrece a las empresas la capacidad de hiper segmentación del mercado, asegurándoles que sus productos serán ofrecidos a potenciales clientes.

Los datos que se recolectan son extremadamente variados. Uno no puede imaginar la magnitud de los datos que genera diariamente por que realmente no es conciente de ello. Hace unos años en el escándalo de cambridge analytica se desveló que poseían algo así entre 4000 y 5000 datos de 230 millones de personas. Y los fines de estos datos son de dudosa ética.

¿Para que se usa la Big Data?

Los fines son muy diversos, y cada vez se van ingeniando nuevas formas de hacer negocios con ellos. Solo es cuestión de imaginar nuevas formas de influir en las personas con toda su información. Sin embargo podríamos hablar sobre las más conocidas:

Marketing

Al poseer tanta información individualizada nos permite hacer una hiper segmentación del mercado, es decir, que las propagandas y la forma de exponerlas serán acordes a los deseos y necesidades de cada individuo, para así incrementar las ventas.

 Manipulación de las personas

El escándalo de Cambridge Analítica desveló que se estaban realizando practicas bastante inmorales, en donde a través de estudiar los perfiles de cada ciudadano, se analizó la mejor forma de manipularlos para que voten a favor de un partido político, ya sean como lo que sucedió en Estados Unidos en la campaña de Donald Trump, la campaña de Argentina con Mauricio Macri, o el Brexit de Gran Bretaña.

¿Cuanto dinero generamos con nuestros datos?

La cuantificación directa entre el dinero generado por los datos de navegación no es una transformación directa. Hay muchos procesos detrás que tienen que ver con esto y no todos los datos tienen el mismo valor. Por eso no podríamos saberlo 100% confiable. 

Se podría hacer una relación entre lo que gana facebook trimestralmente y dividirlo entre los usuarios activos de ese trimestre. De esta manera tendríamos un valor aproximado de 8 dolares por trimestre.

Sin embargo, y como ya lo estarán pensando, este es un cálculo bastante simplista. Estamos ignorando el hecho de que las empresas no pagan lo mismo por todos los que usamos la plataforma. El precio que paga una empresa por tu atención va a depender de muchos factores (algunos hasta parecen absurdos) como pueden ser: Posición social y económica, residencia, edad, si te compras una casa, te casas, te divorcias, si estás enfermo, si estás triste, y así un fin de parámetros. Realmente no es algo facil de determinar.

A pesar de todo esto, Un grupo de investigadores de la Universidad Carlos III de Madrid (UC3M) ha desarrollado una herramienta gratuita que permite visualizar los ingresos por publicidad que genera cada usuario en Facebook, que se denomina Facebook Data Valuation Tool (FDVT). Esta es una extensión de Google Chrome, y puedes descargarla pinchando aquí.

El verdadero peligro.

La seguridad por la navegación web no es algo que esté siempre asegurada. Pero no por ello vamos a dejar de usarla. Si lo que te preocupa es qué tan expuesto estás al mundo, te tiro algunos tips para asegurar un poco más tu información:

  • Intenta que cada usuario que crees en distintas aplicaciones o webs no coincidan con otras.
  • Utiliza un generador de contraseñas aleatorias, mientras más compleja mejor. Si te da miedo por que piensas que olvidarás la contraseña, coloca “recordar contraseña” en aquel dispositivo que más utilices
  • Ten registro de todas aquellas aplicaciones en las que te has registrado, y dar de baja en aquellas que ya no utilices.

Una herramienta muy potente es la que ofrece haveibeenpwned.com, en donde te saldrá una lista de todos los accesos ilícitos que han tenido las grandes plataformas de usuarios. Además, colocando tu mail, te dirá todas aquellas plataformas en las que te has registado y han sido hackeadas, para que cambies tu contraseña.

Sin animo de buscar generar miedo ante todas estas empresas que quieren nuestros datos, a las empresas no les interesamos como personas si no como números. Si te aparece una publicidad de Nike, no significa que te conozca, si no más bien que encajas en el perfil de “persona aficionada a las zapatillas”. Y así con todos los temas. Eso si, si eres una persona millonaria o muy reconocida, cuya información personal vale más que sólo por cuestiones estadísticas, si preocúpate por reservar tus datos. Puedes contratar servicios de protección adicionales.

Lo que si es importante, es que hay que ser conciente de que hay gente utilizando nuestra información personal con fines manipulativos, y por esa razón es que hay que tener excesivo cuidado en cuanto a la información que leemos, ya que logicamente estaremos expuestos a alguna forma de modificar nuestro comportamiento.

Referencias