Las 3 V´s de BIG DATA Marketing y sus modelos de programación

Inicio » Blog » Las 3 V´s de BIG DATA Marketing y sus modelos de programación

Las 3 V´s de BIG DATA Marketing y sus modelos de programación

Big Data Marketing es sencillamente el proceso de almacenar, clasificar, analizar y extraer la información necesaria para tomar decisiones de forma más eficiente, siendo capaz de gestionar un gran volumen de datos a una gran velocidad. Continuamente almacenamos grandes cantidades de datos de diversas fuentes y diferentes características, y en el mundo en que vivimos, necesitamos analizarlos en el menor tiempo posible para poder reaccionar y anticiparnos cualquier problema. Para resolver la ecuación de las tres “V” s es importante tener una buena tecnología y métodos estadísticos específicos. Las 3 V’s de Big Data Marketing son Volumen, Velocidad y Variedad, aunque algunos expertos introducen otra “V” más: Veracidad.

Si quisiéramos pensar en un claro exponente de Big Data Marketing, muchos pensaríamos en el buscador de Google. De hecho, es donde muchos terminamos buscando respuestas a muchas de nuestras preguntas. Google analiza todos los días cantidades ingentes de datos, pero nos muestra los más relevantes en centésimas de segundo. A principios de la primera década de este siglo, ingenieros de Google comprendieron que aunque los métodos que estaban usando eran correctos en ese momento, el incremento de usuarios en internet y el aumento de los contenido generados, pronto convertiría estos métodos en inadecuados para el servicio que quería seguir ofreciendo a los usuarios. En primera instancia, pensaron en repartir la carga de trabajo en ordenadores conectados a su red formando “clusters”. Pero pronto se dieron cuenta de que no valía únicamente con repartir la carga, sino que además, cada parte repartida debía realizar la función de análisis de forma paralela. El proceso debía continuar a pesar de los problemas en la red o en alguno de los sistemas individuales, tendría que ser capaz de expandir o contraer automáticamente, y el resultado debía ser independiente del punto donde se realizará la representación. Y así nació MapReduce.

Como no queremos ser demasiado técnicos en este blog, explicaremos MapReduce con un sencillo ejemplo: Imaginemos que tenemos grandes cantidades de datos sobre comentarios en nuestra web, y queremos saber qué porcentaje de nuestra base de usuarios comenta que no está de acuerdo con el nuevo diseño. Lo siguiente que debemos realizar es un listado de las palabras clave, que nos ayuden a identificar aquellos comentarios que traten sobre el diseño de la web: colores, la misma palabra diseño o “web”, el verbo gustar, agradar…Una vez tengamos el listado, el siguiente es realizar una función “Map”. Buscamos cada término de la lista y los comentarios, contando el número de veces que cada término aparece. Un término no debe ser únicamente una palabra determinada, también puede ser una frase. Con los listados procedentes de la fase de mapeado, declaramos nuestra función “RBig Data Marketingeduce”. Esta función irá sumando todos los valores procedentes de la “palabra clave” – retornando un resultado numérico. Ahora hacemos lo mismo con términos que indiquen negatividad, obteniendo un valor como en el caso anterior. Pero claramente, necesitamos mezclar los datos, por lo tanto, para hacer que el proceso sea rápido y escalable, haremos lo siguiente: Partir el proceso en procesos paralelos. A cada siete partido, le aplicamos la función map correspondiente y realizamos el mezclado de los datos, lo que lleva a la agregación de patrones similares. A los patrones obtenidos aplicamos la función “reduce”, que combinará todos ellos para obtener un resultado consolidado, como podemos ver en en el esquema.

Como podemos comprobar, depender al sistema de la cantidad de datos a procesar el sistema es escalable, ya que podemos incrementar el número de unidades de procesado en paralelo. En 2004, Google publica un “papel” explicando el MapReduce, lo que provoca el desarrollo de Hadoop, que es como el MapReduce pero de licencia libre. Hoy, empresas como Oracle, IBM o Microsoft utilizan el Hadoop en los productos y servicios que ofrece Big Data Marketing . En 2006 Google abandona la idea de seguir mejorando MapReduce a favor de una nueva tecnología más eficiente: Dremel. Dremel tiene un diseño columnar, siendo 100 veces más rápido que MapReduce. Aparte de eso, la gran diferencia entre ambas tecnologías, es que mientras MapReduce procesa los datos, Dremel los analizaActualmente, Google comercializa Dremel como un servicio en la nube llamado Big Query, de modo que todos las empresas pueden disponer de esta súper herramienta de análisis de grandes cantidades de datos en segundos, pagando sólo por lo que necesite la empresa. De hecho, Dremel es complementario a MapReduce, por lo que se puede utilizar ambos métodos para mejorar los análisis de los datos de tu negocio, usando otros servicios disponibles en la nube de Google.

Volviendo al encabezamiento de este capítulo: Big Data Marketing está de moda hoy, podríamos decir que es “trending topic“, porque ahora somos capaces de resolver la “V” más importante de la ecuación: la Velocidad. Hemos visto como en el transcurso de la historia tanto el Volumen, como la Variedad siempre han estado presentes, e incluso, hemos sido capaces de detectar patrones con más o menos eficacia. Pero el gran problema de estos análisis era su velocidad, las conclusiones se conseguían con el paso del tiempo, siendo meros espectadores del suceso a observar. Ahora podemos dar un giro radical a la ecuación, porque gracias a los análisis en tiempo real, podemos tomar decisiones en el momento, y con ellas pasar de ser meros espectadores a convertirnos en actores del suceso que están analizando pudiendo ser relevantes en el mismo, es decir, pasar a la acción para que los siguientes resultados contribuyan a lograr de mejor manera nuestros objetivos.

Espero os haya gustado el articulo, en nuestro proximo blog hablaremos de las Aplicaciones en la “nube” y el Big Data para tu empresa. ¡No te lo puedes perder!

2018-06-15T14:52:46+00:00 21 Ago 2016|