Aquí tenemos una gran pregunta: todo el mundo ha escuchado “la palabra de moda”, todas las empresas quieren implementar estas soluciones novedosas para potenciar sus negocios, pero realmente, ¿sabemos qué es Big Data?
La mayoría de la gente asocia Big Data a grandes bases de datos, a Google, a Facebook o Twitter y no va desencaminada; sin embargo estas plataformas no son más que la punta del iceberg.
De hecho el Big Data ya lleva tiempo entre nosotros y se está aplicando a muy diversos campos como la investigación genética, la logística, la gestión del tráfico aéreo, la producción de energía o las smart cities.
Las bases de datos relacionales no valen para todo
Empecemos desde el principio. Desde que nació la informática las bases de datos relacionales dominaron el mundo.
Para quien no esté familiarizado con el término, una base de datos relacional es una base de datos donde tenemos tablas (sería como una hoja de Excel), campos (serían las columnas) y algún campo que relacione más tablas entre sí.
Un ejemplo sería tener la tabla Autores con los campos Identificador de autor, Nombre, Nacionalidad, Edad, etc… y la tabla Libros con los campos Identificador de libro, Título, Género, Páginas e Identificador de Autor, que sería el campo en común que nos permite relacionar ambas tablas.
Con la llegada de la web 2.0 surge un problema ya que estas bases de datos empiezan a tener una cantidad ingente de datos y se vuelven demasiado lentas.
Otra cuestión es que los datos que existen ahora mismo son de muy diversa naturaleza: ya no contamos con datos estructurados que no cambian en el tiempo, sino que ahora mismo tenemos miles de fuentes de datos y cada una es totalmente distinta de otra.
Las bases de datos relacionales no son muy amigas del caos, y ahí surge “el gran reto”.
El nacimiento del Big Data
El término big data se usó por primera vez en 1997 por los investigadores de la NASA Michael Cox y David Ellsworth cuando empezaron a encontrarse con la dificultad de tratar y visualizar grandes cantidades de información.
En 2008, con el nacimiento de las redes, se volvió a usar el término Big Data para resolver el problema de muchos datos desestructurados: por ello nacieron las bases de datos NOSQL o NOREL (no relacionales).
Los aspectos que mejor definen el big data son 4, las famosas 4 Vs del Big Data.
Las 4 Vs del Big Data
Volume
Como venimos hablando, uno de los grandes problemas que teníamos era el volumen de datos, por esto las bases de datos NOSQL debían estar preparadas para soportar grandes cantidades de datos.
Variety
Otro reto que comentábamos era la variedad: ahora tenemos que almacenar datos que antes no almacenábamos, como imágenes, vídeos, voz, interacciones en redes sociales, etc…
Velocity
De nada nos servirán estas nuevas bases de datos si no fueran capaces de gestionar las ingentes cantidades de datos de las que hablamos con una velocidad aceptable.
Veracity
Es algo que parece obvio, pero es importante que los datos que tratamos sean veraces y de calidad.
¿Y qué es una base de datos NOSQL?
SQL es el lenguaje de consultas usado por todas las bases de datos relacionales, por ello cuando surgieron las bases de datos no relacionales se las llamó NOSQL que podemos entender por Not Only SQL.
Esto significa que en estas nuevas bases de datos no tenemos que ceñirnos a unos esquemas definidos y a unas relaciones fijas sino que los datos pueden ser desestructurados y cambiar a lo largo del tiempo sin que ello cause un quebradero de cabeza.
Hay una gran cantidad de bases de datos NoSQL como pueden ser: MongoDB, Cassandra, CouchDB, Neo4j, entre otras.
Big data en el marketing online
Y ya que estamos en un blog sobre marketing online, te preguntarás: ¿y todo esto qué implicaciones tiene en las estrategias digitales?
Para poder entender de que magnitudes estamos hablando podemos ver el ejemplo de Facebook, que almacena más de 300 petabytes de información de sus usuarios, para entendernos, un petabyte equivaldría a un vídeo en calidad HD de ¡13,3 años de duración!
Otra de las últimas tendencias en el marketing online es el RTB (Real Time Bidding), una nueva forma de hacer publicidad en internet que nunca podría haber existido sin Big Data.
RTB trata unas cantidades enormes de información a una velocidad de vértigo, un caso de uso perfecto para las nuevas bases de datos NoSQL.
También relacionado con RTB tenemos el tema de compra de audiencias segmentadas, ya que toda esta información se encuentra en bases de datos NoSQL para poder acceder a ella de manera inmediata. Estas plataformas tienen que guardar información sobre la navegación de los usuarios: qué páginas visitan, dónde realizan sus compras, qué servicios web utilizan, etc… Sería impensable tratar estos datos sin Big Data.
Pero uno de los ámbitos más importantes en los que va a ayudar el Big Data es el Business Intelligence. Este campo lleva muchos años desarrollándose pero en el Big Data ha encontrado el complemento perfecto ya que ahora contamos con muchos datos que antes no podíamos añadir por su complejidad y podemos analizarlos con una velocidad mucho mayor. Esto hará que podamos tomar decisiones mucho más precisas y mucho más rápidas basadas en datos.
Un caso de éxito apoyado en Big Data
¿Pero todo esto funciona de verdad o es solo una nueva moda? Frente a esta inquietud muy común, la respuesta es clara: Big Data ya está mejorando la toma de decisiones y en el futuro lo hará muchísimo más.
Un caso muy famoso es el de Barack Obama, el presidente de EE.UU. quien se ha caracterizado por apoyarse en las nuevas tecnologías. Ya en 2008 su campaña utilizó y aprovechó las posibilidades de las redes sociales, algo que en ese momento no se usaba demasiado.
Pero en la campaña de 2012 volvió a apostar por las últimas tendencias tecnológicas y en este caso usó el Big Data para ser reelegido: ¿cómo lo hizo?.
Barack Obama contrató un equipo de 100 analistas de datos y más de 66.000 ordenadores para hacer simulaciones cada día.
Analizando millones de datos de una gran cantidad de fuentes consiguió una información muy importante para la campaña, como por ejemplo en qué estados estaban más indecisos y había posibilidades de que se decantaran por él, para poder hacer más campaña en esas áreas geográficas sabiendo además qué tema sería oportuno tratar.
Como vemos esta estrategia tuvo éxito: Obama consiguió ser reelegido.
Y yo pienso, ¿si el Big Data ayudó a ganar la presidencia de Estados Unidos, cómo dudar de que nos ayudará cada vez más a tomar mejores decisiones para obtener mejores resultados?
Si quieres saber más sobre Big Data no te pierdas: Cómo hacer que el Big Data funcione