La transformación digital será a través del Digital Big Data o no será

Big Data

La transformación digital será a través del Digital Big Data o no será

Podemos asegurar, sin riesgo a equivocarnos, que después del Gin Tonic, el Big Data es uno de los términos más populares de nuestros tiempos. Tanto es así que se hace necesario usar Big Data para procesar toda la información que surge en torno al propio término, entrando así en un bucle perversamente recursivo.

El interés por esta “nueva” disciplina crece exponencialmente y si bien cada vez son más los ámbitos en los cuales se incorpora como elemento disruptivo, también es sorprendente su aparente ausencia en otros.

GRÁFICO GOOGLE TRENDS COMPARATIVA BIG DATA(azul)- GIN TONIC(rojo) ESPAÑA

GRÁFICO GOOGLE TRENDS COMPARATIVA BIG DATA(azul)- GIN TONIC(rojo) ESPAÑA

 

Industrias como la banca o los seguros llevan ya tiempo aplicando Big Data sobre sus datos, en procedimientos que recuerdan en gran medida al clásico “data mining”, del cual no es sino su evolución, para determinar desde el riesgo de conceder un préstamo a una persona que viva en una determinada localización geográfica  a la creación de perfiles de buenos conductores en base a datos financieros.

En otras disciplinas como aquellas asociadas a Open Data , Smart cities, healthcare, e-Goverment y el internet de las cosas, el Big Data se presenta como uno de los catalizadores para lanzar su desarrollo e implantación efectiva en la mejora de la calidad de vida de la ciudadanía.

Sin embargo, si hablamos de la aplicación del Big Data al mundo de la Analítica Digital en su más amplia acepción; esto es Web, Social y Mobile Analytics, nos vienen a la cabeza las palabras del poeta cuando decía aquello de “veréis llanuras bélicas y páramos de asceta, no fue por estos campos el bíblico jardín” dado que poco o nada parece moverse con respecto al Big Data en el ámbito del dato digital. ¿Cómo puede ser esto posible si nos encontramos ante los más frondosos campos de datos, regados con miles de millones de interacciones humanas en webs, apps y redes sociales recogidas por herramientas de Analítica Web de lo más variado?

Algunas de las causas, que la experiencia acumulada en este sector nos permite aportar para el debate, serían las siguientes.

Estructura subyacente del dato

Es bien sabido el gusto por el dato en crudo para llevar a cabo análisis Big Data; en el mundo de la analítica web, donde el tag ha sustituido al log, precisamente buscando simplificar el procesamiento de la información, el dato se presenta cocinado por el método usado en el despliegue y la recogida de datos a través de variables. La persistencia de variables, la relación de eventos asíncronos con variables síncronas, etc. hacen que estos datos ya se recojan y almacenen con una determinada estructura que condiciona el modelo de información subyacente. Si esto se suma a que un contexto de recogida es difuso (navegadores, entornos, etc.), el dato se vuelve líquido. A este respecto, herramientas como Big Query de Google o DataWarehouse de Adobe Analytics (entre otras) permiten atacar los datos en su versión más cruda facilitando de esta forma el procesamiento posterior con técnicas estadísticas (data mining, machine learning, etc.)

Calidad del dato

A priori, uno de los requisitos del Big Data, como su propio nombre indica, es contar con la abundancia de datos; en el caso de la analítica no sólo se genera una cantidad ingente de datos, sino que en algunos casos hay tal sobreabundancia de ellos que llega incluso a ofrecer información inconsistente (o al menos contradictoria). Se hace necesario, por tanto, abordar la medición digital respondiendo a unos objetivos de negocio y con unos estándares de etiquetado que garanticen la consistencia de los datos recogidos. Pocas cosas han hecho más daño a la analítica web que la “obsesión” de medirlo todo en detrimento de la calidad del dato recogido y su finalidad. Sin un dato de calidad no podemos hablar de análisis de datos.

Fragmentación del dato

Diferentes fuentes de accesos (mobile, tablet, portátil, ordenador del trabajo, personal, etc.) al mismo activo digital, hacen que el mismo usuario se desagregue en tantos perfiles como dispositivos de acceso utilice. Esto provoca la fragmentación de los datos asociados al mismo y por tanto de la visión global del usuario (piedra filosofal de la alquimia marquetiniana). Los movimientos de Google Analytics con su User ID o de Webtrekk con su visión user-centric traking son pasos adelante para acabar con esta fragmentación y ofrecer una visión panorámica del comportamiento del usuario digital.

Perfiles profesionales suficientemente preparados

En este punto vuelve a aparecer una de las palabras más cool de estos últimos tiempos. El Data Scientist, considerada la profesión más sexy del siglo XXI y llamado a encabezar la revolución basada en datos, adolece en el campo del Digital Analytics de suficiente preparación. Vicent GranVille en un revelador post titulado What is Wrong with the Definition of Data Science  desarrolla una línea argumental muy interesante, donde además de las ya consabidas skills que han de vestir un perfil de Data Scientist (manejos de bases de datos, altos conocimientos de estadística, modelado y visualización de datos, programación, etc.) añade un factor decisivo, que es el conocimiento de negocio o el expertise en el campo de actuación (domain expertise / business acumen). La Analítica Digital y sus disciplinas conllevan una gran complejidad en sí misma (ya en su concepción inicial) que requiere un gran conocimiento sectorial y dominio de diferentes herramientas, metodología, procesos; lo que añadido a las razones expuestas anteriormente sobre las peculiaridades de los modelos de datos subyacentes a los que se hay que enfrentar, hace necesaria una especialización o una nueva definición del Data Scientist.

Fuente de la viñeta: http://www.kdnuggets.com/websites/cartoons.html

Fuente de la viñeta: http://www.kdnuggets.com/websites/cartoons.html

Digital Big Data y Digital Data Scientist

Con estas premisas no es aventurado redefinir las reglas del juego, al menos en el terreno de la semántica, y comenzar a hablar en términos de Digital Big Data como aquellos procesos que evolucionando del clásico “data mining”, se unen a herramientas propias del Big Data (alta capacidad de computación, bases de datos no relacionales, computación distribuida, nuevos algoritmos de procesamiento de datos, etc.) para tratar datos que emanan del entorno digital (web, apps, social). En este ecosistema nace la figura del Digital Data Scientist que complementa las competencias del Data Scientist con un conocimiento profundo del mundo del Digital Analytics. Esta nueva nomenclatura permite sentar las bases para responder a los retos que demanda la transformación digital de las empresas, y que van desde el mayor conocimiento del usuario (perfilado de usuarios), optimización de los canales publicitarios (modelos de atribución personalizados), integración de fuentes (dato on, off, de terceros, etc.) mejora de la experiencia de usuario (optimización de los flujos de navegación en el site), simulación de escenarios (análisis predictivo), etc. Tal importancia estratégica toma el Digital Big Data en este escenario de cambios que no es descabellado atreverse afirmar que

La transformación digital será a través del Digital Big Data o no será.

 

¿Te animas a sumergirte en la profundas aguas del Digital Big Data, te unes a la revolución de los Digital Data Scientist?.

No hay comentarios

Envíanos tu comentario

veinte − Diez =

¡Suscríbete a nuestra newsletter mensual Stay Sharp!

Para más información

CONTÁCTANOS