Curación de Datos

En 2020 habrá en el mundo 40 zettabytes (ZB) de datos almacenados. Resulta evidente que tener más datos no supondrá ningún problema. El verdadero reto reside en tener mejores datos.

El principal valor de la curación de datos consiste en identificar la información clave. ¿Qué factores determinan una decisión de compra? ¿Qué valores alterados permiten a un médico detectar una patología? ¿Cuáles son los indicadores realmente relevantes para predecir las tendencias futuras del mercado? La curación de datos es la vía para encontrar la respuesta a preguntas como estas.

Curación de datos a medida

Un buen sistema de data curation debe contemplar varios procesos diferenciados que abarcan la totalidad del ciclo vital de los datos:

  • Identificación
  • Selección
  • Verificación
  • Transformación
  • Integración
  • Presentación
  • Mantenimiento

En 3.14 diseñamos esos procesos a medida de cada proyecto y los orquestamos de modo que, en conjunto, permitan maximizar los beneficios. Sin desatender ninguna de las fases creemos que el verdadero valor diferencial de la curación se encuentra en la selección de la información. Apostamos por soluciones inteligentes que se adapten a los objetivos de cada empresa y pongan el foco en la detección de los datos claves.

El verdadero valor diferencial de la curación se encuentra en la selección de la información.

Beneficios del data curation

Una correcta curación de datos aporta importantes ventajas competitivas:

  • Mejora de las decisiones: La curación de datos permite basar las decisiones en los indicadores realmente relevantes.
  • Descubrimiento de oportunidades: La identificación de datos clave saca a la luz oportunidades que se mantenían ocultas.
  • Limitación del riesgo: El análisis de la información curada ayuda a reducir la incertidumbre y gestionar el riesgo.
  • Capacidad de anticipación: Las soluciones de data curation posibilitan la predicción, facilitando la adopción de actitudes proactivas en lugar de reactivas.
Una correcta curación de datos permite descubrir qué indicadores debemos priorizar para la consecución de nuestros objetivos.

Las soluciones de data curation se vuelven imprescindibles cuando manejamos datos a gran escala. Las llamadas 3 V’s del Big Data –Volumen, Velocidad y Variedad– aumentan a ritmo exponencial. Este crecimiento abre las puertas a enormes oportunidades, pero también a importantes desafíos. La curación de datos es el arma para aprovechar las primeras y afrontar los segundos.

  • Volumen: La empresas recopilan cada vez más información, pero solo son capaces de aprovechar una pequeña parte. El Dark Data, la información almacenada pero no analizada, supera el 80% del total del Big Data. Una correcta curación de datos nos permitirá descubrir qué información valiosa se esconde entre esos datos oscuros y qué indicadores debemos priorizar para la consecución de nuestros objetivos.
  • Velocidad: Los datos se modifican y se transmiten cada vez más rápido. Las soluciones de data curation deben, por lo tanto, ser capaces de adaptarse a esos cambios en tiempo real. Del mismo modo, resulta clave detectar la obsolescencia de algunas mediciones y la aparición de nuevos indicadores.
  • Variedad: Teniendo en cuenta que el propio nombre de Big Data hace referencia al tamaño, no resulta extraño que el Volumen centre la mayor parte de las conversaciones sobre datos. La Variedad, sin embargo, supone un desafío tan o más grande. Una adecuada curación supone integrar datos de muy diversos tipos, estructurados y no estructurados, provenientes de diferentes fuentes.

Sabemos con certeza que cada vez vamos a tener a nuestro alcance más datos, provenientes de diversas fuentes y transmitidos a mayor velocidad. Ante este panorama, no podemos dejar de preguntarnos cómo curar esos datos o, dicho de otra forma, cómo convertirlos en datos más valiosos.