La era del Dark Data: ¿sabes lo que almacenas?

Publicado el 5/1/2023 por Bruno Peláez y Alejandra Aranda

Este artículo se publicó por primera vez el 23 de diciembre de 2019 y se ha actualizado el 5 de enero de 2023.

Los datos oscuros (Dark Data) muchas veces pasan desapercibidos por empresas que no saben cómo sacarles partido. Los datos que se almacenan y que rara vez se utilizan pueden ofrecer una gran oportunidad a las compañías que quieran aprovechar su potencial. Una estrategia sólida y las herramientas BI pueden ayudar.

Dark Data: Beneficios y oportunidades para empresas

En una era en la que el volumen de los datos parece no parar de crecer, muchas empresas pueden estar descuidando de forma involuntaria el manejo de los datos que recopilan. Todo negocio debe conocer qué es el Dark Data y cómo establecer una estrategia clara para aprovechar estos datos almacenados.

La falta de visibilidad y gestión de los datos oscuros puede hacer que las empresas no puedan usarlos en beneficio de la organización, y esto impida la precisión operativa. Según un informe de Quest Software en colaboración con Enterprise Strategy Group realizado en 2022, más de la mitad de los datos en las empresas son Dark Data.

Averiguar qué datos oscuros se tienen y aprender a obtener valor de ellos puede convertirse en una oportunidad para apoyar nuevas decisiones tácticas. ¿Cómo pueden las empresas identificar, proteger y gestionar el Dark Data?

¿Qué es el Dark Data?

El Dark Data (datos oscuros, por su traducción del inglés) se define como los activos de información que las compañías procesan y almacenan durante sus actividades de negocio, pero que no consiguen utilizar para otros propósitos, como visión analítica o monetización.

Según Gartner (contenido en inglés), al igual que la materia oscura en física, el Dark Data suele constituir el universo de activos de información de la mayoría de las organizaciones. Por lo tanto, las empresas a menudo conservan los datos oscuros solo con fines de cumplimiento. Almacenar y proteger los datos suele suponer más gastos (y a veces más riesgos) que valor.

¿Qué diferencia hay entre Big Data y Dark Data?

Dentro de la infraestructura de Big Data (macrodatos, por su traducción del inglés) de cualquier organización existen datos ocultos. Estos datos no son solo una pequeña parte del Big Data, sino que conforman una gran porción que encierra un enorme potencial para las empresas que aprenden a utilizarlos.

Aunque el Dark Data es un subconjunto del Big Data, los datos ocultos constituyen la mayor parte del volumen total del Big Data recopilado por las organizaciones. Las empresas no suelen analizar ni procesar los datos oscuros por diversos motivos, pero eso no disminuye su importancia en el contexto del valor empresarial.

Básicamente, el Dark Data es información que las empresas tienen pero no usan y que ocupa espacio de almacenamiento. En muchos casos, estos datos almacenados se generaron sin ningún objetivo, por lo que es posible que se esté albergando información sensible, lo que puede suponer un riesgo. Este riesgo bien gestionado puede convertirse en una oportunidad.

¿Cómo se produce el Dark Data?

El Dark Data proviene de datos que se han almacenado, olvidado y que las empresas no utilizan. El origen de estos datos puede deberse a un procesamiento poco adecuado o al difícil acceso por falta de herramientas. 

No solo se generan estos datos cuando los clientes, proveedores y usuarios facilitan información a las empresas, sino que los propios empleados también pueden generarlos al almacenar datos de la empresa en sus dispositivos. En este sentido, una herramienta de análisis de datos puede ayudar a descubrir relaciones dentro de los datos existentes.

Tipos de Dark Data

Existen distintos tipos de Dark Data dentro de una organización en función de la industria y el sector. Por ejemplo, un e-commerce puede estar recopilando el historial de búsqueda, mientras que una app de comida a domicilio puede estar recolectando información relacionada con la localización.

Cada organización genera distinto tipo de Dark Data. Estos son algunos ejemplos de categorías de Dark Data más comunes en empresas:

  • Datos de Recursos Humanos
  • Datos extraídos en encuestas y estudios que nunca fueron procesados
  • Notas o presentaciones antiguas
  • Versiones obsoletas de documentos actualizados
  • Correos electrónicos
  • Cambios registrados en negociaciones de pedidos
  • Vídeos, imágenes y grabaciones
  • Registros de actividad

¿Qué oportunidades ofrece el Dark Data a una pyme?

Al ser un concepto relativamente nuevo, las empresas que sepan sacar provecho del Dark Data que almacenan serán las que encabecen la carrera de la optimización de datos, y así convertir esos datos inútiles en recursos valiosos.

Lo que a un departamento (o persona responsable) le parece de nula utilidad, a otro le puede representar el nuevo enfoque de la estrategia que le hará despuntar. El auge de las herramientas BI (Business Intelligence, por sus siglas en inglés) ha permitido crear nuevas estrategias de extracción de datos oscuros de manera más rápida y precisa.

La clave para utilizar estos datos ocultos con eficacia es tener una intención clara y un problema por resolver. Estos son solo tres ejemplos de información que las empresas almacenan y no usan que pueden aportar datos muy interesantes:

  • Los archivos de registro del servidor pueden hablar de un comportamiento escondido que tienen los usuarios de un sitio web
  • Los registros cualitativos de llamadas comerciales que se hayan generado pueden revelar sentimientos y opiniones de los clientes que no se reflejan en las encuestas de calidad de servicio al cliente
  • Si se conservan datos de ubicación móvil, pueden dar muchas pistas sobre patrones de consumo de los clientes

¿Qué problemas puede causar un descuido del Dark Data?

Una vez que una empresa sabe que posee datos ocultos, lo ideal sería actuar de inmediato. Primero, para extraer beneficios. Segundo, para evitar problemas que pueden surgir, como por ejemplo:

  • Problemas legales. Desde la aparición del Reglamento General de Protección de Datos (RGPD), toda empresa debe saber qué información, permisos o consentimiento de la misma tiene. 
  • Riesgo de filtraciones de negocio. Todo dato es útil para la competencia. Saber de qué forma una empresa se relaciona con sus clientes, qué búsquedas hace, o incluso qué foto tomó para inspirarse en su nuevo proyecto son informaciones que podrían interesar a empresas competidoras, por lo que es importante salvaguardarlas. 
  • Daños a la reputación. Actualmente la sociedad está preocupada por la protección de sus datos. Según un estudio de Capterra sobre hábitos de compra online de 2022, 1 de cada 4 consumidores online ha sido víctima de alguna estafa online en los últimos 10 años. Una brecha de seguridad o una mala gestión que salga a la luz pueden arruinar la buena fama de una organización.

Para evitar estos problemas, las empresas pueden tomar acción, auditar su información y empezar a convertir este activo inmóvil y potencialmente peligroso en una oportunidad.

¿Cómo gestionar, analizar y exprimir el potencial valor del Dark Data?

Una vez que la empresa se ha decidido a analizar sus datos oscuros, ¿por dónde empezar? ¿Qué pasos se deben seguir para gestionar y aprovechar el valor del Dark Data de forma eficaz? Este es el proceso que cualquier organización, independientemente de su tamaño, puede seguir para una estrategia de gestión de Dark Data eficaz:

Estrategia para gestionar Dark Data en una empresa

Para muchas empresas, gestionar una gran cantidad de datos oscuros puede resultar abrumador por el tiempo de trabajo que puede conllevar. No obstante, el tiempo puede reducirse al utilizar las herramientas adecuadas. 

Para obtener valor de una gran cantidad de datos y en un corto periodo de tiempo, las empresas deben automatizar los procesos, y esto se puede conseguir mediante el Machine Learning para empresas. Esta tecnología es una aplicación de la inteligencia artificial (IA) que proporciona a los sistemas la capacidad de aprender automáticamente, procesar datos y ejecutar programas de forma continua. En la actualidad existen herramientas de Machine Learning para automatizar procesos.

También existen herramientas BI para gestionar el Dark Data. Estas herramientas permiten a las empresas acceder, analizar y compartir información con tal de tomar decisiones que realmente beneficien al negocio. Por ejemplo, se pueden crear informes que muestren de forma clara qué datos se almacenan, de dónde vienen y desde cuándo están almacenados. 

Usando los software adecuados, se evitará malgastar recursos humanos y económicos en intentos de gestión de excedentes de información que acaban quedando aparcados por falta de tiempo.

Dark Data: una gran oportunidad para mejorar el análisis de datos

Lejos de tomar el hecho de almacenar Dark Data en una empresa como un problema, puede convertirse en una oportunidad para mejorar en uno o varios ámbitos del negocio. 

Combinar datos estructurados y no estructurados es una estrategia interesante para que una empresa obtenga resultados valiosos. Una vez clara la definición de Dark Data y los beneficios que puede aportar, cualquier negocio puede comenzar a optimizar la gestión de información.

¿Quieres saber más? Visita nuestro catálogo de herramientas BI para descubrir más productos.

Este artículo puede referirse a productos, programas o servicios que no están disponibles en tu región, o que pueden estar restringidos según las leyes y regulaciones de tu país. Te sugerimos que consultes directamente con el proveedor de software para obtener información sobre la disponibilidad del producto y conformidad con las leyes locales.

Sobre los autores

Bruno es Senior Content Analyst, experto en tecnología. Especializado en investigación de tendencias de software B2B. Lo encuentras inmerso en datos o dibujando un laberinto.

Bruno es Senior Content Analyst, experto en tecnología. Especializado en investigación de tendencias de software B2B. Lo encuentras inmerso en datos o dibujando un laberinto.

Alejandra es Content Analyst y periodista. Especializada en nuevas tendencias en tecnología y marketing B2B. Sus grandes pasiones: literatura, viajes y misterios.

Alejandra es Content Analyst y periodista. Especializada en nuevas tendencias en tecnología y marketing B2B. Sus grandes pasiones: literatura, viajes y misterios.