Actualmente el Big Data, es decir, los datos masivos, es uno de los activos más valiosos de las empresas. Cuantos más datos se obtengan y mejor sea su calidad, mayor será la idoneidad de las decisiones que se tomen en base a ellos y mayor será el valor que aporten a las organizaciones.
Los datos nos ayudan a tomar decisiones objetivas y a contrastar la efectividad de las mismas, dejando atrás la intuición. La Inteligencia de Negocio o Business Intelligence es la estrategia empresarial que emplea el Big Data en la toma de decisiones. Además, si aprovechamos los datos generados en los diferentes procesos empresariales y les agregamos valor, conseguimos generar conocimiento. Pero, ¿cómo podemos conseguir esto? Incluyendo procesos de separación, agrupación, evaluación, clasificación y comparación que nos ayuden a alcanzar los estándares de calidad necesarios.
Como indica Miljenko Bartulovic, experto en Big Data de Grupo ICA “los datos por sí mismos no ayudan a tomar mejores decisiones si no cumplen con un grado de calidad adecuado al uso que se les pretende dar.”
El almacenamiento de la información ha evolucionado increíblemente desde la irrupción del Big Data, y no solo en lo que respecta al volumen, sino a la estructuración o no estructuración de los datos, análisis del lenguaje natural, imágenes o incluso vídeos. Ahora no pensamos únicamente en una base de datos que debe contemplar todos los campos y atributos necesarios para que cada uno de los departamentos de la organización pueda beneficiarse de emplear la información más útil y fiable posible, sino que debemos modelar la información según la realidad del negocio de cada organización y, a partir de ahí, integrar todos los posibles orígenes de datos, tratarlos, dotarlos de información contextual del negocio, enriqueciendo su valor y, dotar a la Dirección de las herramientas necesarias para la explotación inteligente de los mismos. Además, se debe garantizar que la información mantenga unas cualidades determinadas evitando su deterioro.
Como con cualquier otro activo estratégico de una organización, los datos deben ser almacenados de forma segura. Es necesario tomar las debidas precauciones para impedir accesos no permitidos, prevenir su degradación, garantizar la confiabilidad y evitar fugas y robos de información. Incluirlo en las políticas de continuidad del negocio, en los procesos de mejora, en las políticas de calidad y establecer responsabilidades con respecto a la custodia, tratamiento y acceso a la información, son prácticas muy recomendables si queremos que nuestros datos gocen de buena salud.
Cada usuario de los datos demandará unas cualidades, requisitos o funcionalidades que deben cumplir. Por tanto, la calidad de los datos (entendida como término genérico que describe las características específicas que deben cumplir) es diferente en cada organización ya que deben responder tanto a las necesidades y requerimientos específicos de un entorno empresarial concreto y único como a las necesidades internas de cada uno de los usuarios. Si bien para determinados usos el ratio calidad del dato con respecto al coste es negociable, desde la perspectiva legal, una organización con estándares de calidad del dato insuficientes puede estar incumpliendo la normativa de protección de datos vigente (RGPD en Europa) además de generar una multitud de inconvenientes que afectan tanto al negocio como a clientes o a tu propio personal.
El análisis, limpieza, comparación, integración, migración, consolidación, sincronización y monitorización de enormes cantidades de datos conlleva unos costes tan elevados que ninguna organización está dispuesta a asumir. Por eso, tendremos que tener en cuenta para qué necesitamos los datos a la hora de establecer cuál es el nivel de calidad más adecuado para los mismos. Según Bartulovic debe ser “el nivel de calidad suficiente que garantice unos resultados libres de errores y lo más reales y completos posibles.”
Toda la información introducida de forma manual es posible que constituya la mayor fuente de errores ya sea por la introducción de valores equivocados, incompletos o repetidos. Imaginemos el registro duplicado de un cliente que ha sido primero registrado con su nombre comercial y posteriormente, con su razón social. Será necesario contar con la tecnología de comparación necesaria que identifique esta duplicidad y la solucione.
Los datos externos pueden ayudar a las organizaciones a tomar mejores decisiones al complementar los datos internos. El volcado automático de datos externos y la incorporación de nuevos datos son también algo a tener en cuenta a la hora de mantener una buena calidad del dato debido al posible desconocimiento sobre el estado de la calidad de los datos externos que estamos incorporando y que pueden afectar al estándar interno ya alcanzado.
Los sistemas transaccionales son aquellos encargados de recolectar, almacenar, modificar y recuperar los datos generados en una organización y, en numerosas ocasiones, durante la carga de la información, se producen múltiples errores que deterioran la calidad. Además, habrá que prestar especial atención al delicado proceso de migración de los datos puesto que un análisis pobre y superficial del estado de los mismos no identificará aquella información duplicada, obsoleta e inadecuada. También tendremos que ser precavidos con la incorporación de nuevas aplicaciones asegurándonos de que la información recogida por estas cumple con los estándares de calidad de datos establecidos.
Para establecer el estándar de calidad de los datos, en necesario comprender las necesidades de cada uno de los interesados y sus procedimientos. Además, para que la explotación de los datos sea exitosa, es necesario que los interesados que se nutren de la misma información, se pongan de acuerdo sobre aquella que es intercambiable, en qué medida y a qué niveles es accesible y decidan quién es el propietario de la misma. Esto implica la necesidad de un alto nivel de compromiso de todas las partes implicadas a la hora de aceptar restricciones, aportar soluciones y velar por cuidar la calidad del dato, enriquecerlo y no degradarlo.
Una organización con estándares de calidad del dato insuficientes, puede estar incumpliendo la normativa de protección de datos vigente además de sufrir costes no planificados, desperdiciar recursos, perder competitividad, perjudicar la relación con el cliente y perder eficiencia en la toma de decisiones. Por eso, adecuar la calidad del dato a las necesidades específicas de cada entorno empresarial concreto, a las necesidades internas de cada usuario, y a la legalidad vigente, es primordial.
Recoger y almacenar grandes cantidades de datos no es suficiente para tomar las decisiones más acertadas. Invierte en la calidad del dato.