No se trata de obtener el dato perfecto. Se trata de conseguir un dato lo suficientemente bueno como para asegurar que obtengamos la mejor información en aquello para lo que se ha capturado.
Todo proceso puede ser siempre mejorado, y esa es la forma más efectiva de incrementar su capacidad y rentabilidad. La disponibilidad de los datos y la capacidad actual de almacenamiento y cómputo hace que estemos en la época dorada de la optimización. Los proyectos de sensorización y obtención de datos de una planta productiva son esenciales para poder analizar los procesos y establecer proyectos de mejora y ahorro de costes.
La cuestión es que esta adquisición sistemática de datos genera un crecimiento importante de la información generada. Aparecen entonces lo que podríamos denominar problemas físicos relacionados con los datos: la velocidad de su procesado, su calidad y validez, y su seguridad y propiedad.
Tecnológicamente es un reto asumible hoy día tener que trabajar con múltiples fuentes de datos estructuradas y desestructuradas, y manejar ingentes volúmenes de información, a un coste, en general, aceptable. La pregunta es: ¿para qué? ¿realmente es siempre necesario? En los casos en los que lo sea, ¿cuál es la calidad de mis datos? ¿me sirven para tomas las decisiones correctas? Y, finalmente ¿puedo actuar a tiempo a partir de los datos?
La obtención de información no puede ser solo un ejercicio de capacidad tecnológica. Que se pueda hacer no significa que se deba hacer, ni que sea necesario hacerlo. Y ya no es solo que el exceso de información genera dificultades para su comprensión y en la toma de decisiones.
En todos los procesos, a medio y largo plazo, existirán siempre pérdidas que solo pueden reducirse o eliminarse en tiempo real, es decir, en el momento en el que ocurren, y no después. No es adecuado, en la mayoría de los casos, enviar a un servidor, a la nube, absolutamente todos los datos obtenidos para su procesado.
Muchos datos pueden, y deben, ser procesados lo más cerca posible de la línea de producción, en los sensores, en los concentradores o en plataformas propietarias, no solo para asegurar la reacción en el mínimo tiempo sobre la planta, sino también para garantizar la propiedad de la información y la máxima seguridad e integridad del dato.
Nos queda la clave esencial: asegurar la calidad del dato. No se trata de obtener el dato perfecto, algo que puede resultar tan caro como inútil e innecesario. Se trata de conseguir un dato lo suficientemente bueno como para asegurar que obtengamos la mejor información en aquello para lo que se ha capturado.
En relación al tratamiento de datos, en definitiva, se debe poder asegurar:
- Disponibilidad: datos disponibles dónde y cuándo se necesitan
- Autenticidad: datos fiables, con la calidad adecuada
- Integridad: datos útiles y coherentes, sin modificaciones, ni pérdidas
- Confidencialidad y seguridad: datos protegidos