Metadatos online y big data. Diferencias y ventajas cuando se complementan
Los metadatos online o in house son ignorados constantemente en los proyectos Big Data, y eso va en perjuicio del propio proyecto. Son ignorados porque muchas veces se da por sentado que la gestión de Big Data ya lo contempla. Pero esto no siempre es así y los metadatos online son cruciales para el éxito general de un proyecto Big Data así como para la organización de la arquitectura de datos de la empresa.
Créditos fotográficos: Aleutie
También ocurre que algunas veces los metadatos online son confundidos con el Big Data. Es importante conocer la diferencia entre metadatos online y Big Data para determinar si el Big Data los contiene, si Big Data en realidad es solo una gran colección de metadatos o si es más que eso.
Hay algunas diferencias clave que vamos a ver.
Puntos de divergencia entre Big Data y los metadatos online
Igual que sucede con la aguja y el pajar, al comparar los metadatos online con Big Data se aprecia la diferencia, no sólo en cuanto a volumen, sino en cuanto a granularidad.
Los grandes datos son una colección de información de dimensiones incalculables que evolucionan a gran velocidad, esto dificulta su análisis y procesamiento, algo que requiere del uso de tecnología avanzada para descubrir tendencias y patrones. Por su parte, los metadatos son los detalles descriptivos de un activo digital individual. Gracias a su especificidad consiguen proporcionar información granular sobre un único archivo.
Sin embargo, hay que tener en cuenta que, cuando se crea un activo digital, también se están generando metadatos online sobre su origen, hora de creación, fecha y formato, entre otros. Y no basta con disponer de ellos para mantenerse organizado en la era digital, sino que, estos datos sobre los datos:
- Deben estar debidamente nombrados, etiquetados, almacenados y archivados en un lenguaje consistente con otros activos de la colección. El principal beneficio de la consistencia en la administración de los metadatos online es que elimina la necesidad de tener una persona encargada de saber dónde está todo ya que, cuando la taxonomía es la misma el trabajo se simplifica y se puede hacer un aprovechamiento más eficiente de los recursos.
- Necesitan que se lleve a cabo una gestión de activos adecuada, en base a una metodología que permita encontrar y distribuir los activos, permitiendo aprovechar todo su valor.
- Hay que comprender los metadatos online, de igual forma que es preciso conocer la diferencia entre datos estructurados y no estructurados.
El entorno Big Data continúa expandiéndose rápidamente y, por eso, es crucial invertir el tiempo necesario en asegurarse de que los metadatos online del negocio están bien gestionados, ordenados y listos para su consumo.
Sólo de esta forma, estos datos descriptivos, administrativos y estructurales que definen los activos informacionales de la empresa podrán proporcionar el valor y el propósito del contenido de los datos, convirtiéndose así en una herramienta eficaz para localizar rápidamente la información, algo imprescindible para los análisis de Big Data y los informes de los usuarios empresariales.
via El valor de la gestión de datos http://ift.tt/2yN14S8
Comentarios
Publicar un comentario