Cargando. Por favor, espere

Portada

Unos los califican como el “oro digital” y otros como el “petróleo” del siglo XXI. Lo cierto es que los datos son la pieza clave para el desarrollo de numerosas tecnologías y prácticamente toda la economía digital se basa en ellos. Sin embargo, hay una dificultad: el acceso a esta información. Y es que su disponibilidad no siempre está garantizada. Vivimos en un contexto condicionado por marcos normativos que protegen los derechos fundamentales y que exigen la implementación de metodologías de gestión que impulsen la innovación y, a la vez, que ofrezcan garantías para la privacidad de las personas, con requisitos legales que se deben cumplir obligatoriamente a la hora de tratarlos. En este sentido, los datos abiertos son una oportunidad para avanzar en soluciones tecnológicas, ya que suponen una fuente adicional de información para impulsar estos desarrollos.

Los datos abiertos son aquellos a los que cualquier persona o empresa puede acceder, utilizar y compartir y son susceptibles de ser explotados cuando se encuentran disponibles en un formato común, es decir, que sea legible por las máquinas. Para lograrlo, se necesita una licencia que facilite su transformación, combinación y uso compartido, incluso con fines comerciales.

El uso de datos abiertos puede suponer varias ventajas para una empresa, independientemente del sector en el que opera o de su tamaños.

Por una parte, acceder a ellos supone contar con una fuente de información adicional que refuerza el proceso de toma de decisiones y la comprensión de las tendencias del mercado. También pueden contribuir a identificar las demandas de los consumidores, usuarios o clientes y a detectar nuevas oportunidades empresariales. Adicionalmente, la información que aportan puede contribuir a transformar la oferta, con la creación de nuevos productos y servicios.

¿Y la otra cara de la moneda? Hay algunos inconvenientes en el uso de los datos abiertos. No suele ser recomendable depender de ellos y lo ideal es tomarlos como una fuente complementaria y no como la base central sobre la cual adoptar decisiones de negocio en las empresas. Otras de las desventajas es que pueden derivar en un elevado grado de dependencia externa, es decir, de datos de terceros, cuya oferta puede variar o ser volátil. Además, el tamaño de los conjuntos de datos abiertos puede resultar inabarcable y exigir un elevado nivel de recursos para su procesamiento y almacenamiento.

A ello se suma que en muchas ocasiones pueden estar descontextualizados, por lo que procesarlos y comprender su significado no siempre será fácil y, en algunos casos extremos, pueden inducir a error. Será necesario contar con información adicional, como los metadatos detallados que permitan saber cómo se recopilaron, procesaron y utilizaron. Por último, su calidad puede ser menor que la de aquellos con los que cuenta la propia empresa y no son raros los casos en los que se pueden encontrar datos obsoletos, errores, inconsistencias, etc. Todo ello tendrá un impacto en la toma de decisiones.

Breve guía para utilizar los datos abiertos

Una vez se tiene acceso a los datos, se deben utilizar con un propósito. Según el Portal europeo de datos, que recopila metadatos a partir de información del sector público disponible en portales de datos de acceso público de los distintos países europeos, hay una serie de directrices que se deberían seguir para el uso de datos abiertos.

En primer lugar, hay que tener en cuenta el objetivo que se persigue con el uso de estos datos. Tanto si su utilización se orientará a actividades o desarrollos de tipo comercial o privado, ofrecen una gran diversidad de posibilidades y pueden añadir valor de distintas maneras, por ejemplo, al recabar información sobre un determinado tema en el que se desea profundizar o incluso sobre el que se quiere escribir un informe. Asimismo, pueden aportar información para el desarrollo de una aplicación o un servicio. Y las empresas pueden utilizar los datos abiertos para optimizar los perfiles de sus clientes y satisfacer mejor sus necesidades.

Por otra parte, será necesario determinar si los datos se ajustan a las necesidades de la empresa. Para saberlo, será necesario comprobar los metadatos, es decir, los datos sobre los datos.

Otro paso indispensable será verificar la licencia para comprobar que efectivamente se trata de datos abiertos. Es decir, tiene que existir una licencia que avale el uso que se prevé realizar de los datos a los que va a acceder la empresa o la persona, por ejemplo, que permita la reutilización con fines de lucro si se van a utilizar para desarrollar un producto que se va a comercializar.

Además, habrá que comprobar otros requisitos relacionados con la autoría de los datos: la licencia podría exigir que las personas que utilicen esta información mencionen la fuente que los publica: es lo que se conoce como atribución de autoría. Y habrá que tener la certeza de si se exige o no compartir bajo la misma licencia. En otras palabras, es necesario tener claridad sobre si los usuarios que combinen los datos abiertos con otros están obligados a publicar también estos últimos como datos abiertos. Esto es importante porque supondría que habría que divulgar los datos propios bajo una licencia similar, tras añadirlos a la fuente original: es decir, habría que compartir bajo la misma licencia.

Una vez verificados estos pasos, será el momento de descargarlos. Es probable que se permita ejecutar esta acción en distintos formatos de archivo y será necesario elegir el formato más adecuado, siendo el más habitual en forma de tabla csv: con ello se permite añadir información al archivo o realizar cálculos con los datos. Lo más frecuente es que los conjuntos de datos que pueden modificarse se publiquen en un formato abierto, pero algunos no pueden modificarse, como es el caso de los archivos pdf.

Otra comprobación importante es la actualización. La web que los aloja suele indicar la última fecha de modificación del archivo. Por último, siempre es recomendable comprobar antes de todo que el archivo contiene la información que se necesita.

Scroll