Cargando. Por favor, espere

Portada

Cada vez se van difundiendo más los sistemas y herramientas que permiten avanzar en el desarrollo de modelos de inteligencia artificial, pero de una manera más respetuosa en relación con la protección de datos y acorde con las exigencias de la normativa de privacidad. Es lo que ocurre con el aprendizaje federado, que permite procesar un gran volumen de información para entrenar estos sistemas basados en algoritmos, con una diferencia sustancial: los datos están descentralizados y no se comparten en la nube. Gracias a ello, facilita el avance de esta tecnología estratégica sin renunciar al cumplimiento de lo dispuesto en normas como el Reglamento General de Protección de Datos (RGPD) (LA LEY 6637/2016) y en el Reglamento de Inteligencia Artificial (LA LEY 16665/2024) europeo (RIA).

¿Qué es el aprendizaje federado o federate learning (FL)? Se trata de un tipo de aprendizaje automático o machine learning (ML) que permite que múltiples fuentes de datos, ya sean dispositivos o entidades, cuenten con la posibilidad de entrenar de forma colaborativa un modelo de IA compartido, aunque logrando que los datos permanezcan descentralizados.

En el origen del aprendizaje automático, los datos y el proceso de entrenamiento estaba centralizado y se localizaban en un centro de datos específico, donde se producía el aprendizaje del sistema de IA. Sin embargo, con el tiempo los costes se elevaron y también se incrementó la necesidad de una mayor potencia tanto de cálculo como de almacenamiento, que superaban las capacidades de una sola máquina. Los desarrolladores optaron entonces por almacenar sus bases de datos en servicios en la nube, que permitían distribuir los datos y facilitaban su tratamiento desde varias máquinas. Pero esto incrementa los riesgos.

El enfoque del aprendizaje federado mitiga logra mitigar las amenazas a la privacidad para estos casos, ya que los datos sin procesar permanecen localmente en las fuentes. Esto resulta particularmente beneficioso en escenarios donde la confidencialidad de los datos o los requisitos regulatorios hacen que la centralización de la información sea una solución poco práctica.

Esta modalidad de entrenamiento puede ser clave desde el punto de vista del cumplimiento normativo, sobre todo cuando el entrenamiento se realiza en base a información de carácter sensible. De esta manera, al asegurar que las bases de datos permanecen en todo momento bajo el control del responsable del tratamiento y sin quedar expuesta a terceros, el aprendizaje federado contribuye a contar con procedimientos acordes con los principios como la minimización de los datos personales y la limitación de su uso de acuerdo con la finalidad.

Así lo destaca el informe TechDispatch titulado “Aprendizaje federado”, que han publicado de manera conjunta la Agencia Española de Protección de Datos (AEPD) y el Supervisor Europeo de Protección de Datos (EDPS). El documento también detalla casos de uso desplegados en el sector sanitario, en el desarrollo de vehículos autónomos y de asistentes de voz.

Pero hay más ventajas. El federate learning contribuye a una gobernanza de datos más efectiva, permitiendo que diversas entidades colaboren en el entrenamiento de modelos de IA, incluso con aquella información de carácter estratégico, sensible o confidencial que no podría ser compartida de otra manera. El informe detalla varias áreas de aplicación de modelos de IA entrenados con aprendizaje federado, como las recomendaciones personalizadas, el análisis de datos sanitarios, espacios de datos y sistemas de transporte autónomos y, en definitiva, cualquier área en la que se tengan que reforzar las garantías de privacidad y el cumplimiento en protección de datos.

Por otra parte, mejora la responsabilidad proactiva y la auditabilidad, ya que los responsables tienen una visión más clara de cómo se tratan los datos personales. Al compartir únicamente modelos o sus actualizaciones, se refuerza la confidencialidad de los datos personales, limitando la necesidad de su centralización y reduciendo el impacto de posibles brechas o accesos irregulares a gran escala.

A ello se suma una ventaja adicional que caracteriza el uso del aprendizaje federado en el desarrollo de sistemas basados en IA y es que se trata de una tecnología de doble uso, es decir, que resulta útil tanto para el cumplimiento en materia de protección de datos personales como para el impulso de la economía digital.

Retos del aprendizaje federado en el desarrollo de la IA

El documento recalca la necesidad de implementar criterios y medidas de seguridad de manera integral, que abarque todo el sistema que compone la herramienta de aprendizaje federado. Otro desafío de calado consiste en garantizar la calidad de los datos, de modo que se eviten sesgos en el entrenamiento.

Uno de los principales retos que presenta es la posibilidad de fuga de datos a través de las actualizaciones de los modelos, ya que, aunque no se acceda de forma directa a los datos originales, a partir de un ciberataque se podría inferir información confidencial.

Además, hay un punto crítico que se debe tener en cuenta en todo el proceso. Y es que no se puede pensar que por el solo hecho de utilizar el aprendizaje federado, habrá mayores garantías dadas de forma automática. Por el contrario, será necesario mantener una actitud vigilante, proactiva y así evitar dar por asegurado que los parámetros intercambiados o los modelos resultantes son totalmente anónimos, pues los atacantes suelen buscar el eslabón más débil de toda la cadena para acceder. Será no solo recomendable, sino indispensable realizar un análisis técnico y legal exhaustivo de todo el proceso.

Por estos motivos y también para obtener el máximo rendimiento del sistema de aprendizaje federado para la IA, las dos entidades subrayan que se debería priorizar la protección de datos desde el diseño mismo de cualquier herramienta, de modo que se implementen soluciones que sean capaces no solo de reducir el riesgo para las personas y facilitar el acceso a los datos personales, sino también que incrementen la confianza entre los desarrolladores y emprendedores, de manera que siga impulsándose la inversión en proyectos empresariales y otras iniciativas basadas en la en la economía digital.

Scroll