La Inteligencia Artificial (IA), en su modalidad generativa, está llegando también a la industria editorial mediante la utilización de voces humanas clonadas para narrar audiolibros. Por ello, el uso de esta tecnología despertando muchas incógnitas en una industria como la del audio en español, que ha crecido un 75% en un año.
Y precisamente al análisis de las diversas cuestiones que suscita el uso de esta tecnología en el ámbito de la voz se ha dedicado una jornada organizada por el despacho de abogados internacional Bird & Bird en sus oficinas de Madrid, junto con Intelivoz, una compañía especializada en la creación de valor para las empresas a través de la voz.
La sesión contó con la participación de Manuel Monterrubio y Antonio Quirós (Socios de Intelivoz), Teresa Marcos (Locutora de La General de Locutores), Raúl Lara (Presidente del sindicato de doblaje ADOMA), Maribel Riaza (Content Acquisition Manager, Storytel), Joaquín Muñoz (Socio de Bird & Bird), María Paz García Rubio, (Catedrática de Derecho Civil, Universidad de Santiago de Compostela) y Julia Ammerman Yebra (Profesora de Derecho Civil, Universidad de Santiago de Compostela).
La voz como derecho fundamental y como bien cultural
Aunque el uso de la IA en el sector sigue siendo motivo de controversia, la postura de los actores de voz frente a la expansión de esta tecnología en su trabajo es “más optimista que en enero del año pasado”, ha indicado Teresa Marcos. Según Marcos, fue entonces cuando se produjo una auténtica explosión en el uso de estas tecnologías.
“Las voces sintéticas existen desde hace mucho tiempo, lo veíamos por ejemplo en los contestadores automáticos, pero conseguir un modelo que replicara de forma parecida la voz de las personas era un proceso muy costoso, que requería grabar más de 10.000 frases y cuyo resultado tampoco era muy bueno. Todo esto cambió en enero de 2023 con la aparición de tecnología que, con tres minutos de captura de voz fonética, clonaba la voz con una calidad mucho más parecida a la natural”, ha indicado Antonio Quirós, de Intelivoz.
Una calidad que despierta muchas incógnitas respecto al derecho fundamental a la propia voz. En palabras de Teresa Marcos, “la voz nos parece un bien cultural. Por lo tanto, no se puede y no se debe creer que todos los libros se deben leer de la misma manera. Es necesario defender la identidad propia y de ámbito cultural de la voz, una circunstancia que cuando la IA comenzó a usarse en el sector no se tenía en cuenta”.
La voz como factor de seguridad
Además, la mayor sofisticación de IA Generativa suscita riesgos de seguridad, porque, como explicó Raúl Lara “si la voz sintética tiene la capacidad de imitar la manera de actuar, la cadencia y la entonación propias de una persona, se produce una brecha de seguridad”.
Este experto recordó como hace unos meses se viralizaba en redes sociales el uso de una IA que doblaba automáticamente a otros idiomas las voces de personajes famosos, a los que también se les podían atribuir frases que no habían pronunciado. “Entonces no se le dio importancia porque eran memes que se entendían como una broma, pero esa era ya una vulneración de los de derechos de imagen. Hay muchos riesgos y muy complejos detrás de todo esto” ha advertido Loma. “Nos preocupa que un derecho fundamental como es la voz pueda ser clonada y entre en un circuito que se escape a nuestro control”. A los ya riesgos ya mencionados, Lara suma además otra serie de peligros que afectarían al ámbito de los derechos laborales y socioculturales, porque “la tecnología avanza tan deprisa que no sabemos qué consecuencias va a tener”.
No obstante, el uso de IA generativa en el ámbito de la voz puede representar también una serie de oportunidades que Maribel Riaza, de Storytel, sitúa en términos de “cantidad, diversidad y rentabilidad”, aunque este último punto con matices.
Como destacó Riaza, “el uso de IA nos permite narrar un libro no sólo en castellano, sino que, si el usuario quiere escucharlo, por ejemplo, con acento argentino, la IA nos permite hacerlo. También escoger entre una voz masculina y una femenina. Esa diversificación de otro modo sería imposible”. No obstante, y aunque a día de hoy las voces sintéticas imitan a la voz humana, no están en el mismo nivel de entonación y se requiere de mucho trabajo de posproducción, lo que en muchos casos no es rentable.
¿Aportará más seguridad el Reglamento de IA que prepara la Unión Europea?
La Unión Europea trabaja en un Reglamento de IA, que tiene por objeto garantizar que los sistemas de esta tecnología introducidos en el mercado europeo y utilizados en la UE sean seguros y respeten los derechos fundamentales y los valores de la UE.
No obstante, “probablemente este reglamento no vaya a solucionar muchas de las dudas que suscita el uso de IA en el ámbito de la voz”, advirtió Joaquín Muñoz. “El uso de la IA en el ámbito de la voz se atajará con la normativa que ya existe, relativa a Propiedad Intelectual, Protección de Datos…”, porque, como explicó este experto, “el reglamento europeo se centra en los riesgos derivados de los usos que se hagan de la IA”. Es decir, regulará lo que se puede y no se puede hacer, sin embargo, señala, “se han determinado una serie de usos de alto riesgo en los que probablemente la voz pueda entrar, por ejemplo, si la IA se utiliza para influir en colectivos vulnerables”.
Para Joaquin Muñoz, en el futuro la regulación irá en el sentido de identificar los contenidos generados artificialmente. “El camino será dotar de transparencia a estos contenidos, que el usuario tenga la libertad de consumir el contenido que quiera siempre que esté informado de si lo que está escuchando está generado por una máquina o por una persona”.
Permiso para el uso de la voz
¿Y cómo se protege la voz en nuestro ordenamiento jurídico? ¿Qué deben incluir los contratos entre profesionales de la voz y empresas de IA? Julia Ammerman señaló a este respecto que: “El consentimiento tiene que incluir tanto el permiso para la grabación como para ceder los derechos de voz. Tiene que ser un consentimiento acotado, en el que se autoriza expresamente esa intromisión en los derechos a la voz. Acotado en el tiempo y también en cuanto al contenido y los usos determinados. Será una cuestión de negociar en el ámbito contractual a qué cede cada locutor, cada actor de voz”.
Además, Ammerman apuntó la necesidad de que exista una facultad de revocación: “Si es una revocación sin causa habría que indemnizar a la otra parte los perjuicios causados”. Además, la cesión de derechos se hará una empresa concreta o empresas del mismo grupo, y siempre que en el contrato se especifique cuáles son.
¿Se estás cumpliendo estas condiciones? Para María Paz García Rubio, a día de hoy existe “un batiburrillo” contractual donde se mezclan diferentes áreas que complican dotar de seguridad a la industria. “Hay una cantidad de copias literales de cláusulas procedentes de contractos anglosajones que son inadaptables al derecho español, y cuando tienes que interpretar ese contrato, te enfrentas a una inseguridad jurídica total”.