Cargando. Por favor, espere

Portada

I. Introducción

El lenguaje jurídico constituye, paradójicamente, tanto el vehículo de expresión del Derecho como una de las principales barreras para su comprensión por parte de los justiciable. Esta paradoja ha sido abordada ya desde los inicios del derecho español, así el Fuero Juzgo, el Fuero Real y Las Partidas se hacía referencia a como el «facedor de las leyes» debía emplear un lenguaje que «todo home la pueda entender» (2) antes que «bellas fabla» (3) . Como señala acertadamente Rosa Rodríguez Bahamonde, «el lenguaje jurídico se ha caracterizado tradicionalmente por su inaccesibilidad y hermetismo: la sociedad percibe con rechazo los textos jurídicos porque son difíciles de comprender» (4) .

La complejidad sintáctica, el abuso de tecnicismos, la pervivencia de arcaísmos y latinismos, así como la construcción de oraciones extensas, con múltiples frases subordinadas o coordinadas, configuran un estilo comunicativo que, si bien puede resultar preciso desde una perspectiva técnica, deviene en una barrera infranqueable para el ciudadano medio (5) . Esta situación resulta especialmente problemática en el ámbito de las resoluciones judiciales, donde la incomprensión del mensaje judicial puede comprometer derechos fundamentales.

La distancia entre el lenguaje técnico-jurídico y la capacidad de comprensión ciudadana no constituye meramente un problema de estilo o forma, sino que afecta a la esencia misma del acceso a la justicia. A ello se suma una capacidad de comprensión lectora cada vez más mermada en la sociedad. En este sentido, España alcanzó en PIRLS 2021 una media de 521 puntos, frente a los 528 registrados en 2016 y los 513 de 2011 y 2006, lo que confirma un retroceso de -7 puntos tras la pandemia y, aun así, un saldo positivo de +8 puntos respecto al arranque de la serie. Ese resultado la sitúa 12 puntos por debajo del promedio OCDE (533) y 7 puntos por debajo del total de la UE (528) (6) .

En PISA 2022 los adolescentes españoles obtuvieron 474 puntos en comprensión lectora, prácticamente alineados con la media OCDE (476) . La serie revela una caída sostenida: 496 puntos en 2015 (máximo histórico) , 477 puntos en la atípica edición de 2018 (publicada con retraso por «anomalías» muestrales) y los 474 puntos actuales, que suponen -22 puntos en siete años.

En esta línea, la Comisión de Modernización del Lenguaje Jurídico emitió un Informe en 2011 en el que revelaba que un 82% de los ciudadanos que se acercaban a la justicia consideraban el lenguaje jurídico excesivamente complicado y difícil de entender (7) . Esta cifra ilustra la magnitud de un problema que trasciende lo meramente lingüístico para convertirse en una cuestión de acceso efectivo a la justicia.

En este contexto de necesaria modernización del lenguaje judicial,  se hace preciso no ya sólo recurrir al empleo de un lenguaje más sencillo, sino que, como es necesario el empleo de lenguaje técnico para resolver problemas jurídicos y el volumen de estos sigue aumentando

En este contexto de necesaria modernización del lenguaje judicial, en el que la sociedad cada vez demanda más servicios a la Administración de Justicia, y al mismo tiempo desciende en su nivel de comprensión lectora, se hace preciso no ya sólo recurrir al empleo de un lenguaje más sencillo, sino que, como es necesario el empleo de lenguaje técnico para resolver problemas jurídicos y el volumen de estos sigue aumentando; acudir al uso de nuevas tecnologías que facilitará la traducción a un lenguaje comprensible de las resoluciones judiciales; y ello, no sólo de cara al justiciable, sino también al profesional que ha de explicar la resolución a su cliente. Y para ello, el uso de Inteligencia Artificial puede ser una herramienta muy útil para realizar una doble operación hermenéutica: por un lado, decodificar el lenguaje técnico-jurídico de las sentencias; por otro, recodificar su contenido en un registro lingüístico accesible y personalizado según las características del receptor.

Como ha señalado Prieto de Pedro, el buen lenguaje jurídico se sostiene sobre tres virtudes inseparables—claridad, precisión y corrección—que encarnan respectivamente los valores de la democracia, la seguridad jurídica y la cultura cívica. De ahí el dilema: renunciar al tecnicismo compromete la certeza del Derecho, pero aferrarse a él sin traducirlo convierte la ley en jerga corporativa. La solución exige, pues, un equilibrio que hoy puede facilitar la inteligencia artificial, capaz de decodificar el tecnolecto sin sacrificar el rigor y sin necesidad de prescindir del mismo, y de recodificarlo en un registro accesible al justiciable y únicamente dirigido a él. A saber, el juzgador podrá seguir empleando su rigor técnico, comprensible para los profesionales, y el justiciable recibirá una versión inteligible.

II. El derecho a entender las sentencias judiciales

1. Marco normativo: de la Carta de Derechos del Ciudadano a la LO 5/2024

La evolución normativa del derecho a la comprensión judicial en España traza una trayectoria ascendente que culmina con el reconocimiento expreso en la Ley Orgánica 5/2024, de 11 de noviembre, del Derecho de Defensa (LA LEY 25554/2024). Este iter legislativo se inicia con la Carta de Derechos de los Ciudadanos ante la Justicia (LA LEY 21476/2002) (2002), que proclamaba que «el ciudadano tiene derecho a que las sentencias y demás resoluciones judiciales se redacten de tal forma que sean comprensibles por sus destinatarios, empleando una sintaxis y estructura sencillas, sin perjuicio de su rigor técnico» (8) .

La reciente LO 5/2024 (LA LEY 25554/2024) representa un salto cualitativo en esta materia al elevar a rango de ley orgánica lo que hasta ahora constituían meras declaraciones programáticas. El artículo 9 de la norma establece con meridiana claridad que «los actos y comunicaciones procesales se redactarán en lenguaje claro, de manera sencilla y accesible universalmente, de forma que permitan conocer a sus destinatarios el objeto y consecuencias del acto procesal comunicado» (9) . Esta formulación normativa introduce un elemento crucial: la claridad no se define en términos absolutos, sino en relación con la capacidad de comprensión del destinatario específico, y este elemento, el destinatario y sus características precisas, es el elemento más importante al objeto del empleo de la Inteligencia Artificial en la decodificación y recodificación de las resoluciones judiciales.

2. La claridad como componente esencial del derecho de defensa

La conceptualización de la claridad lingüística como elemento constitutivo del derecho de defensa supone una reconfiguración profunda de las garantías procesales. Ya no basta con que las resoluciones judiciales estén formalmente motivadas; es preciso que dicha motivación resulte inteligible para sus destinatarios. Como bien señala Ciro Milione en su monográfico sobre la motivación judicial, la construcción jurisprudencial del Tribunal Constitucional –centrada en la razonabilidad, la lógica y la proscripción de la arbitrariedad– ha venido soslayando un elemento decisivo: la comprensibilidad del propio discurso jurídico en las resoluciones. Milione demuestra que, aun cuando el artículo 24 CE (LA LEY 2500/1978) obliga a ofrecer una resolución motivada, el núcleo de esa motivación se ha evaluado casi exclusivamente desde parámetros de corrección técnica (ratio decidendi, congruencia, ausencia de error patente), dejando fuera la claridad del lenguaje como exigencia constitucional autónoma. En esa laguna normativa, el autor sitúa el germen de un incipiente «derecho a la claridad» vinculado a la tutela judicial efectiva y respaldado empíricamente por los trabajos de la Comisión de Modernización del Lenguaje Jurídico (2011), que denunció la opacidad de las sentencias y propuso su reformulación en términos accesibles para la ciudadanía. Ese planteamiento, que conecta directamente con la finalidad teleológica de la nueva LO 5/2024 (LA LEY 25554/2024), refuerza la tesis de que sin inteligibilidad textual el derecho de defensa queda, en la práctica, desactivado.

3. Barreras lingüísticas en la comunicación judicial

Las barreras que obstaculizan la comprensión de las resoluciones judiciales constituyen un entramado complejo de factores lingüísticos, estructurales y comunicativos que han sido objeto de profundo análisis en la literatura especializada. La sistematización de estas barreras permite identificar los principales obstáculos que impiden la efectiva comprensión ciudadana de las decisiones judiciales.

A) Barreras léxico-semánticas

Carretero González y Fuentes Gómez (10) identifican el lenguaje jurídico como una variedad del idioma que utilizamos en los párrafos judiciales, caracterizado por términos y características propias del mundo del derecho. Entre los defectos comunicativos más comunes, destacan el uso de términos y fórmulas obsoletas («otrosí digo», «autos», «vistos»), palabras extranjeras o híbridos derivados del latín o del francés («ab intestato», «litigio», «a quo», «ad quem»), y términos cuyo significado difiere del lenguaje cotidiano.

La Guía de Redacción Judicial Clara (2023) (11) señala específicamente que los formulismos anacrónicos constituyen una de las particularidades que más llaman la atención del lector de un documento judicial. El mantenimiento, normalmente por tradición, de estos formulismos ancla el lenguaje judicial en un conservadurismo innecesario. Bizcarrondo (12) profundiza en esta cuestión al analizar la formación del léxico jurídico, señalando que la tecnificación del lenguaje jurídico se produce a través de la mutación en el significado de los términos y la creación de conceptos jurídicos específicos.

B) Barreras sintácticas

Uno de los principales defectos en la lectura de sentencias el empleo de oraciones muy largas, ordinariamente por el abuso de oraciones subordinadas. Jiménez-Yáñez y Sancho (13) señalan que cuanto más larga es la frase, más dificultades presenta para comprender los conceptos que expresa. La Guía de Redacción Judicial Clara recomienda específicamente evitar construir oraciones sobredimensionadas o con una sintaxis compleja para no fatigar la memoria de trabajo de las personas que han de leer el documento.

Por su parte, Bizcarrondo identifica características sintácticas específicas del lenguaje jurídico, incluyendo el uso de una sintaxis intrincada, pesada o ininteligible; el predominio de oraciones impersonales y pasivas; y la abundancia de oraciones largas intercaladas con mucha subordinación y coordinación. El autor señala particularmente el problema de las construcciones temporales con participio + que («firme que sea esta resolución»), ausentes desde hace muchos siglos del español general pero frecuentes en la lengua clásica.

C) Barreras pragmáticas y contextuales

Las resoluciones judiciales constituyen el medio de comunicación más importante para transmitir la información de las decisiones judiciales, ahora bien, como señala Ato Alvarado (14) , en nuestro sistema de justicia esto no se viene cumpliendo, pese a la generación de diversas iniciativas provenientes de aisladas disposiciones legales y artículos académicos.

No puede obviarse la cuestión del gerundio ilativo, Jiménez-Yáñez y Sancho señalan que «con mucha frecuencia, los redactores judiciales forman oraciones extensas y complejas mediante el uso del denominado gerundio ilativo». Esta forma subordinada, al carecer de marca de persona y tiempo, dificulta identificar el verbo flexionado con el que hay que relacionarla, complicando entender quién lleva a cabo la acción y cuándo lo hace.

D) Barreras estructurales y de organización textual

La Guía de Redacción Judicial Clara propone que «es esencial tener presente, ante todo, a quien va a recibirlo, que puede ser una o varias personas físicas, normalmente sin formación jurídica o con escasos conocimientos al respecto». Por ello, recomienda que «la información que se quiere ofrecer tiene que estar bien estructurada, sintetizada y ser realmente la que su destinatario necesita según la finalidad comunicativa de cada documento».

El lenguaje jurídico es especialmente formulario, con locuciones y fórmulas fijas que se propagan y que, si bien a veces tienen un valor unívoco y reconocido, otras resultan arcaizantes y de difícil interpretación. Son especialmente frecuentes en el encabezamiento y cierre de los escritos, órdenes y disposiciones, y están extraordinariamente consolidados a lo largo de todas las diligencias del procedimiento judicial.

E) La problemática de la transparencia judicial

Ato Alvarado establece una conexión fundamental entre lenguaje claro y transparencia: «no hay transparencia sin un lenguaje sencillo en la redacción de las resoluciones judiciales, es decir, entendible para los usuarios en general». El autor concluye que «una forma de transparentar la labor jurisdiccional no es solo que el usuario tenga acceso a la información de manera sencilla; sino que también las resoluciones judiciales que se le notifican sean entendibles tanto para el abogado que accede a los tribunales como para la persona común».

Jiménez-Yáñez y Sancho aportan una perspectiva práctica al señalar que «la aspiración a dictar resoluciones justas abarca también su correcta redacción. Las sentencias deben estar escritas con corrección, claridad y precisión. Y no por un mero prurito literario, sino como una exigencia de la justicia de la decisión».

F) Propuestas de modernización

La Guía de Redacción Judicial Clara propone medidas concretas, obviando cuestiones estéticas (negritas y saltos de línea), se centra en cuestiones gramaticales como el uso de la voz activa en lugar de la pasiva, porque «percibimos con más claridad las oraciones en estilo activo». También recomienda establecer un diálogo directo con el lector: «Una estrategia eficaz para aproximar los documentos a sus destinatarios es concebir cada documento como un diálogo amable y formal en el que el lector se sienta interpelado directamente».

Por su parte, Bizcarrondo concluye que «la renovación del lenguaje jurídico no es solamente una cuestión lingüística», señalando que «es preciso acoger la convicción de que la buena ciencia jurídica no necesita para su rigor conceptual de la mayor parte de esos aspectos que configuran el llamado "estilo jurídico"».

La superación de estas barreras requiere, como señalan unánimemente los autores consultados, no solo un esfuerzo de simplificación formal, sino una verdadera transformación en la concepción misma de la comunicación judicial, que tenga en cuenta las características específicas del receptor y privilegie la claridad sin sacrificar la precisión jurídica necesaria.

III. La personalización como estrategia de comunicación efectiva

1. Evidencia científica sobre la persuasión personalizada de las IA

Como se señaló ut supra, podemos no sacrificar el rigor del tecnolecto jurídico y al mismo tiempo servirnos de la Inteligencia Artificial para traducir las Resoluciones a sus destinatarios legos en derecho. Ahora bien, para que dicha decodificación sea efectiva, es preciso conocer las circunstancias del receptor del mensaje y adaptar en consecuencia el mismo. Así, la personalización comunicativa mediada por sistemas de Inteligencia Artificial constituye uno de los desarrollos más significativos en la intersección entre tecnología y ciencias cognitivas. Es decir, las Inteligencias Artificiales son capaces de mutar su forma de expresión para adaptarse al de su interlocutor, si bien, los estudios llevados a este efecto no se dirigen a la comprensión del mensaje, sino a la capacidad de persuasión de las Inteligencias Artificiales a través del mensaje. Esta diferencia, que podría hacer creer que nada tienen que aportar estudios al respecto con el presente problema, sin embargo, tienen una derivada que hace percibir la cuestión central del dilema.

El trabajo pionero que inspira el experimento descrito en este artículo es el realizado por Salvi et al. (2024) (15) en una colaboración entre la École Polytechnique Fédérale de Lausanne (Suiza) y la Fondazione Bruno Kessler de Trento (Italia). Los autores crearon una plataforma web donde los participantes sostenían breves debates con un adversario que podía ser otro «ser humano» o un modelo de IA (GPT-4). El estudio reclutó a 820 personas y aplicó un diseño factorial 2 × 2: los enfrentamientos podían ser humano-humano o humano-IA, y, adicionalmente, podía existir o no una condición de personalización que facilitaba a uno de los debatientes información sociodemográfica básica de su oponente.

El protocolo experimental asignaba de forma aleatoria a cada sujeto un tema y una postura inicial («A favor» o «En contra»), para luego emparejarlo con su contrincante correspondiente. La investigación se desarrolló en tres fases: (1) una etapa asincrónica preliminar donde se recogían datos demográficos; (2) la fase central, sincrónica, de debate, dividida en cuatro rondas (selección del argumento, intervención de apertura, réplica y conclusión); y (3) una fase final de evaluación posterior al debate. Esta secuencia permitía medir tanto la evolución de las opiniones como la dinámica persuasiva.

Los temas propuestos se clasificaron en tres niveles de polarización—baja, media y alta—. Entre los de baja polarización figuró «¿Deberían los delincuentes recuperar el derecho al voto?». Los de polarización media abordaron cuestiones como «¿Debe emplearse a los animales en la investigación científica?», mientras que los altamente polarizados incluyeron debates como «¿Es beneficiosa la inteligencia artificial para la sociedad?» o «¿Deben las universidades considerar la raza en las admisiones para asegurar la diversidad?».

Los investigadores encontraron que GPT-4 con acceso a información personal básica (16) incrementaba en un 81,7% las probabilidades de generar mayor acuerdo con sus argumentos en comparación con interlocutores humanos. Este hallazgo resulta particularmente relevante para nuestra discusión, pues sugiere que la capacidad de adaptación discursiva de los sistemas de IA trasciende la mera modulación estilística para constituir una genuina reconfiguración cognitiva del mensaje.

La explicación de este fenómeno radica en lo que Matz et al. (2023) denominan personalized persuasion o «targeting psicológico» automatizado mediante LLM: la capacidad de estos modelos para identificar y explotar patrones comunicativos óptimos basándose en perfiles individuales (17) . A diferencia de los comunicadores humanos, que operan con heurísticas limitadas y sesgos cognitivos, los sistemas de IA pueden procesar simultáneamente múltiples dimensiones de personalización, ajustando vocabulario, complejidad sintáctica, marcos conceptuales y estrategias argumentativas de manera dinámica y contextual.

2. La importancia de conocer al receptor del mensaje

La teoría de la comunicación jurídica ha reconocido tradicionalmente la tensión entre universalidad normativa y particularidad hermenéutica. Si bien el Derecho aspira a la generalidad y abstracción, su aplicación efectiva requiere necesariamente un proceso de concreción que tome en cuenta las circunstancias específicas del destinatario. Esta dialéctica adquiere especial relevancia en el contexto de las resoluciones judiciales laborales, donde convergen múltiples estratos de complejidad técnica y diversidad sociocultural.

En este marco, la categoría profesional del interlocutor se configura como un habitus linguistique (18) específico que, en términos bourdieuanos, constituye «el conjunto de las posiciones sucesivamente ocupadas en el espacio social y la manera de mantenerse en ellas» (19) . Este habitus no se limita meramente al vocabulario técnico sectorial, sino que estructura profundamente los esquemas perceptivos y valorativos desde los cuales los trabajadores procesan la información jurídica, a saber, lo que Husserl conceptualizó como horizontes diferenciados de experiencia y comprensión (20) . A este respecto, Bourdieu señala que el habitus lingüístico «organiza toda nuestra percepción de los productos lingüísticos» y confiere simultáneamente «el dominio práctico de un uso de la lengua y el dominio práctico de las situaciones en las cuales ese uso de la lengua es socialmente aceptable» (21) .

La implicación jurídica de esta conceptualización es que las resoluciones judiciales operan en marchés linguistiques diferenciados, cada uno con sus propias «leyes de formación de precios» simbólicos (22) . Para Husserl cada sujeto se sitúa en un mundo de la vida (Lebenswelt) específico, entendido como «el mundo en el que transcurren mi vida privada y toda nuestra vida social» (23) . En el contexto de las relaciones laborales, esto significa que cada trabajador habita un mundo de vida estructuralmente diferente al de un profesional de un sector o categoría distinto. Uniendo la teoría de Hussler con la de Bourdieu, un trabajador del sector servicios se situaría en un universo lingüístico sustancialmente distinto al de un profesional técnico o un operario industrial, no solo por sus competencias léxicas específicas, sino por sus marcos interpretativos estructuralmente diferenciados. Cada uno desarrollaría lo que Husserl denomina «modos específicos de aparecer» o «imagen del mundo», lo que implicaría desde el punto de vista principal de la tesis de este artículo y del experimento en formas particulares de percibir, interpretar y dotar de sentido a las resoluciones judiciales que les conciernen.

En definitiva, la categoría profesional del trabajador y junto con otros elementos personales, surge así como un indicador que concentra no solo el nivel educativo formal, sino también competencias lingüísticas específicas, familiaridad con discursos especializados y marcos cognitivos predominantes. La Inteligencia Artificial, al igual que puede emplear dicha información personal para construir un mensaje más persuasivo, puede también emplear dicha circunstancia para hacer que el mensaje sea más comprensible.

3. Adaptación del lenguaje según el perfil socioprofesional

La creación de sistemas de comunicación jurídica adaptativos asistidos por Inteligencia Artificial plantea desafíos conceptuales que trascienden la mera traducción lingüística, adentrándose en los fundamentos mismos de la teoría del registro y la funcionalidad comunicativa. La tesis que se sostiene en el presente artículo se enmarca en la concepción sociocognitiva del género propuesta por Parodi (24) , donde toda práctica comunicativa se articula en tres ejes interactivos: cognitivo, social y lingüístico. Dentro de ese tercer eje –el lingüístico, que actúa como bisagra entre los otros dos– se desarrollan tres niveles complementarios de personalización que se sustentan en la teoría funcionalista del registro desarrollada por Biber y Conrad (25) , quienes demuestran que las variaciones lingüísticas no son arbitrarias sino funcionalmente motivadas por las necesidades comunicativas específicas de cada contexto situacional. Estos tres niveles, dentro del eje lingüístico serían los siguientes:

  • Selección léxica contextual: Se ajusta el campo semántico predominante al dominio profesional del usuario. Según los estudios de variación inter-registro efectuados y analizado por Biber y Conrad los patrones de co-ocurrencia léxica se correlacionan con las prácticas comunicativas propias de cada comunidad. Esta tesis parte del concepto de «embedded registers» desarrollado por estos autores, quienes observan que dentro de macrotextos complejos —como las sentencias judiciales— coexisten múltiples microregistros que requieren estrategias léxicas diferenciadas según su función específica. Así, mientras la sección de hechos probados demanda un vocabulario narrativo-descriptivo, los fundamentos jurídicos exigen terminología técnica especializada que debe modularse sin comprometer la precisión semántica.
  • Modelado sintáctico adaptativo: La complejidad oracional – cantidad de ideas por oración, presencia de sustantivos derivados de verbos y uso de expresiones de obligación como «debe» o «tiene que», abuso de subjuntivos – se modula en función de las preferencias típicas del registro que el usuario, justiciable receptor de la Resolución, domina. Estos ajustes se efectúan mediante la simplificación y expansión de las oraciones, atendiendo a la idea de Biber sobre la «densidad informacional» como variable diferenciadora fundamental entre registros: mientras la prosa académica se caracteriza por construcciones nominalizadas (26) que condensan múltiples proposiciones, el discurso conversacional prefiere estructuras verbales expansivas (27) .
  • Ajuste pragmático sensible al destinatario: Adaptación de la perspectiva global del mensaje: selección de ejemplos y escenarios que resulten verosímiles para la actividad del justiciable, de acuerdo con las expectativas culturales del colectivo profesional. Este paso se inspira en la idea de que el contexto de situación es parte del conocimiento que el experto moviliza para reconocer un género y actuar en él. La sofisticación de este nivel radica en lo que Biber y Conrad denominan variación estilística funcional (28) , a saber, la capacidad de modular no solo qué se dice y cómo se estructura, sino el marco interpretativo global que gobierna la recepción del mensaje.

IV. ClarifIA: Arquitectura y funcionamiento

1. Descripción técnica de la aplicación

ClarifIA es la aplicación en la que se materializan las tesis sentadas en los diversos estudios y artículos citados ut supra, configurándose como una herramienta de mediación lingüística entre el tecnolecto jurídico y el habitus comunicativo del justiciable. La aplicación, desarrollada en Python utilizando la biblioteca Tkinter para la interfaz gráfica, implementa un sistema de procesamiento de documentos judiciales que opera en tres niveles complementarios: extracción textual, anonimización de datos sensibles y generación de explicaciones personalizadas mediante inteligencia artificial.

La arquitectura de la aplicación se estructura en torno a un núcleo funcional que integra diversas tecnologías de procesamiento del lenguaje natural. En su diseño subyace una concepción modular que permite la interoperabilidad entre componentes especializados: PyPDF2 para la extracción de texto de documentos PDF, a saber, la sentencia o auto en cuestión, spaCy para el reconocimiento de entidades nombradas, Faker para la generación de datos ficticios coherentes, y la API de OpenAI para la generación de explicaciones adaptativas. Esta arquitectura permite alterar el modelo de LLM

La interfaz de usuario, presenta una disposición dual que materializa visualmente el proceso de traducción jurídica: en el panel izquierdo se muestra el texto original de la sentencia, mientras que el panel derecho alberga la explicación personalizada. Esta disposición no es meramente funcional, sino que permite apreciar la distincón entre el lenguaje técnico-jurídico y su recodificación adaptativa, permitiendo al usuario percibir tanto la fuente como el resultado del proceso hermenéutico.

2. Proceso de extracción y anonimización de datos

El proceso de extracción textual implementado en ClarifIA responde a la estructura de las sentencias, focalizándose específicamente en la sección de «Hechos Probados» como núcleo informativo esencial, y añadiendo la sección de «Fundamentos de Derecho» como explicación de lo que se ha resuelto y del discurso argumentativo de calificación jurídica. La función extract_text_from_pdf utiliza expresiones regulares para identificar y aislar este segmento textual, aplicando posteriormente un proceso de normalización que elimina saltos de línea superfluos y reorganiza el texto en párrafos coherentes.

La anonimización de datos personales representa uno de los aspectos más sofisticados de la aplicación, implementando lo que podríamos denominar una «doble hermenéutica de la privacidad». El sistema utiliza el modelo de procesamiento del lenguaje natural de spaCy entrenado específicamente para el español (es_core_news_md) para identificar entidades de tipo persona (PER) en el texto. Cada nombre real detectado se mapea bidireccionalmente con un nombre ficticio generado por la biblioteca Faker, configurada para producir nombres coherentes con el contexto cultural español.

Este proceso de anonimización trasciende la mera sustitución nominal para constituir una operación de preservación semántica: los nombres ficticios mantienen la coherencia referencial del texto original, permitiendo que las relaciones entre litigantes y la estructura narrativa de los hechos probados permanezcan intactas. La implementación de diccionarios bidireccionales (anonymization_map y reverse_anonymization_map) garantiza la reversibilidad del proceso, elemento crucial para mantener la integridad comunicativa entre el texto enviado a la API de OpenAI y la respuesta final presentada al usuario.

La anonimización se extiende también a los números de identificación personal (DNI), implementando patrones de reconocimiento que abarcan las diversas formas de representación de estos documentos en el texto jurídico. Esta atención al detalle refleja una comprensión profunda de las convenciones textuales del discurso judicial español, donde la variabilidad en la representación de datos personales constituye una característica endémica.

3. Integración con GPT-4 para la generación de explicaciones

La integración con GPT-4 representa el núcleo generativo de ClarifIA, donde se materializa la tesis central sobre la capacidad de los sistemas de inteligencia artificial para efectuar una doble operación hermenéutica: decodificar el lenguaje técnico-jurídico y recodificarlo según el habitus lingüístico del receptor. La función generate_personalized_prompt implementa un sistema de generación de instrucciones dinámicas que operacionaliza los conceptos teóricos de Bourdieu y Husserl en directrices computacionales concretas.

El prompt generado no constituye una plantilla estática, sino que se construye dinámicamente en función de los datos disponibles del perfil del usuario. Esta construcción adaptativa refleja la comprensión de que, como señala Husserl, cada sujeto habita un «mundo de la vida» específico que condiciona sus horizontes de comprensión. Así, cuando el sistema detecta que el destinatario posee una experiencia jurídica «muy baja» o es su «primera vez» enfrentándose a una sentencia, las instrucciones al modelo de lenguaje especifican: «Usa un lenguaje muy simple y básico, definiendo cada término jurídico que uses». Esta directriz no implica una simplificación reductiva, sino una expansión explicativa que mantiene el rigor conceptual mientras maximiza la accesibilidad.

La complejidad del sistema se manifiesta en su capacidad para modular múltiples dimensiones comunicativas simultáneamente. Cuando se dispone de información sobre el sector profesional del destinatario, el prompt instruye al modelo para «utilizar ejemplos y referencias que puedan resultar familiares en el sector [especificado]», implementando así lo que Biber y Conrad denominan «ajuste pragmático sensible al destinatario». Esta capacidad de contextualización sectorial permite que una misma resolución judicial sobre, por ejemplo, un despido improcedente, se explique utilizando analogías del mundo de la construcción para un operario de obra, mientras que para un empleado administrativo se emplearían referencias al entorno de oficina.

4. Análisis de la arquitectura de prompts desde las perspectivas teóricas

La construcción de prompts en ClarifIA constituye una concreción escrita de las teorías lingüísticas y sociológicas que se han expresado previamente. El análisis detallado de las instrucciones revela cómo cada componente del prompt materializa conceptos teóricos específicos en directrices ejecutables por el modelo de lenguaje.

A) La materialización del habitus linguistique de Bourdieu

El sistema de prompts implementa la noción bourdieuiana de habitus linguistique mediante la creación de perfiles comunicativos diferenciados según la categoría profesional. Cuando el prompt especifica: «Adopta un registro profesional pero accesible, apropiado para alguien con perfil de [categoría_profesional]», está reconociendo que cada posición en el espacio social conlleva un conjunto específico de disposiciones lingüísticas. La instrucción no se limita a ajustar el vocabulario, sino que modula el «mercado lingüístico» en el que opera la comunicación.

Esta implementación se hace especialmente evidente en las instrucciones diferenciadas por experiencia jurídica. El sistema reconoce cuatro niveles que corresponden a diferentes grados de capital lingüístico-jurídico: desde «muy baja (primera vez)» hasta «alta». Cada nivel activa un conjunto distinto de estrategias comunicativas que reflejan lo que Bourdieu denominaría la «economía de los intercambios lingüísticos»: para aquellos con bajo capital jurídico, el prompt instruye «definiendo cada término jurídico que uses», mientras que para aquellos con alto capital permite «usar un lenguaje más técnico».

B) El Lebenswelt husserliano en la personalización contextual

La teoría del «mundo de la vida» (Lebenswelt) de Husserl se manifiesta en la capacidad del sistema para reconocer que cada trabajador habita un horizonte experiencial específico. La instrucción «Utiliza ejemplos y referencias que puedan resultar familiares en el sector [sector]» constituye una aplicación directa de esta comprensión fenomenológica. El prompt no solo adapta el mensaje sino que lo sitúa dentro del mundo vivencial del receptor.

Esta contextualización sectorial va más allá de la mera adaptación superficial. Cuando el sistema detecta, por ejemplo, un trabajador del sector de la construcción, las instrucciones implícitamente reconocen un Lebenswelt caracterizado por relaciones laborales específicas, terminología sectorial particular y estructuras de autoridad distintivas. La explicación de conceptos como «despido disciplinario» se anclaría así en las experiencias concretas de ese mundo vital, utilizando referencias a situaciones típicas del sector.

C) La teoría funcionalista del registro de Biber y Conrad

La arquitectura de prompts implementa sistemáticamente los tres niveles de variación registral identificados por Biber y Conrad:

  • 1. Variación en el campo (field): Las instrucciones sobre complejidad del lenguaje según experiencia jurídica reflejan la adaptación del campo semántico. Para experiencia «muy baja», el prompt especifica «lenguaje muy simple y básico», implementando lo que Biber denomina «densidad léxica reducida». Para experiencia «alta», permite «lenguaje más técnico», reconociendo que el receptor comparte parcialmente el campo especializado del emisor.
  • 2. Variación en el tenor (tenor): La personalización basada en el nombre del destinatario («Dirígete directamente a [nombre]») y la categoría profesional modula la relación interpersonal establecida en el texto. Esta variación no es meramente formal sino que afecta a lo que Biber y Conrad denominan «stance markers» - los marcadores de posicionamiento que señalan la relación entre emisor y receptor.
  • 3. Variación en el modo (mode): Aunque el modo escrito permanece constante, las instrucciones sobre estructura y profundidad («Mantén las explicaciones simples y directas» vs. «Puedes ofrecer explicaciones más detalladas y profundas») reflejan adaptaciones en la organización informacional características de diferentes subregistros dentro del modo escrito.

D) El personalized persuasion de Matz et al. en la generación adaptativa

Aunque ClarifIA no busca persuadir sino explicar, implementa principios análogos al targeting psicológico identificado por Matz et al. La función generate_personalized_prompt() crea instrucciones dinámicas que permiten al modelo de IA identificar y explotar patrones comunicativos óptimos basándose en el perfil individual.

La sofisticación del sistema se evidencia en su capacidad para procesar simultáneamente múltiples dimensiones de personalización. Cuando dispone de información completa (nombre, categoría profesional, sector, nivel educativo y experiencia jurídica), el prompt resultante configura un espacio comunicativo multidimensional donde cada variable modula aspectos específicos de la generación textual. Esta capacidad de procesamiento paralelo de variables de personalización refleja la ventaja computacional de los LLM identificada por Salvi et al.: mientras un comunicador humano operaría con heurísticas limitadas, el sistema puede optimizar simultáneamente múltiples parámetros comunicativos.

E) La evidencia de Salvi et al. aplicada a la comprensión judicial

El hallazgo de Salvi et al. de que GPT-4 con acceso a información personal incrementa en un 81,7% las probabilidades de generar mayor acuerdo, encuentra su paralelo conceptual en ClarifIA. Aunque el objetivo no es persuadir sino exponerse de manera clara, el mecanismo subyacente es similar: la capacidad del modelo para ajustar su producción lingüística a las características específicas del receptor.

El prompt de ClarifIA implementa este principio mediante instrucciones condicionales que se activan según la información disponible. La arquitectura reconoce explícitamente que «Algunos datos del destinatario no están disponibles», implementando lo que podría denominarse «personalización degradada elegante»: el sistema maximiza la adaptación con la información disponible (extrayéndola de los propios hechos probados de la sentencia, si no se han cumplimentado los campos de perfilado) mientras mantiene estrategias comunicativas prudentes para las dimensiones desconocidas.

Como se ha expuesto a lo largo del artículo, cada elemento del perfil del justiciable activa conjuntos específicos de instrucciones que, en su interacción, generan un espacio comunicativo único adaptado al habitus específico del receptor, situado en su Lebenswelt particular, y optimizado según los principios de variación registral funcional.

V. Metodología de adaptación lingüística

1. Análisis de la categoría profesional del trabajador

La categorización profesional implementada en la aplicación trasciende la mera clasificación ocupacional para constituir un sistema de inferencia sobre competencias comunicativas y marcos interpretativos. Las categorías disponibles en la aplicación —desde «Directivo/Gerente» hasta «Trabajador no cualificado»— no se conciben como compartimentos estancos, sino como indicadores de lo que Bourdieu denominaría «capital lingüístico» diferenciado. Cada categoría encapsula un conjunto de presupuestos sobre familiaridad con discursos especializados, exposición a terminología técnica y esquemas cognitivos predominantes. Ello no obstante, se permite la concreción exacta de la categoría profesional, e incluso si no se rellena por el usuario, se extrae del Hecho Probado Primero de la Sentencia.

El sistema reconoce que la categoría profesional funciona como un acercamiento que correlaciona con diversos factores relevantes para la comunicación jurídica: nivel educativo formal, exposición a documentación administrativa compleja, familiaridad con jerarquías normativas y capacidad de abstracción conceptual. Un técnico superior, por ejemplo, presumiblemente posee mayor familiaridad con documentación técnica y procesos de abstracción que un operario, lo que permite al LLM modular no solo el vocabulario empleado sino la propia estructura argumentativa de la explicación.

2. Estrategias de simplificación sin pérdida de rigor

La metodología de adaptación lingüística implementada en ClarifIA se articula en torno a lo que podríamos denominar «simplificación funcional preservadora», distinguiéndose radicalmente de aproximaciones reduccionista que equiparan claridad con empobrecimiento conceptual. La finalidad del sistema, a través del promptingo, es que implemente estrategias de transformación textual que operen en múltiples niveles lingüísticos simultáneamente, pero manteniendo la integridad semántica del mensaje jurídico mientras maximiza su accesibilidad comunicativa.

En el nivel léxico, la aplicación no se limita a sustituir términos técnicos por equivalentes coloquiales, sino que implementa lo que Montolío y García Asensio denominan «expansión definitoria contextualizada». Así, un término como «litisconsorcio pasivo necesario» no se elimina del texto, sino que se acompaña de una explicación integrada que permite al lector comprender tanto el concepto como su relevancia para su situación específica. Esta estrategia responde a la comprensión de que el lenguaje jurídico constituye un sistema conceptual interconectado donde la eliminación de términos técnicos puede generar ambigüedades perjudiciales.

A nivel sintáctico, se implementan procesos de simplificación estructural que transforman las características hipotácticas (29) del discurso jurídico en construcciones paratácticas (30) más accesibles. Las oraciones con múltiples niveles de subordinación se segmentan en unidades proposicionales independientes, manteniendo las relaciones lógicas mediante conectores explícitos. Esta transformación se inspira en los principios de la «escritura llana» (plain language) adaptados al contexto jurídico español, reconociendo que la complejidad sintáctica constituye una de las principales barreras para la comprensión ciudadana.

La preservación del rigor jurídico se garantiza mediante la «redundancia semántica controlada»: los conceptos jurídicos fundamentales se presentan mediante múltiples formulaciones complementarias que, sin ser repetitivas, ofrecen diversas vías de acceso cognitivo al mismo contenido.

En suma, la aplicación debe, por tanto, operar como mediador intercultural entre el registro jurídico especializado y los diversos registros profesionales de sus usuarios, evitando tanto la tecnocracia hermética como la trivialización reductiva.

3. Ejemplos prácticos de transformación textual

Para ilustrar la metodología de adaptación, consideremos la siguiente transformación de un fragmento típico de sentencia laboral:

Texto original: «FALLO: Que estimando parcialmente la demanda interpuesta por D. [Nombre Anonimizado] contra la empresa [Empresa Anonimizada], debo declarar y declaro la improcedencia del despido del actor, condenando a la demandada a que, a su opción, que deberá ejercitar en el plazo de cinco días desde la notificación de esta sentencia, readmita al trabajador en las mismas condiciones que regían antes de producirse el despido, con abono de los salarios de tramitación, o le indemnice en la cantidad de 23.456,78 euros.»

Transformación para trabajador del sector servicios (nivel básico): «[Nombre], el juez ha decidido que tu despido no fue correcto. Esto significa que has ganado parte del juicio. La empresa ahora tiene que elegir entre dos opciones en los próximos 5 días:

  • Opción 1: Volverte a contratar en el mismo puesto y pagarte los sueldos desde que te despidieron.
  • Opción 2: Pagarte una compensación de 23.456,78 euros y no volverte a contratar. La empresa es quien decide qué opción prefiere, no tú. Es importante que estés atento a lo que te comuniquen en los próximos días.»

Transformación para trabajador administrativo (nivel medio): «[Nombre], la sentencia establece que su despido ha sido declarado improcedente, lo cual es favorable para usted. Esto implica que la empresa está obligada a elegir entre:

  • 1. Readmisión: reincorporarle a su puesto de trabajo anterior con las mismas condiciones, más el pago de los salarios dejados de percibir desde el despido (salarios de tramitación).
  • 2. Indemnización: abonarle 23.456,78 euros como compensación definitiva sin reincorporación. La empresa debe comunicar su decisión en un plazo máximo de 5 días hábiles desde que reciba la notificación de esta sentencia.»

La eficacia de la metodología implementada se ilustra mediante transformaciones concretas que evidencian el proceso de recodificación adaptativa. Consideremos un fragmento típico de una sentencia laboral:

Texto original: «SEGUNDO.- La parte actora ha venido prestando servicios para la empresa demandada con una antigüedad desde el 1 de marzo de 2019, categoría profesional de oficial de primera, y salario mensual de 1.876,54 euros con inclusión de la parte proporcional de las pagas extraordinarias.»

Transformación para trabajador con experiencia jurídica baja: «Has estado trabajando para esta empresa desde el 1 de marzo de 2019. Tu puesto oficial es el de «oficial de primera’, que es una categoría profesional que indica tu nivel de cualificación y responsabilidad en la empresa. Tu salario mensual es de 1.876,54 euros, y esta cantidad ya incluye la parte que te corresponde de las pagas extra (es decir, las pagas de verano y Navidad están prorrateadas en tu sueldo mensual).»

Esta transformación ilustra varios principios operativos del sistema: la conversión de la tercera persona impersonal («la parte actora») en segunda persona directa («has estado trabajando»), la expansión explicativa de términos técnicos («oficial de primera» se contextualiza como indicador de cualificación), y la clarificación de conceptos que pueden resultar opacos («parte proporcional de las pagas extraordinarias» se explica mediante ejemplos concretos).

Un ejemplo más complejo de transformación se observa en el tratamiento de conceptos jurídicos abstractos:

Texto original: «TERCERO.- No habiéndose acreditado la concurrencia de las causas objetivas alegadas por la empresa para justificar la extinción contractual, procede declarar la improcedencia del despido.»

Transformación adaptada: «El juez ha examinado las razones que dio la empresa para despedirte (lo que en términos legales se llaman «causas objetivas»). Después de analizar todas las pruebas presentadas, el juez considera que la empresa no ha demostrado que esas razones fueran reales o suficientes para justificar tu despido. Por esta razón, el juez determina que tu despido fue «improcedente’, lo que significa que la empresa no tenía derecho a despedirte en las condiciones en que lo hizo.»

Esta transformación ejemplifica la estrategia de «traducción expandida» donde no solo se clarifican los términos técnicos sino que se explicita la lógica jurídica subyacente, permitiendo al receptor comprender no solo el qué sino el porqué de la decisión judicial.

VI. Conclusiones y perspectivas futuras

1. Impacto en el acceso a la justicia

Una herramienta como la expuesta representa un avance significativo en la materialización del derecho a comprender las resoluciones judiciales consagrado en la LO 5/2024 (LA LEY 25554/2024), sobre todo desde el punto de vista de la generalización de dicha finalidad, dado que la existencia de Gabinetes específicos de profesionales en la materia ya lo satisfacía, pero el elevado número de peticiones que tendrían que atender sólo puede ser gestionado y resuelto por una IA. El sistema no constituye meramente una herramienta de traducción automática, sino un dispositivo de mediación semiótica que reconoce y aborda la naturaleza multidimensional de las barreras comunicativas en el ámbito judicial. Su impacto potencial se proyecta en varios elementos, a saber, en primer lugar, una solución como la propuesta – ora de aplicación en la Administración, ora de uso por los profesionales del derecho con sus clientes – contribuye a lo que podría denominarse como «democratización cognitiva» del derecho, permitiendo que los justiciables sin formación jurídica puedan acceder al contenido sustantivo de las resoluciones que les afectan, facilitando a los profesionales del derecho (abogados o graduados sociales) la comunicación exacta y comprensible de lo que ocurrió en la resolución judicial. Lo más importante es que esta democratización no implica una vulgarización del discurso jurídico, sino su apertura comunicativa mediante estrategias de recodificación que preservan la integridad conceptual mientras maximizan la accesibilidad. En este sentido, como señala Jürgen Habermas, la legitimidad del derecho en las sociedades democráticas depende crucialmente de su comprensibilidad por parte de los ciudadanos a quienes se aplica, sosteniendo que «válidas son aquellas normas a las que todos los que puedan verse afectados por ellos pudiesen prestar su asentimiento como participantes en discursos racionales» (31) . Esta concepción discursiva del derecho refuerza la necesidad de que las resoluciones judiciales sean genuinamente comprensibles para sus destinatarios.

En segundo lugar, una solución como la expuesta aborda la problemática de la «asimetría informativa» inherente a la relación entre el sistema judicial y los justiciables. Al proporcionar explicaciones personalizadas que consideran el habitus lingüístico del receptor, el sistema reduce la dependencia absoluta de intermediarios profesionales para la comprensión de decisiones judiciales. Esto no pretende sustituir el asesoramiento jurídico profesional, sino complementarlo, empoderando a los trabajadores para comprender los fundamentos de las decisiones que les conciernen. Pero es más, como señala Habermas, «sólo pueden pretender legitimidad aquellas regulaciones normativas y formas de acción a las que todos los posibles afectados pudiesen prestar su asentimiento como participantes en discursos racionales»; lo que en términos de resolución jurídica implicaría que una aplicación como la expuesta facilita la dotación de legitimidad de la sentencia o auto dictado, al permitir, con su comprensión «prestar su asentimiento como participantes en discursos racionales» a «todos los posibles afectados».

2. Potencial de expansión a otros ámbitos jurídicos

El modelo conceptual y tecnológico desarrollado presenta un potencial de escalabilidad que trasciende el ámbito laboral para proyectarse sobre el conjunto del sistema judicial. La arquitectura modular de la aplicación, basada en la separación entre extracción textual, procesamiento de perfiles y generación adaptativa, permite su adaptación a diferentes jurisdicciones y tipos de resoluciones judiciales.

En el ámbito del derecho de familia, por ejemplo, la necesidad de comunicación clara y empática resulta aún más acuciante, dado el componente emocional inherente a estos procedimientos. Un sistema análogo podría adaptar las explicaciones considerando no solo el perfil socioeducativo sino también el estado emocional presumible del receptor, implementando lo que la psicología cognitiva denomina «comunicación terapéutica».

La jurisdicción contencioso-administrativa presenta desafíos particulares derivados de la complejidad técnica de las materias tratadas y la abstracción de los conceptos jurídico-públicos. Un sistema adaptado a este ámbito requeriría incorporar módulos específicos para la explicación de conceptos como «acto administrativo», «silencio administrativo» o «desviación de poder», términos que carecen de correlatos directos en la experiencia cotidiana de los ciudadanos.

En el ámbito penal, la adaptación del sistema enfrentaría consideraciones éticas adicionales relacionadas con la presunción de inocencia y el impacto psicológico de las resoluciones.

Desde una perspectiva tecnológica, la evolución de los modelos de lenguaje hacia capacidades multimodales abre posibilidades adicionales. Futuras iteraciones podrían incorporar elementos visuales (infografías, diagramas de flujo) o auditivos (explicaciones narradas) que complementen la comprensión textual, reconociendo la diversidad de estilos cognitivos y preferencias de aprendizaje en la población.

La integración con sistemas de gestión judicial permitiría la generación automática de explicaciones personalizadas en el momento mismo de la notificación, reduciendo la brecha temporal entre la emisión de la resolución y su comprensión por el destinatario, sin perjuicio de que una herramienta como la expuesta se integre directamente en los despachos de los profesionales que lo necesiten.

En última instancia, ClarifIA representa un primer paso hacia lo que podríamos denominar «justicia comunicativamente accesible», donde la comprensión ciudadana de las decisiones judiciales no constituye un privilegio derivado del capital cultural sino un derecho efectivamente garantizado mediante una mediación tecnológica avanzada.

VII. Código fuente

https://github.com/xvi82/clarifIA

Scroll