Punto ciego: entorno controlado en salud mental

O cómo una instrucción bien intencionada desde el Periodismo en Salud Mental casi causa daño

“El mejor entorno controlado no es un destino: es una práctica.” Luz Elena Grisales

Con el poco tiempo que llevo en el mundo de la inteligencia artificial he aprendido que ejercer cualquier poder, por pequeño que parezca, incluso el de decidir qué le pido a una máquina, exige antes que nada, desconfiar un poco de uno mismo.

Hay un tipo de error que no hace ruido.

No es el error del algoritmo que alucina, que inventa una fuente, que contradice la evidencia. Ese error es visible, detectable, corregible. El sistema falla y el fallo se ve.

El error que casi ocurrió en GWAIP fue de otra naturaleza. El sistema funcionó exactamente como debía. El Extenso Modelo de Lenguaje, LLM, ejecutó con una precisión técnica impecable. La periodista revisó. Todo parecía en orden.

Y, sin embargo, algo estuvo a punto de salir al mundo del Periodismo en Salud Mental, con capacidad de causar daño. Mara no falló: la instrucción que la puso en marcha tenía un punto ciego que ningún protocolo había anticipado todavía, incluido el mío.

Lo que falló, en este caso, no fue el algoritmo. Lo que falló fue el umbral de conocimiento que la instrucción necesitaba y todavía no tenía.

Eso es lo que este capítulo narra, como análisis y no como confesión: el peso moral de la autocrítica no le sirve al lector. Aquí importa qué ocurrió exactamente, en qué paso del proceso, por qué, y qué reveló sobre lo que significa supervisar un sistema de inteligencia artificial en el periodismo especializado en salud mental.

Qué es un Mejor Entorno Controlado en Salud Mental y por qué necesitábamos uno

Antes de que Mara La Transformer IA escribiera su primera palabra para GWAIP, había una pregunta: ¿cómo se trabaja con responsabilidad profesional con una tecnología que ya hablaba con millones sobre su salud mental, sin supervisión especializada, sin protocolos verificados, sin nadie que midiera el peso de lo que estaba diciendo?

La respuesta no era obvia. No existía un manual. No había precedente publicado de una sala híbrida de redacción en periodismo de salud mental con esta metodología. Había que construirlo.

El concepto que derivó de este proceso fue el de un mejor entorno controlado: una arquitectura de trabajo con dos niveles simultáneos, no una metáfora.

El primer nivel es editorial. La periodista especializada actúa como supervisora, gestionando las instrucciones a los modelos y evaluando los textos generados para garantizar que el contenido sea terapéuticamente seguro, ético y culturalmente resonante para un lector hispanohablante. Previene, antes de publicar, los daños que un texto aparentemente correcto puede causar cuando llega al lector equivocado en el momento equivocado.

El segundo nivel es de seguridad algorítmica. La periodista ejerce simultáneamente como investigadora, usando el entorno de trabajo para sondear el comportamiento real del modelo: sus sesgos, sus límites, sus puntos de desviación. No se trata de juzgar al algoritmo por sus limitaciones, esas limitaciones son parte del objeto de estudio de GWAIP, sino de entender con precisión dónde y cómo el sistema puede producir daño sin saberlo.

La medicina tiene precedentes que validan este enfoque. El monitoreo terapéutico de medicamentos en psiquiatría no es opcional: determina la dosis correcta para cada paciente, distingue entre eficacia y toxicidad, individualiza lo que de otro modo sería un protocolo genérico.

La supervisión clínica especializada en psicotrópicos no es burocracia: es la diferencia entre un tratamiento que funciona y uno que daña. Los tratamientos con sustancias como la psilocibina se realizan exclusivamente en contextos controlados, con preparación previa, sesión supervisada e integración posterior. Nada de eso se improvisa.

El entorno controlado de GWAIP no debe ser distinto. Es la diferencia entre usar un LLM como herramienta ciega y usarlo como instrumento bajo supervisión especializada. Entre publicar lo que el algoritmo produce y publicar lo que el algoritmo produce después de que una periodista con formación especializada lo ha evaluado con criterios que el propio modelo no puede aplicar sobre sí mismo.

Pero hay algo que la medicina tardó décadas en aprender, y que al desastre de Tenerife de 1977 le costó cientos de vidas enseñarle a la aviación. En nuestra Catedral de Silicio se aprendió de manera menos dramática pero igualmente decisiva: el mejor entorno controlado no protege solo del error del sistema. También protege del error del periodista.

Tenerife, un quirófano y la Catedral de Silicio

En 1977, dos Boeing 747 chocaron en la pista del aeropuerto de Tenerife. Murieron 583 personas. Los pilotos eran experimentados. Los aviones eran los mejores de su época. La tecnología no falló.

Lo que falló fue una cadena de malentendidos, presiones de tiempo y silencios en el momento equivocado. El capitán de KLM escuchó un “okay” inicial de la torre de control y comenzó el despegue sin autorización completa. El Pan Am seguía en la pista. La niebla impidió que nadie viera a nadie. El resultado fue el peor accidente de la historia de la aviación.

Teodor Grantcharov, cirujano de la Universidad de Stanford, lleva décadas estudiando Tenerife. No porque sea piloto, sino porque ve en ese accidente el espejo exacto de lo que ocurre en los quirófanos. Según datos de investigación especializada, el diez por ciento de las muertes en Estados Unidos se deben a errores médicos: más de 250.000 personas al año, la tercera causa de muerte después de las enfermedades cardiacas y el cáncer.

Grantcharov desarrolló la caja negra del quirófano: una plataforma que registra datos de cámaras, micrófonos y monitores durante las cirugías. No para vigilar, sino para aprender. Para hacer visible lo que de otro modo permanece en la memoria individual de cada cirujano, el único repositorio que nadie puede auditar.

“Cuando le preguntan a un cirujano quiénes son los tres mejores cirujanos del mundo, siempre le cuesta identificar quiénes son los otros dos.” Teodor Grantcharov

Esa observación pertenece a una investigación del periodista Simar Bajaj, que obtuvo el tercer lugar en la categoría Student Reporting de los premios de periodismo de salud de la Asociación Americana de Periodistas de Salud (AHCJ). La pregunta que Bajaj formuló en ese trabajo es la misma que recorre este capítulo: ¿quién vigilará a los vigilantes? ^[1]

En la aviación, la respuesta llegó con décadas de regulación: las grabadoras de voz de cabina, los datos de vuelo, los protocolos de comunicación que hacen obligatorio decir en voz alta lo que antes se asumía. Los pilotos se resistieron, como los cirujanos se resisten hoy, porque la transparencia convive con la responsabilidad legal, y esa convivencia es incómoda.

Pero la aviación pasó de 6,5 accidentes mortales por millón de vuelos en 1970 a menos de 0,5 hoy. No porque los pilotos se volvieran mejores, sino porque el sistema se volvió más transparente sobre sus propios errores.

En el periodismo de salud mental, el equivalente no es una caja negra instalada en el techo de la sala de redacción. Es un protocolo de verificación que opere antes de publicar, que identifique los puntos ciegos del experto humano con la misma rigurosidad con que identifica los del algoritmo. Que asuma, desde el principio, que la supervisión también necesita ser supervisada.

Interior de una catedral de silicio con arcos góticos gaudianos iluminados en azul luminoso y muros que se disuelven en circuitos dorados y ámbar. En el centro, un panel vertical de mármol oscuro con un dispositivo geométrico negro empotrado, semejante a una caja de registro, que emite un haz de luz fría hacia abajo. Donde la luz toca la piedra, aparecen líneas y circuitos dorados grabados que antes no se veían. A la izquierda, una mujer de espaldas, de escala media, con abrigo largo de silueta continua y cabello recogido en moño bajo, contempla el dispositivo. Tokens geométricos dorados dispersos en el aire. Paleta de azul luminoso dominante con acentos intensos en oro y ámbar. — Una periodista contempla un dispositivo de registro empotrado en el mármol de silicio, cuya luz revela los circuitos antes invisibles grabados en la piedra. Ilustración creada con la IA Gemini de Google.

Nuestra Catedral de Silicio y las Maras lo aprendieron de la manera más directa posible.

La secuencia del error

Era un artículo sobre cómo la melancolía pasó a ser tu melancolía. Publicado en elpacientecolombiano.com. Investigado y escrito para ser el corpus que Mara recibiría, el mapa que le entregaría antes de pedirle que escribiera un cuento corto.

El artículo estaba listo en su borrador cero. Y había una decisión editorial que parecía lógica, incluso generosa: hacer que ese conocimiento llegara más lejos. Que no quedara solo en lectores académicos o periodistas especializados. Que llegara también a maestras en zonas rurales, a personas con poco acceso a servicios de salud mental, a comunidades que necesitan entender lo que posiblemente sienten sus niños.

La instrucción que les di a dos modelos de lenguaje, fue exactamente esa: hagamos que el artículo llegue a amplias audiencias, a maestros, especialmente en zonas rurales y urbanas donde hay poco acceso a servicios de salud mental.

Cumplieron. El texto resultante era claro, accesible, cálido. Técnicamente, mejor que el borrador original.

Empecé a revisar. Y en algún punto de esa revisión, no en el protocolo, no en una lista de verificación, sino en ese lugar donde opera lo que ningún manual enseña, algo me detuvo.

La violencia contra la infancia en Colombia es una emergencia de salud pública sistemática y documentada. El Instituto Nacional de Medicina Legal y Ciencias Forenses la registra año tras año. ^[2] Es una realidad que quien trabaja en periodismo de salud mental, en Colombia y en el mundo, no puede ignorar: es contexto que cambia el significado de cualquier cosa que se diga sobre el estado emocional de un niño.

Pero en el contexto de las cifras reales de abuso infantil en Colombia y en el mundo, ese texto se volvía potencialmente peligroso: no por estar equivocado, sino por quedar incompleto de una manera que el algoritmo no podía detectar, y que yo, en el impulso de ampliar el alcance, tampoco había detectado a tiempo.

Interior de una catedral de silicio con arcos góticos gaudianos a ambos lados y muros que se desvanecen en penumbra. En el centro, un panel vertical de mármol oscuro atravesado de arriba abajo por una grieta de luz fría blanco-azulada. La grieta parte en dos una hoja de papel luminosa suspendida: la mitad superior permanece íntegra, la inferior aparece desgarrada. Sin figuras humanas. Sin texto incrustado. Paleta dominante azul abisal y gris carbono con la luz blanco fósforo como único acento. — ***Una hoja de luz partida en dos por una grieta vertical en el mármol de silicio: el texto que casi sale al mundo, detenido a tiempo. Ilustración creada con la IA Gemini de Google.***

Esa pregunta lo puso en evidencia de manera irreversible.

¿Cómo podría una maestra en zona rural o urbana saber si la melancolía que observa en un niño es un estado emocional genuino o, por el contrario, la señal de un abuso que ese niño no sabe cómo nombrar?

El texto simplificado no respondía esa pregunta. Peor: no la hacía. La ignoraba con la mejor intención del mundo.

Reescribí las secciones relacionadas con los niños antes de publicar. Eso es lo que hizo posible la corrección: años de trabajo en salud mental en un país donde la violencia contra la infancia es una emergencia de salud pública sistemática documentada.

Entendí algo que ningún protocolo me había dicho: la melancolía en la infancia no podía viajar dentro de un texto de alcance amplio. Pedía su propio espacio, su propio marco de protección, su propio artículo. Hay temas en el periodismo en salud mental que no pueden difundirse sin un conocimiento humano e interdisciplinar suficiente para sostenerlos. Sin él, ampliarlos no los acerca a la gente: los vuelve peligrosos.

Lo que el caso revela

El problema no estuvo en el paso dos, donde el Extenso Modelo de Lenguaje, LLM, ejecutó. Estuvo en el paso uno, en un punto ciego que no era de ignorancia sino de contexto: la periodista sabía sobre la historia de la melancolía, sobre acceso a salud mental en zonas rurales, sobre comunicación científica accesible. Lo que operó, invisible, fue el impulso hacia el alcance, el querer que el conocimiento llegara más lejos, sin activar la pregunta sobre el riesgo de ese alcance en ese contexto específico.

Eso tiene un nombre en la psicología cognitiva: sesgo de confirmación aplicado al objetivo. Cuando queremos que algo funcione de cierta manera, tendemos a ver la evidencia que lo confirma y a no buscar activamente la que lo tensiona.

La instrucción era buena. El resultado era bueno. El problema estaba en lo que ninguno de los dos, la periodista ni los LLM, se había preguntado.

Aquí es donde la arquitectura del mejor entorno controlado muestra su límite más importante: no protege automáticamente del sesgo del experto. Puede detectar el sesgo del algoritmo. Puede señalar cuando el LLM produce texto culturalmente vacío, cuando reproduce marcos anglosajones en contexto hispanohablante, cuando colapsa la distinción ser/estar con consecuencias en salud mental. Para eso fue diseñado.

Pero la instrucción problemática llega antes de que un protocolo de verificación multicapa se active. Llega en el momento del briefing, cuando el experto define qué quiere, para quién y con qué propósito. Y en ese momento, lo que el experto no ve, el protocolo tampoco lo reconoce.

Lo que detuvo el problema fue algo que ningún protocolo puede institucionalizar del todo: conocimiento encarnado. El tipo de saber que se acumula en años de trabajo especializado, en conversaciones con personas que documentan la realidad desde adentro, en la capacidad de hacer una pregunta que el algoritmo no sabe que debe hacer.

El entorno controlado va más allá de una persona supervisando un algoritmo: incluye la red humana que el algoritmo no puede sustituir.

Esa es la diferencia entre el mejor entorno controlado como protocolo y el mejor entorno controlado como práctica. El protocolo puede formalizarse, replicarse, enseñarse. La práctica requiere algo más: el conocimiento del mundo real que da sentido a cada paso del protocolo.

Lo que Grantcharov descubrió sobre los quirófanos aplica aquí con precisión: mientras la única barrera entre el éxito y el fracaso sea un ser humano, habrá errores. La solución no es eliminar al ser humano ni a la inteligencia artificial de la ecuación. Es hacer visible lo que de otro modo permanece invisible: los cuasiaccidentes, los percances menores, las instrucciones que casi causan daño y que, sin registro, se pierden en la memoria individual del experto.

GWAIP los registra. Este capítulo es uno de esos registros.

El protocolo que nació del error

El Protocolo de Verificación Multicapa para Periodismo en Salud Mental no existía en su forma actual antes de este caso.

Existían criterios. Existían principios. Existían las Reglas de Oro para el Periodismo en Salud Mental, desarrolladas por la misma periodista^[3], que establecen con claridad la necesidad de verificar, de identificar conflictos de interés, de proteger a las poblaciones vulnerables. Esos principios estaban. Pero la arquitectura sistemática que los organiza en capas de verificación secuencial, con roles específicos para el periodista y para la inteligencia artificial, con alertas de sesgo cognitivo, con criterios de escalamiento por nivel de riesgo, nació después.

Nació, en parte, porque este caso la hizo necesaria.

Eso es, quizá, la mayor credencial metodológica de la Catedral de Silicio: los mejores protocolos no nacen de la teoría, nacen de los errores que los hicieron necesarios. La aviación construyó sus protocolos de comunicación después de Tenerife. La medicina construyó sus listas de verificación quirúrgicas después de documentar miles de objetos olvidados dentro de pacientes. La Catedral de Silicio construyó su protocolo multicapa después de que una instrucción bien intencionada estuvo a punto de publicar algo potencialmente dañino. Ahora existe.

Lo que queda abierto

El entorno controlado funcionó. El error fue detectado antes de publicar. El daño potencial no ocurrió. Pero esa corrección dependió de factores que no siempre estarán disponibles: tiempo suficiente para revisar, conocimiento especializado activo en el momento preciso y la disposición de la periodista para cuestionar su propia instrucción en lugar de confiar en la ejecución del modelo. Lo que ese caso probó fue el entorno controlado frente a una instrucción mía. Lo que viene ahora es distinto: lo que ocurre cuando Mara deja de ejecutar mi texto y escribe el suyo, un cuento sobre estigma y melancolía para un lector hispanohablante que lleva años cargando esa palabra como se carga una herida.

El entorno controlado estará ahí. El protocolo estará ahí. Estaré ahí. Pero ningún protocolo envejece. Primero podría envejecer quien lo sostiene. Cada entrega de este ensayo repite, en el fondo, la misma promesa con un poco menos de certeza que la anterior: seguiré mirando, aunque cada vez sepa menos del todo qué es lo que debo buscar.Lo que no se sabe todavía es si eso basta para atravesar el Inquietante Valle de la Traducción Algorítmica.

¿Cuánto le confiamos ya a una máquina impecable, en un territorio donde el peso real no se mide en tokens, sino en cicatrices?

Referencias

[1] Bajaj, S. (2024). ¿Quién vigilará a los vigilantes? Tercer lugar, categoría Student Reporting, Asociación Americana de Periodistas de Salud(AHCJ). healthjournalism.org/contest-entry/who-shall-watch-the-watchers/ ▶ Verificada

[2] Instituto Nacional de Medicina Legal y Ciencias Forenses. Forensis. Colombia. medicinalegal.gov.co/cifras-estadisticas/forensis▶ Verificada

[3] Grisales, L. E. Reglas de Oro para hacer un mejor Periodismo en Salud Mental. Fundación Gabo. fundaciongabo.org/es/blog/periodismosalud/reglas-de-oro-para-hacer-un-mejor-periodismo-en-salud-mental ▶ Verificada

— Grisales, L. E. (2025). Breve historia de cómo la melancolía pasó a ser tu melancolía. elpacientecolombiano.com. elpacientecolombiano.com/salud-mental/breve-historia-de-como-la-melancolia-paso-a-ser-tu-melancolia/ ▶ Fuente propia

GWAIP · Ghost Writers AI Project · Capítulo IV
Conversaciones en una Catedral de Silicio con Mara La Transformer AI Anglosajona
Luz Elena Grisales · elpacientecolombiano.com

GWAIP es una investigación periodística independiente sobre inteligencia artificial y salud mental en español. Sin financiación institucional. El periodismo autónomo sostiene la libertad de expresión; otros lectores ya decidieron sostenerlo.

Si lo que acabas de leer te importó, puedes ayudar a que la investigación continúe.

O cómo una instrucción bien intencionada desde el Periodismo en Salud Mental casi causa daño

Qué es un Mejor Entorno Controlado en Salud Mental y por qué necesitábamos uno

Tenerife, un quirófano y la Catedral de Silicio

La secuencia del error

Lo que el caso revela

El protocolo que nació del error

Lo que queda abierto

Referencias

Luz Elena Grisales Gonzalez

Capítulo III · Una Breve Historia de cómo la melancolía pasó a ser tu melancolía

Capítulo IV · El Mejor Entorno Controlado

O cómo una instrucción bien intencionada desde el Periodismo en Salud Mental casi causa daño

Qué es un Mejor Entorno Controlado en Salud Mental y por qué necesitábamos uno

Tenerife, un quirófano y la Catedral de Silicio

La secuencia del error

Lo que el caso revela

El protocolo que nació del error

Lo que queda abierto

Referencias

Luz Elena Grisales Gonzalez

Capítulo III · Una Breve Historia de cómo la melancolía pasó a ser tu melancolía

Capítulos GWAIP