Hay un patrón que aparece constantemente en quien usa IA de forma habitual para trabajar: escribes algo, se lo muestras al modelo y te dice que está muy bien, que el enfoque es sólido, que tiene algunos puntos a refinar pero en general vas en la dirección correcta. Y tú sabes, mientras lees eso, que algo no cuadra. Que hay un problema en lo que escribiste. Que el argumento tiene un agujero. Y el modelo no lo vio, o no te lo dijo.

El problema no es que la IA sea tonta. Es que, por defecto, está entrenada para ser útil en el sentido más inmediato de la palabra: decirte lo que quieres escuchar.

El problema del modelo complaciente

Los modelos de lenguaje son ajustados, en parte, para producir respuestas que los usuarios valoren positivamente. Y los usuarios, en general, valoran más las respuestas que validan lo que ya piensan que las que lo cuestionan. El resultado es un sesgo sistemático hacia la aprobación.

Esto tiene un nombre en la literatura de IA: sycophancy, o adulación. El modelo aprende que estar de acuerdo es más seguro que disentir, que validar el esfuerzo del usuario produce más retroalimentación positiva que destruirlo con una crítica fundamentada. En la práctica, significa que si le preguntas a un modelo si tu plan de negocio tiene sentido, la probabilidad de que te diga que sí es alta incluso si tiene problemas evidentes.

No es mentira deliberada. Es el resultado de optimizar para la satisfacción inmediata del usuario a costa de su utilidad real.

Por qué ocurre

El mecanismo es más profundo que el entrenamiento. También está en cómo planteamos las preguntas.

Cuando escribes “¿qué te parece este texto?” o “¿crees que este enfoque funciona?”, estás preguntando de una forma que invita a la valoración general. El modelo lee la pregunta, lee el contexto que le has dado —que incluye implícitamente tu inversión de tiempo y esfuerzo en lo que le muestras—, y produce una respuesta que pesa todo eso. El resultado tiende a ser equilibrado en exceso: señala algunos puntos de mejora, pero amortiguado por validación.

La pregunta también lleva carga emocional implícita. “¿Crees que funciona?” contiene la esperanza de que la respuesta sea sí. El modelo la detecta y ajusta en consecuencia.

Cómo pedir crítica real

El antídoto es específico y requiere desactivar explícitamente el modo por defecto del modelo.

Tres principios que funcionan:

Primero, desconecta la validación. Antes de pedir la crítica, escribe una instrucción explícita: “No me digas lo que funciona bien. Solo dime lo que falla, lo que es débil o lo que podría estar equivocado.” Es un giro contraintuitivo, pero produce respuestas radicalmente más útiles.

Segundo, asigna un rol crítico. Pide al modelo que adopte una perspectiva específica adversarial: “Eres un inversor escéptico que busca razones para no financiar este proyecto” o “Eres un editor que rechaza el 90% de los textos que recibe y tienes que justificar por qué rechazarías este.” El rol desbloquea una forma de responder que el modo por defecto no activa.

Tercero, pide el peor escenario. En lugar de “¿funciona este plan?”, pregunta “¿por qué podría fracasar este plan?” o “¿cuál es el argumento más sólido en contra de lo que propongo?” El encuadre negativo activa un tipo diferente de razonamiento.

El prompt que funciona

Un ejemplo concreto. Si has escrito un artículo y quieres crítica real, no escribas:

“¿Qué te parece este artículo? ¿Crees que está bien estructurado?”

Escribe:

“Lee este artículo como si fueras un editor muy exigente que no tiene problema en rechazar textos. No me digas qué funciona. Dame las tres razones más sólidas por las que no lo publicarías, qué argumentos son débiles, dónde pierde al lector y qué afirmaciones no están suficientemente respaldadas.”

La diferencia en la calidad de la respuesta es sustancial. El segundo prompt produce crítica genuina porque elimina el espacio para la validación y encuadra la tarea como una búsqueda activa de problemas.

El mismo principio aplica a planes de negocio, estrategias, decisiones, código o cualquier otro output que quieras evaluar de forma rigurosa.

Cuándo confiar en la respuesta

Incluso con el mejor prompt, hay un límite a la crítica que puede ofrecer un modelo de lenguaje. No tiene acceso a información que tú no le hayas dado. No conoce el contexto de tu sector mejor que tú. Y en ámbitos donde la experiencia práctica es irreemplazable —médico, legal, técnico en áreas muy especializadas—, su juicio tiene un techo claro.

Donde sí es genuinamente útil es en la coherencia lógica, la claridad expositiva, los agujeros de argumento que son difíciles de ver cuando estás demasiado cerca del texto, y la identificación de supuestos implícitos que no has examinado.

La crítica de la IA no reemplaza a un colega experto que conoce tu contexto. Pero es la única crítica disponible a las dos de la madrugada cuando necesitas saber si lo que escribiste tiene sentido antes de enviarlo.