Qué es un agente de IA: del chatbot al actor autónomo â€" Xap.es

Cuando ChatGPT apareció en noviembre de 2022, la mayoría de las conversaciones sobre IA eran sobre chatbots: sistemas con los que conversas, que responden a preguntas, que generan texto. El modelo recibe un mensaje y produce una respuesta. Eso es todo.

Los agentes de IA son algo fundamentalmente diferente. No solo responden: toman decisiones, ejecutan acciones en sistemas externos y observan el resultado de esas acciones para decidir el siguiente paso. La diferencia no es de grado: es de naturaleza.

La diferencia fundamental

Un chatbot es reactivo y pasivo: espera una entrada, produce una salida, termina. El humano hace todo lo demás: interpreta la respuesta, decide qué hacer con ella, ejecuta las acciones necesarias.

Un agente es activo y autónomo (en cierta medida): recibe un objetivo, descompone el problema, decide qué acciones tomar, las ejecuta usando herramientas disponibles, observa los resultados, ajusta el plan y continúa hasta completar el objetivo o encontrar un límite.

CHATBOT:
  Usuario → Mensaje → Modelo → Respuesta → Usuario
  (el usuario hace todo lo demás)

AGENTE:
  Usuario → Objetivo → Agente → Planifica → Actúa
                              ↑                |
                              └── Observa ←────┘
  (el agente ejecuta múltiples pasos autónomamente)

La diferencia práctica: si le pides a un chatbot “investiga las tres mejores opciones de proveedor de nube para nuestra empresa”, te dará información general sobre proveedores de nube. Si le pides lo mismo a un agente bien configurado, puede buscar en la web, comparar precios actuales, revisar reseñas recientes, considerar tus requisitos específicos y producir un análisis adaptado a tu situación, todo de forma autónoma.

El ciclo percibir-decidir-actuar

Los agentes de IA operan sobre un ciclo continuo que se conoce como el bucle de razonamiento-acción (ReAct, de Reasoning and Acting):

1. Percibir. El agente recibe el objetivo y el contexto del entorno: qué herramientas tiene disponibles, qué ha ocurrido hasta ahora, cuál es el estado actual de la tarea.

2. Razonar. El agente analiza la situación y decide qué hacer a continuación. Este paso puede incluir descomponer el objetivo en subobjetivos, identificar qué información falta, seleccionar qué herramienta usar.

3. Actuar. El agente ejecuta la acción elegida: llama a una API, busca en la web, escribe un archivo, ejecuta código, envía un email.

4. Observar. El agente recibe el resultado de la acción y lo incorpora a su contexto. El resultado puede confirmar que va por el buen camino, indicar que hay que ajustar el plan, o revelar información nueva.

5. Repetir. El ciclo continúa hasta que el objetivo se completa o el agente determina que no puede avanzar sin ayuda humana.

Este ciclo puede ejecutarse docenas o cientos de veces para completar una tarea compleja. En cada iteración, el modelo de lenguaje hace la parte de razonamiento; las herramientas hacen la parte de acción en el mundo.

Arquitectura de un agente

Un agente de IA tiene tres componentes principales:

El modelo de lenguaje (el “cerebro”). El LLM es lo que razona, planifica y decide. Los modelos que funcionan mejor como cerebro de agente tienen que ser buenos en seguir instrucciones complejas, razonar en múltiples pasos y usar herramientas correctamente.

Las herramientas (los “brazos”). Son las capacidades de acción del agente: lo que puede hacer en el mundo. Las herramientas típicas incluyen:

Búsqueda web
Ejecución de código
Acceso a bases de datos
Envío de emails o mensajes
Lectura y escritura de archivos
Llamadas a APIs externas (calendarios, CRM, servicios de terceros)

La memoria. Los agentes necesitan recordar qué han hecho y qué han aprendido durante la ejecución de una tarea. Hay varios tipos:

Memoria de trabajo: el contexto activo de la tarea actual (dentro de la ventana de contexto del LLM)
Memoria a corto plazo: resultados de acciones anteriores dentro de la sesión
Memoria a largo plazo: información persistente entre sesiones (implementada con bases de datos externas)

Qué puede hacer un agente

Los casos de uso de los agentes más maduros en 2025-2026:

Investigación automatizada. El agente busca en múltiples fuentes, sintetiza la información, identifica contradicciones y produce un informe. Tasks que tomarían horas a un humano se completan en minutos.

Automatización de flujos de trabajo. Procesar facturas, actualizar CRMs, generar informes periódicos, responder a ciertos tipos de emails siguiendo criterios predefinidos.

Asistencia de desarrollo. Agentes que pueden leer el código base completo, identificar bugs, escribir fixes, ejecutar tests y verificar que los cambios no rompen nada.

Análisis de datos. El agente recibe un objetivo de análisis, decide qué consultas hacer a la base de datos, las ejecuta, interpreta los resultados y produce conclusiones.

Planificación y coordinación. Sistemas multi-agente donde varios agentes con roles distintos colaboran: uno investiga, otro escribe, otro verifica la información, un agente orquestador coordina el proceso.

Los riesgos que introduce la autonomía

La autonomía de los agentes introduce riesgos que los chatbots simples no tienen.

Amplificación de errores. En un chatbot, un error es una respuesta incorrecta que el humano puede descartar. En un agente, un error en el razonamiento puede traducirse en acciones reales con consecuencias: un email enviado, un archivo modificado, una transacción ejecutada.

Falta de transparencia. Cuantos más pasos ejecuta el agente autónomamente, más difícil es entender por qué tomó ciertas decisiones. La “caja negra” se vuelve más opaca.

Scope creep. Un agente que intenta completar un objetivo ambiguo puede tomar acciones que el usuario no anticipaba. “Limpia mi bandeja de entrada” podría interpretarse de formas muy distintas.

Dependencia de herramientas. Si una herramienta falla o devuelve resultados erróneos, el agente puede construir sobre esa información incorrecta en pasos posteriores, compounding el error.

El principio de diseño más importante para agentes: supervisión humana en los puntos de mayor impacto. Los agentes son más útiles cuando hacen el trabajo pesado autónomamente pero piden confirmación antes de las acciones irreversibles o de alto riesgo. En el próximo capítulo veremos cómo funciona esto en la práctica.