Decir “inteligencia artificial” sin especificar qué tipo es como decir “vehículo” sin distinguir entre un patinete y un avión. La etiqueta es útil para la conversación general, pero oscurece distinciones que importan cuando quieres entender qué puede hacer un sistema y qué no.
La IA no es una sola técnica. Es una familia de enfoques con mecanismos, capacidades y limitaciones radicalmente distintos. El mapa que sigue no es exhaustivo —el campo es enorme— pero cubre los tipos que aparecen en el 95% de las conversaciones sobre IA aplicada.
Aprendizaje supervisado
Qué es: El modelo aprende a partir de ejemplos etiquetados. Se le muestra un input y la respuesta correcta, y aprende a producir esa respuesta para inputs similares.
Cómo funciona: Imagina un clasificador de correos. Le muestras miles de correos ya clasificados como spam o no spam. El modelo aprende qué características del correo están correlacionadas con cada categoría. Cuando llega un correo nuevo, aplica lo aprendido.
Ejemplos reales:
- Detección de spam
- Diagnóstico por imagen médica
- Reconocimiento de voz
- Clasificación de sentimiento en reseñas
- Predicción de precios de vivienda
Limitación clave: Necesita datos etiquetados, y etiquetar datos a escala requiere tiempo y dinero. Si no tienes ejemplos de lo que quieres que el modelo aprenda, no puedes usar este enfoque directamente.
Aprendizaje no supervisado
Qué es: El modelo aprende sin etiquetas. No se le dice cuál es la respuesta correcta: se le pide que encuentre estructura en los datos por sí mismo.
Cómo funciona: Imagina miles de artículos de noticias sin categorizar. El aprendizaje no supervisado puede agruparlos en temas similares (clustering) sin que nadie le diga qué categorías existen. El modelo descubre la estructura latente de los datos.
Ejemplos reales:
- Segmentación de clientes por comportamiento
- Detección de anomalías (transacciones fraudulentas que se “salen” del patrón normal)
- Compresión de datos
- Descubrimiento de temas en grandes colecciones de texto
- Sistemas de recomendación
Limitación clave: Las agrupaciones que produce el modelo pueden no coincidir con las categorías que son útiles para el negocio. Interpretar los resultados requiere criterio humano.
Aprendizaje por refuerzo
Qué es: El modelo aprende a través de la interacción con un entorno, recibiendo recompensas o penalizaciones según sus acciones. No hay un dataset estático: el modelo genera su propio proceso de aprendizaje jugando.
Cómo funciona: Piensa en un agente que aprende a jugar al ajedrez. No le dices qué movimiento hacer en cada posición. Le dices que ganar vale +1 y perder vale -1. El agente juega millones de partidas contra sí mismo, ajusta su estrategia en función de los resultados y, con el tiempo, aprende a jugar mejor que cualquier humano.
Ejemplos reales:
- AlphaGo y AlphaZero (juegos de mesa)
- Control de robots físicos
- Optimización de sistemas de refrigeración en centros de datos
- Estrategias de trading automatizado
- RLHF (Reinforcement Learning from Human Feedback): el método usado para alinear modelos de lenguaje como ChatGPT o Claude
Limitación clave: Requiere definir con precisión qué se recompensa, y si esa definición es ligeramente incorrecta, el agente puede encontrar formas inesperadas de maximizar la recompensa que no son las deseadas. Es el problema de la “especificación de la recompensa”.
IA generativa
Qué es: Modelos entrenados para producir contenido nuevo —texto, imagen, audio, vídeo, código— que sea coherente con los patrones aprendidos durante el entrenamiento.
Cómo funciona: A diferencia de los modelos supervisados que clasifican o predicen un valor, los modelos generativos aprenden la distribución estadística de sus datos de entrenamiento y pueden muestrear de esa distribución para producir ejemplos nuevos. Un modelo de lenguaje aprende cómo el texto humano está estructurado; un modelo de imagen aprende cómo se ven las imágenes. Después puede generar texto o imágenes que se parezcan a las del entrenamiento.
Ejemplos reales:
- GPT-4, Claude, Gemini (texto)
- DALL·E, Midjourney, Stable Diffusion (imagen)
- Sora, Runway (vídeo)
- Whisper + ElevenLabs (audio y voz)
- GitHub Copilot (código)
Limitación clave: Los modelos generativos no tienen acceso a “verdad”: generan lo que es estadísticamente plausible, no lo que es factualmente correcto. Las alucinaciones son una consecuencia estructural de este mecanismo, no un bug.
El mapa completo
INTELIGENCIA ARTIFICIAL
│
├── Aprendizaje Automático (Machine Learning)
│ ├── Supervisado → clasifica, predice con etiquetas
│ ├── No supervisado → agrupa, detecta estructura sin etiquetas
│ └── Por refuerzo → aprende actuando, maximiza recompensa
│
└── IA Generativa
├── Modelos de Lenguaje (LLM) → texto
├── Modelos de Difusión → imágenes
└── Modelos Multimodales → texto + imagen + audio
En la práctica, los sistemas modernos combinan varios enfoques. Los grandes modelos de lenguaje usan transformers (una arquitectura) entrenados de forma supervisada sobre texto, y luego afinados con aprendizaje por refuerzo a partir de feedback humano (RLHF). No son puramente supervisados ni puramente por refuerzo: son híbridos.
Saber en qué categoría cae un sistema no lo es todo, pero sí es el primer paso para entender qué puede hacer, qué necesita para funcionar y dónde es probable que falle. Eso es lo que hace que el mapa valga la pena.