Prefacio
- Por qué este libro
- ¿Para quién es este libro?
- Cómo leer este libro
- Agradecimientos
Capítulo 1. El bucle del agente, en serio
- Objetivos de aprendizaje
- 1.1 El bucle mínimo
- 1.2 Qué añade Claude Code encima
- 1.3 Dónde vive realmente el Estado
- 1.4 Ejemplo resuelto: un agente de screening de medios adversos
- 1.5 La versión de pizarra de diez minutos
- 1.6 Una nota sobre el vocabulario
- Resumen
- Ceremonias
- Notas
Capítulo 2. Qué es Claude Code en abril de 2026
- 2.1 El CLI como verdad sobre el terreno
- 2.2 Superficies IDE: VS Code, JetBrains y la nueva ola
- 2.3 Superficies de CI: Acciones de GitHub
- 2.4 Superficies de chat: Slack
- 2.5 Otras superficies y lo que este libro no cubre
- 2.6 Cómo se propagan las versiones
- 2.7 Lo que necesitas saber antes de comprometerte con una superficie
- Resumen
- Ceremonias
- Notas
Capítulo 3. La familia de modelos y por qué es importante para el bucle
- 3.1 Los tres tamaños
- 3.2 Ventanas de contexto y cómo fallan
- 3.3 Almacenamiento en caché rápido y por qué cambia el juego
- 3.4 Forma del coste, no coste por token
- 3.5 La matriz de selección de modelos
- 3.6 Desempeño y línea base del SWE-Bench
- Resumen
- Ceremonias
- Notas
Capítulo 4. El contexto como recurso de primera clase
- 4.1 La anatomía de un turno
- 4.2 CLAUDE.md como sistema de verdad
- 4.3 Automemoria y cuándo miente
- 4.4 La transcripción de la sesión y la acumulación de contexto
- 4.4a Configuración de memoria automática y compactación
- 4.5 Hoja de trabajo de presupuesto contextual
- 4.6 Ejemplo resuelto: un agente de monitoreo de cumplimiento
- Resumen
- Ceremonias
- Notas
Capítulo 5. La definición de producción
- 5.1 Cinco propiedades de un agente de producción
- 5.2 Observable: pistas de auditoría y razonamiento
- 5.3 Reversible: Deshacer y corregir
- 5.4 Evaluable: Métricas y medición
- 5.5 Gobernable: control de cambios y rendición de cuentas
- 5.6 La rúbrica de preparación
- 5.7 Ejemplo resuelto: el agente de screening de medios adversos
- 5.8 En qué ayudará y en qué no ayudará este libro
- Resumen
- Ceremonias
- Notas
Parte II: La pila de primitivos
Capítulo 6. Herramientas como superficie API
- Objetivos de aprendizaje
- 6.1 Qué es realmente una herramienta
- 6.2 Las tres categorías de herramientas
- 6.3 Manejo de errores y qué aprende el modelo en caso de falla
- 6.4 Herramientas de versionado sin agentes disruptores
- 6.5 Limitación de tarifas y atribución de costes
- 6.6 Ejemplo resuelto: el conjunto de herramientas de detección
- 6.7 Esquemas de herramientas como gobernanza
- Resumen
- Ceremonias
- Notas
Capítulo 7. Subagentes y el modelo de delegación
- Objetivos de aprendizaje
- 7.1 Qué es y qué no es un subagente
- 7.2 El contrato padre-hijo
- 7.3 Cuándo lanzar frente a cuándo incrustar
- 7.4 Aislamiento de contexto y por qué importa
- 7.5 El patrón fan-out
- 7.6 Configuración de subagentes
- 7.7 Usos indebidos comunes
- 7.8 Cuándo usar qué: una guía de decisión en toda la pila de primitivos
- 7.9 Ejemplo desarrollado: un agente de consultas de cumplimiento con subagentes
- Resumen
- Ejercicios
- Notas
Capítulo 8. Hooks, el único supervisor que tienes
- Objetivos de aprendizaje
- 8.1 Qué es y qué no es un hook
- 8.2 Patrones de matching de hooks
- 8.3 Escribir un hook PreToolUse
- 8.4 Escribir un hook PostToolUse
- 8.5 El patrón de hook four-eyes
- 8.6 Dónde viven los hooks
- 8.7 Hooks como herramienta de depuración
- 8.8 Ejemplo desarrollado: un agente de screening de cumplimiento con four-eyes
- Resumen
- Ejercicios
- Notas
Capítulo 9. Slash commands y skills
- Objetivos de aprendizaje
- Objetivos de aprendizaje (continuación)
- 9.1 Qué es una skill
- 9.2 Anatomía del archivo de skill
- 9.3 Escribir instrucciones que los agentes puedan seguir
- 9.4 Auto-invoke frente a manual invoke
- 9.5 Versionado de skills y trazas de auditoría
- 9.6 Ejemplo desarrollado: una skill de screening
- 9.7 Skills, herramientas y hooks
- Resumen
- Ejercicios
- Notas
Capítulo 10. MCP y el plano de integración
- Objetivos de aprendizaje
- 10.1 Qué es realmente MCP
- 10.2 Cómo funciona MCP
- 10.3 Mecanismos de transporte: stdio y HTTP
- 10.4 Escribir un servidor MCP
- 10.5 Seguridad de MCP: autenticación, rate limiting y PII
- 10.6 Cuándo MCP es la opción correcta
- 10.7 Ejemplo desarrollado: un servidor MCP para medios adversos
- Resumen
- Ejercicios
- Notas
Capítulo 11. Plugins y marketplaces
- Objetivos de aprendizaje
- 11.1 Qué contiene un plugin
- 11.2 Instalación y ciclo de vida
- 11.3 Confianza y procedencia
- 11.4 El modelo de marketplace
- 11.5 Construir un plugin para tu equipo
- 11.6 El plugin de cumplimiento de FS: un ejemplo trabajado
- 11.7 Resumen
- Ejercicios
- Notas al pie
Capítulo 12. Colocar la pila juntos: un agente de monitoreo de cumplimiento finaliza
- Objetivos de aprendizaje
- 12.1 El volumen de trabajo en detalle
- 12.2 La arquitectura del agente
- 12.3 Avanzado de sesión: proyección de un cliente
- 12.4 La pila de gobernanza en acción
- 12.5 Orquestación multientidad
- 12.6 Atribución de costes y gestión del presupuesto
- 12.7 Ejemplo de seguimiento de auditoría
- 12.8 Lo que este capítulo no cubre (y dónde encontrarlo)
- Resumen
- Ejercicios
- Notas
Capítulo 13. Cuándo salir de la CLI y cómo integrarla cuando lo hagas
- Objetivos de aprendizaje
- 13.1 Los cinco buenos motivos
- 13.2 Los quince falsos positivos
- 13.3 El patrón de subproceso: la CLI desde el SDK
- 13.4 Diagrama de decisión en prosa
- 13.5 Ejemplo desarrollado: un manejador de consultas de screening con auditoría
- 13.6 Despliegue empresarial: de la CLI a Kubernetes
- Resumen
- Ejercicios
- Notas al pie
Capítulo 14. El SDK de una sentada
- Objetivos de aprendizaje
- 14.1 La función query
- 14.2 Opciones y configuración
- 14.3 Tipos de mensaje
- 14.4 Registro de herramientas y esquemas
- 14.5 El agente mínimo funcional en cincuenta líneas (Python)
- 14.6 El mismo agente en TypeScript
- 14.7 Lo que el SDK no hace
- Resumen
- Ejercicios
- Notas al pie
Capítulo 15. Herramientas, ganchos y subagentes del lado SDK
- Objetivos de aprendizaje
- 15.1 Herramientas de registro con esquemas
- 15.2 Semántica PreToolUse y PostToolUse
- 15.3 Gancho que coincide en el SDK
- 15.4 Subagentes de cosecha
- 15.5 Ejemplo de trabajo: manejador de investigación de cumplimiento
- Resumen
- Ejercicios
- Notas de pie de página
Capítulo 16. Sesiones, estado y durabilidad
- Objetivos de aprendizaje
- 16.1 Modelo del sesión
- 16.2 Opciones de almacenamiento y compensaciones
- 16.3 Patrones de Durabilidad
- 16.4 Replay de sesión para depurar
- 16.5 Ejemplo trabajado: manejo de la investigación a través de cambios analistas
- Resumen
- Ejercicios
- Notas de pie de página
Capítulo 17. El modelo de permisos: léelo dos veces
- Objetivos de aprendizaje
- Los tres modos de permisos
- Permisos por herramienta
- Permisos a escala: despliegues contenedorizados
- Restricciones de rutas de archivos
- El problema de escalada de permisos
- Denegación por defecto como único punto de partida sensato
- Auditoría de permisos
- Ejemplo trabajado de servicios financieros: el incidente de la lista de sanciones
- Resumen
- Ejercicios
- Notas
Capítulo 18. Sandboxing y la pregunta del radio de impacto
- Objetivos de aprendizaje
- Sandboxing a nivel de SO: límites de sistema de archivos, proceso y red
- Aislamiento basado en contenedores
- El marco del radio de impacto
- Configuración de sandbox entre entornos
- Reducir el radio de impacto: patrones prácticos de diseño
- Medir el radio de impacto
- Ejemplo trabajado de servicios financieros: análisis de radio de impacto para un agente de cumplimiento con acceso a PII de clientes
- Resumen
- Ejercicios
- Notas
Capítulo 19. Egreso de red, secretos y límites de datos
- Objetivos de aprendizaje
- Listas de permitidos de red
- Patrones de inyección de secretos: dónde y cómo gestionar claves API, tokens y credenciales
- Higiene de variables de entorno
- Clasificación de datos y el agente
- PII en ventanas de contexto
- La prueba de estrés de la carga de trabajo de screening
- Ejemplo trabajado de servicios financieros: un agente de screening que registra PII en un endpoint de observabilidad
- Resumen
- Ejercicios
- Notas
Capítulo 20. Política como código: managed settings, auditoría y linaje
- Objetivos de aprendizaje
- La anatomía de managed-settings.json
- Desplegar settings a escala
- Versionado de políticas: el repositorio de políticas
- Logging de auditoría: qué capturar y dónde enviarlo
- Linaje: rastrear una decisión hacia atrás a través de las llamadas de herramienta del agente
- La pregunta forense: reconstruir qué hizo el agente
- Ejemplo trabajado de servicios financieros: responder a una auditoría de cumplimiento con linaje
- Resumen
- Ejercicios
- Notas
Capítulo 21. La cadena de suministro: plugins, habilidades, servidores MCP
- Objetivos de aprendizaje
- El problema de la confianza
- Procedencia y firma
- Fijación de versión
- La auditoría antes de instalar.
- Expansión de la dependencia
- Construyendo un registro interno
- El problema de los plugins de proveedores en industrias reguladas
- Ejemplo de servicios financieros trabajados: el plugin de sanciones que llamaba a casa
- Resumen
- Ejercicios
- Notas al pie
Capítulo 22. La mentalidad de evaluación
- Objetivos de aprendizaje
- Por qué las evaluaciones no son negociables
- Los tres tipos de evaluación
- Qué evaluar en un sistema de agentes versus un sistema de finalización
- El ciclo de desarrollo eval-first
- Construyendo evaluación en CI
- Evaluaciones continuas y la conexión AgentOps
- Cuando las evaluaciones fallan: interruptores de apagado, implementaciones canarias y respuestas automáticas
- La trampa de la deuda de evaluación
- Ejemplo FS: agentes de detección y deriva de resultados
- Resumen
- Ejercicios
Capítulo 23. Diseño de evaluaciones para cargas de trabajo agentes
- Objetivos de aprendizaje
- Trayectoria versus calificación de respuestas
- Creación de conjuntos de datos valiosos para agentes
- El problema de las fugas de etiquetas
- Arquitectura de arnés de evaluación
- Cómo encaja Claude Code en el flujo de trabajo de evaluación
- Trazado de trayectorias de agentes y puntos de decisión
- Trampas del determinismo
- Validez estadística para conjuntos de evaluación pequeños
- Ejemplo FS: Evaluación de screening de medios adversoss sin fugas en las etiquetas
- Resumen
- Ejercicios
Capítulo 24. LLM-como-juez, hecho en serio
- Objetivos de aprendizaje
- Qué es un modelo de juez
- Escribir indicaciones del juez que realmente discriminan
- Calibrando jueces contra calificaciones humanas
- Juzgar la deriva y cómo detectarla
- Paneles de jueces múltiples
- La cuestión de la circularidad
- El coste de juzgar
- Jueces de Habilidades 2.0
- Ejemplo de FS: Calibrar a un juez en una clasificación de investigación
- Resumen
- Ejercicios
Capítulo 25. Observabilidad: seguimientos, intervalos y línea de tiempo del agente.
- Objetivos de aprendizaje
- Qué instrumentar
- El modelo de seguimiento para agentes: turnos, llamadas de herramientas, subagentes
- La pila de observabilidad y dónde encaja Claude Code
- Integración de OpenTelemetry
- MLflow para seguimiento de experimentos
- Opik para seguimientos específicos de agentes
- Datadog para el seguimiento de la producción
- Creación de paneles de control que importen
- Tarjetas de agente y respuestas basadas en KPI
- Diseño de alertas para agentes
- Ejemplo de FS: Instrumentación para un agente KYC
- Resumen
- Ejercicios
Capítulo 26. Modos de falla e ingeniería de fiabilidad.
- Objetivos de aprendizaje
- La taxonomía del fracaso
- Detección de modos de fallo
- SLO para agentes
- Presupuestos erróneos
- Estrategias de reversión para agentes
- Dónde falla el libro de jugadas SRE para los agentes
- Disyuntores y patrones de respaldo
- Respuesta a incidentes por fallas del agente
- FS ejemplo: adulación en un agente de screening
- Resumen
- Ejercicios
Capítulo 27. Ingeniería de costes
- Objetivos de aprendizaje
- 27.1 Los cuatro tipos de costes
- 27.2 Mecánica de costes de tokens y palancas de optimización
- 27.3 Coste de tiempo: por qué el tiempo real importa más que las tokens
- 27.4 Coste de revisión: el impuesto oculto sobre cada producción de agente
- 27.5 Coste del cambio de contexto: lo que le cuesta al ser humano volver a interactuar
- 27.6 Coste de infraestructura: la partida que todos olvidan
- 27.7 Construyendo un modelo de costes
- 27.8 Monitoreo de costes y alertas
- 27.9 La curva de compensación coste-calidad
- 27.10 Ejemplo resuelto: modelo de costes para una carga de trabajo de detección
- Resumen
- Ejercicios
- Notas
Capítulo 28. Flujos de trabajo del equipo y la fábrica de agentes.
- Objetivos de aprendizaje
- 28.1 La pareja: un desarrollador, un agente
- 28.2 El grupo: agentes compartidos, gobierno del equipo
- 28.3 La plataforma: agentes como infraestructura
- 28.4 Cuándo encaja cada patrón
- 28.5 La fábrica de agentes: aprovisionamiento, monitoreo y ciclo de vida
- 28.6 El camino dorado para las cargas de trabajo de nuevos agentes
- 28.7 Responsabilidades: el equipo de la plataforma vs el desarrollador
- 28.8 Ejemplo resuelto: escalar de par a plataforma
- Resumen
- Ejercicios
- Notas
Capítulo 29. Antipatrones desde el campo y cómo migrar la automatización heredada sin arrepentimiento
- Objetivos de aprendizaje
- 29.1 Antipatrón 1: El ciclo de decisión
- 29.2 Antipatrón 2: El bucle de inferencia
- 29.3 Antipatrón 3: fragilidad inmediata
- 29.4 Antipatrón 4: La trampa de herramientas
- 29.5 Antipatrón 5: El culto al modelo
- 29.6 Antipatrón 6: Sobrecarga de contexto
- 29.7 Antipatrón 7: El cuello de botella en la aprobación
- 29.8 Antipatrón 8: Coste desbocado
- 29.9 La prueba del juicio: decidir qué debe ser un agente
- 29.10 Migrar la automatización heredada sin arrepentimientos
- 29.11 Ejemplo resuelto: el equipo de cumplimiento que se arrepintió de haber convertido todo su proceso
- 29.12 Cosas que nunca deberían ser agentes
- Resumen
- Ejercicios
- Notas
Capítulo 30. El camino por delante, con un mínimo de publicidad.
- Objetivos de aprendizaje
- 30.1 Lo que ha aterrizado y lo que viene
- 30.2 Lo que es plausible pero no confirmado
- 30.3 Lo que no sucederá en 2026
- 30.4 Tres cosas para construir ahora que darán sus frutos independientemente
- 30.5 Tres apuestas a evitar
- 30.6 Lista de verificación de preparación de un arquitecto
- 30.7 Las próximas conversaciones
- Resumen
- Lista de verificación de preparación de un arquitecto
- Ejercicios
- Notas
Apéndice A. Lista de verificación de preparación para la producción en noventa días
- Fase 1: Cimentaciones (Días 1-30)
- Fase 2: Gobernanza (Días 31-60)
- Fase 3: Evaluaciones y operacionalización (días 61-90)
- Métricas para rastrear
Apéndice B. El kit de inicio de evaluación
- Evaluaciones canónicas (todos los agentes)
- Evaluaciones de servicios financieros
- Cómo ejecutar estas evaluaciones
- Resultados de grabación
Apéndice C. managed-settings.json Referencia con anotaciones
- Explicación campo por campo
- Cómo utilizar esta configuración
Apéndice D. MCP Plantilla de auditoría del servidor
- MCP Lista de verificación de auditoría del servidor
- Puntuación
- Después de la auditoría: seguimiento continuo
Apéndice E. Glosario
- Patrones y antipatrones
- Gobernanza y Cumplimiento
- Abreviaturas comunes
- Cuando este glosario no está sincronizado