Claude Code: Construir agentes en producción… [PDF/iPad/Kindle]

Claude Code ya no es solo una herramienta para escribir código más rápido. Usado bien, se convierte en una forma nueva de construir software: agentes que entienden el contexto, usan herramientas, ejecutan tareas, respetan límites y trabajan dentro de flujos de producción reales.

Este libro es una guía práctica para diseñar, evaluar y operar agentes con Claude Code. No se queda en demos bonitas ni en ejemplos de juguete. Va directo a las preguntas que importan cuando quieres llevar agentes a producción: cómo organizar contexto, cuándo usar herramientas, cómo aislar subagentes, cómo definir permisos, cómo observar lo que ocurre, cómo medir calidad y cómo evitar que la automatización se convierta en una caja negra.

A lo largo del libro aprenderás patrones concretos para pasar de prompts sueltos a sistemas más fiables: bucles de agente, hooks, MCP, SDKs, trazas, evaluaciones, políticas, auditoría, costes y arquitectura de equipos. La idea central es simple: un agente útil no es el que parece inteligente en una demo, sino el que puede trabajar de forma repetible, verificable y segura.

Es un libro para ingenieros, líderes técnicos y equipos que quieren usar Claude Code con criterio. Si estás pensando en agentes como parte de tu forma de construir software, este libro te da el mapa para hacerlo sin perder el control.

Prefacio

Por qué este libro
¿Para quién es este libro?
Cómo leer este libro
Agradecimientos

Capítulo 1. El bucle del agente, en serio

Objetivos de aprendizaje
1.1 El bucle mínimo
1.2 Qué añade Claude Code encima
1.3 Dónde vive realmente el Estado
1.4 Ejemplo resuelto: un agente de screening de medios adversos
1.5 La versión de pizarra de diez minutos
1.6 Una nota sobre el vocabulario
Resumen
Ceremonias
Notas

Capítulo 2. Qué es Claude Code en abril de 2026

2.1 El CLI como verdad sobre el terreno
2.2 Superficies IDE: VS Code, JetBrains y la nueva ola
2.3 Superficies de CI: Acciones de GitHub
2.4 Superficies de chat: Slack
2.5 Otras superficies y lo que este libro no cubre
2.6 Cómo se propagan las versiones
2.7 Lo que necesitas saber antes de comprometerte con una superficie
Resumen
Ceremonias
Notas

Capítulo 3. La familia de modelos y por qué es importante para el bucle

3.1 Los tres tamaños
3.2 Ventanas de contexto y cómo fallan
3.3 Almacenamiento en caché rápido y por qué cambia el juego
3.4 Forma del coste, no coste por token
3.5 La matriz de selección de modelos
3.6 Desempeño y línea base del SWE-Bench
Resumen
Ceremonias
Notas

Capítulo 4. El contexto como recurso de primera clase

4.1 La anatomía de un turno
4.2 CLAUDE.md como sistema de verdad
4.3 Automemoria y cuándo miente
4.4 La transcripción de la sesión y la acumulación de contexto
4.4a Configuración de memoria automática y compactación
4.5 Hoja de trabajo de presupuesto contextual
4.6 Ejemplo resuelto: un agente de monitoreo de cumplimiento
Resumen
Ceremonias
Notas

Capítulo 5. La definición de producción

5.1 Cinco propiedades de un agente de producción
5.2 Observable: pistas de auditoría y razonamiento
5.3 Reversible: Deshacer y corregir
5.4 Evaluable: Métricas y medición
5.5 Gobernable: control de cambios y rendición de cuentas
5.6 La rúbrica de preparación
5.7 Ejemplo resuelto: el agente de screening de medios adversos
5.8 En qué ayudará y en qué no ayudará este libro
Resumen
Ceremonias
Notas

Parte II: La pila de primitivos

Capítulo 6. Herramientas como superficie API

Objetivos de aprendizaje
6.1 Qué es realmente una herramienta
6.2 Las tres categorías de herramientas
6.3 Manejo de errores y qué aprende el modelo en caso de falla
6.4 Herramientas de versionado sin agentes disruptores
6.5 Limitación de tarifas y atribución de costes
6.6 Ejemplo resuelto: el conjunto de herramientas de detección
6.7 Esquemas de herramientas como gobernanza
Resumen
Ceremonias
Notas

Capítulo 7. Subagentes y el modelo de delegación

Objetivos de aprendizaje
7.1 Qué es y qué no es un subagente
7.2 El contrato padre-hijo
7.3 Cuándo lanzar frente a cuándo incrustar
7.4 Aislamiento de contexto y por qué importa
7.5 El patrón fan-out
7.6 Configuración de subagentes
7.7 Usos indebidos comunes
7.8 Cuándo usar qué: una guía de decisión en toda la pila de primitivos
7.9 Ejemplo desarrollado: un agente de consultas de cumplimiento con subagentes
Resumen
Ejercicios
Notas

Capítulo 8. Hooks, el único supervisor que tienes

Objetivos de aprendizaje
8.1 Qué es y qué no es un hook
8.2 Patrones de matching de hooks
8.3 Escribir un hook PreToolUse
8.4 Escribir un hook PostToolUse
8.5 El patrón de hook four-eyes
8.6 Dónde viven los hooks
8.7 Hooks como herramienta de depuración
8.8 Ejemplo desarrollado: un agente de screening de cumplimiento con four-eyes
Resumen
Ejercicios
Notas

Capítulo 9. Slash commands y skills

Objetivos de aprendizaje
Objetivos de aprendizaje (continuación)
9.1 Qué es una skill
9.2 Anatomía del archivo de skill
9.3 Escribir instrucciones que los agentes puedan seguir
9.4 Auto-invoke frente a manual invoke
9.5 Versionado de skills y trazas de auditoría
9.6 Ejemplo desarrollado: una skill de screening
9.7 Skills, herramientas y hooks
Resumen
Ejercicios
Notas

Capítulo 10. MCP y el plano de integración

Objetivos de aprendizaje
10.1 Qué es realmente MCP
10.2 Cómo funciona MCP
10.3 Mecanismos de transporte: stdio y HTTP
10.4 Escribir un servidor MCP
10.5 Seguridad de MCP: autenticación, rate limiting y PII
10.6 Cuándo MCP es la opción correcta
10.7 Ejemplo desarrollado: un servidor MCP para medios adversos
Resumen
Ejercicios
Notas

Capítulo 11. Plugins y marketplaces

Objetivos de aprendizaje
11.1 Qué contiene un plugin
11.2 Instalación y ciclo de vida
11.3 Confianza y procedencia
11.4 El modelo de marketplace
11.5 Construir un plugin para tu equipo
11.6 El plugin de cumplimiento de FS: un ejemplo trabajado
11.7 Resumen
Ejercicios
Notas al pie

Capítulo 12. Colocar la pila juntos: un agente de monitoreo de cumplimiento finaliza

Objetivos de aprendizaje
12.1 El volumen de trabajo en detalle
12.2 La arquitectura del agente
12.3 Avanzado de sesión: proyección de un cliente
12.4 La pila de gobernanza en acción
12.5 Orquestación multientidad
12.6 Atribución de costes y gestión del presupuesto
12.7 Ejemplo de seguimiento de auditoría
12.8 Lo que este capítulo no cubre (y dónde encontrarlo)
Resumen
Ejercicios
Notas

Capítulo 13. Cuándo salir de la CLI y cómo integrarla cuando lo hagas

Objetivos de aprendizaje
13.1 Los cinco buenos motivos
13.2 Los quince falsos positivos
13.3 El patrón de subproceso: la CLI desde el SDK
13.4 Diagrama de decisión en prosa
13.5 Ejemplo desarrollado: un manejador de consultas de screening con auditoría
13.6 Despliegue empresarial: de la CLI a Kubernetes
Resumen
Ejercicios
Notas al pie

Capítulo 14. El SDK de una sentada

Objetivos de aprendizaje
14.1 La función query
14.2 Opciones y configuración
14.3 Tipos de mensaje
14.4 Registro de herramientas y esquemas
14.5 El agente mínimo funcional en cincuenta líneas (Python)
14.6 El mismo agente en TypeScript
14.7 Lo que el SDK no hace
Resumen
Ejercicios
Notas al pie

Capítulo 15. Herramientas, ganchos y subagentes del lado SDK

Objetivos de aprendizaje
15.1 Herramientas de registro con esquemas
15.2 Semántica PreToolUse y PostToolUse
15.3 Gancho que coincide en el SDK
15.4 Subagentes de cosecha
15.5 Ejemplo de trabajo: manejador de investigación de cumplimiento
Resumen
Ejercicios
Notas de pie de página

Capítulo 16. Sesiones, estado y durabilidad

Objetivos de aprendizaje
16.1 Modelo del sesión
16.2 Opciones de almacenamiento y compensaciones
16.3 Patrones de Durabilidad
16.4 Replay de sesión para depurar
16.5 Ejemplo trabajado: manejo de la investigación a través de cambios analistas
Resumen
Ejercicios
Notas de pie de página

Capítulo 17. El modelo de permisos: léelo dos veces

Objetivos de aprendizaje
Los tres modos de permisos
Permisos por herramienta
Permisos a escala: despliegues contenedorizados
Restricciones de rutas de archivos
El problema de escalada de permisos
Denegación por defecto como único punto de partida sensato
Auditoría de permisos
Ejemplo trabajado de servicios financieros: el incidente de la lista de sanciones
Resumen
Ejercicios
Notas

Capítulo 18. Sandboxing y la pregunta del radio de impacto

Objetivos de aprendizaje
Sandboxing a nivel de SO: límites de sistema de archivos, proceso y red
Aislamiento basado en contenedores
El marco del radio de impacto
Configuración de sandbox entre entornos
Reducir el radio de impacto: patrones prácticos de diseño
Medir el radio de impacto
Ejemplo trabajado de servicios financieros: análisis de radio de impacto para un agente de cumplimiento con acceso a PII de clientes
Resumen
Ejercicios
Notas

Capítulo 19. Egreso de red, secretos y límites de datos

Objetivos de aprendizaje
Listas de permitidos de red
Patrones de inyección de secretos: dónde y cómo gestionar claves API, tokens y credenciales
Higiene de variables de entorno
Clasificación de datos y el agente
PII en ventanas de contexto
La prueba de estrés de la carga de trabajo de screening
Ejemplo trabajado de servicios financieros: un agente de screening que registra PII en un endpoint de observabilidad
Resumen
Ejercicios
Notas

Capítulo 20. Política como código: managed settings, auditoría y linaje

Objetivos de aprendizaje
La anatomía de managed-settings.json
Desplegar settings a escala
Versionado de políticas: el repositorio de políticas
Logging de auditoría: qué capturar y dónde enviarlo
Linaje: rastrear una decisión hacia atrás a través de las llamadas de herramienta del agente
La pregunta forense: reconstruir qué hizo el agente
Ejemplo trabajado de servicios financieros: responder a una auditoría de cumplimiento con linaje
Resumen
Ejercicios
Notas

Capítulo 21. La cadena de suministro: plugins, habilidades, servidores MCP

Objetivos de aprendizaje
El problema de la confianza
Procedencia y firma
Fijación de versión
La auditoría antes de instalar.
Expansión de la dependencia
Construyendo un registro interno
El problema de los plugins de proveedores en industrias reguladas
Ejemplo de servicios financieros trabajados: el plugin de sanciones que llamaba a casa
Resumen
Ejercicios
Notas al pie

Capítulo 22. La mentalidad de evaluación

Objetivos de aprendizaje
Por qué las evaluaciones no son negociables
Los tres tipos de evaluación
Qué evaluar en un sistema de agentes versus un sistema de finalización
El ciclo de desarrollo eval-first
Construyendo evaluación en CI
Evaluaciones continuas y la conexión AgentOps
Cuando las evaluaciones fallan: interruptores de apagado, implementaciones canarias y respuestas automáticas
La trampa de la deuda de evaluación
Ejemplo FS: agentes de detección y deriva de resultados
Resumen
Ejercicios

Capítulo 23. Diseño de evaluaciones para cargas de trabajo agentes

Objetivos de aprendizaje
Trayectoria versus calificación de respuestas
Creación de conjuntos de datos valiosos para agentes
El problema de las fugas de etiquetas
Arquitectura de arnés de evaluación
Cómo encaja Claude Code en el flujo de trabajo de evaluación
Trazado de trayectorias de agentes y puntos de decisión
Trampas del determinismo
Validez estadística para conjuntos de evaluación pequeños
Ejemplo FS: Evaluación de screening de medios adversoss sin fugas en las etiquetas
Resumen
Ejercicios

Capítulo 24. LLM-como-juez, hecho en serio

Objetivos de aprendizaje
Qué es un modelo de juez
Escribir indicaciones del juez que realmente discriminan
Calibrando jueces contra calificaciones humanas
Juzgar la deriva y cómo detectarla
Paneles de jueces múltiples
La cuestión de la circularidad
El coste de juzgar
Jueces de Habilidades 2.0
Ejemplo de FS: Calibrar a un juez en una clasificación de investigación
Resumen
Ejercicios

Capítulo 25. Observabilidad: seguimientos, intervalos y línea de tiempo del agente.

Objetivos de aprendizaje
Qué instrumentar
El modelo de seguimiento para agentes: turnos, llamadas de herramientas, subagentes
La pila de observabilidad y dónde encaja Claude Code
Integración de OpenTelemetry
MLflow para seguimiento de experimentos
Opik para seguimientos específicos de agentes
Datadog para el seguimiento de la producción
Creación de paneles de control que importen
Tarjetas de agente y respuestas basadas en KPI
Diseño de alertas para agentes
Ejemplo de FS: Instrumentación para un agente KYC
Resumen
Ejercicios

Capítulo 26. Modos de falla e ingeniería de fiabilidad.

Objetivos de aprendizaje
La taxonomía del fracaso
Detección de modos de fallo
SLO para agentes
Presupuestos erróneos
Estrategias de reversión para agentes
Dónde falla el libro de jugadas SRE para los agentes
Disyuntores y patrones de respaldo
Respuesta a incidentes por fallas del agente
FS ejemplo: adulación en un agente de screening
Resumen
Ejercicios

Capítulo 27. Ingeniería de costes

Objetivos de aprendizaje
27.1 Los cuatro tipos de costes
27.2 Mecánica de costes de tokens y palancas de optimización
27.3 Coste de tiempo: por qué el tiempo real importa más que las tokens
27.4 Coste de revisión: el impuesto oculto sobre cada producción de agente
27.5 Coste del cambio de contexto: lo que le cuesta al ser humano volver a interactuar
27.6 Coste de infraestructura: la partida que todos olvidan
27.7 Construyendo un modelo de costes
27.8 Monitoreo de costes y alertas
27.9 La curva de compensación coste-calidad
27.10 Ejemplo resuelto: modelo de costes para una carga de trabajo de detección
Resumen
Ejercicios
Notas

Capítulo 28. Flujos de trabajo del equipo y la fábrica de agentes.

Objetivos de aprendizaje
28.1 La pareja: un desarrollador, un agente
28.2 El grupo: agentes compartidos, gobierno del equipo
28.3 La plataforma: agentes como infraestructura
28.4 Cuándo encaja cada patrón
28.5 La fábrica de agentes: aprovisionamiento, monitoreo y ciclo de vida
28.6 El camino dorado para las cargas de trabajo de nuevos agentes
28.7 Responsabilidades: el equipo de la plataforma vs el desarrollador
28.8 Ejemplo resuelto: escalar de par a plataforma
Resumen
Ejercicios
Notas

Capítulo 29. Antipatrones desde el campo y cómo migrar la automatización heredada sin arrepentimiento

Objetivos de aprendizaje
29.1 Antipatrón 1: El ciclo de decisión
29.2 Antipatrón 2: El bucle de inferencia
29.3 Antipatrón 3: fragilidad inmediata
29.4 Antipatrón 4: La trampa de herramientas
29.5 Antipatrón 5: El culto al modelo
29.6 Antipatrón 6: Sobrecarga de contexto
29.7 Antipatrón 7: El cuello de botella en la aprobación
29.8 Antipatrón 8: Coste desbocado
29.9 La prueba del juicio: decidir qué debe ser un agente
29.10 Migrar la automatización heredada sin arrepentimientos
29.11 Ejemplo resuelto: el equipo de cumplimiento que se arrepintió de haber convertido todo su proceso
29.12 Cosas que nunca deberían ser agentes
Resumen
Ejercicios
Notas

Capítulo 30. El camino por delante, con un mínimo de publicidad.

Objetivos de aprendizaje
30.1 Lo que ha aterrizado y lo que viene
30.2 Lo que es plausible pero no confirmado
30.3 Lo que no sucederá en 2026
30.4 Tres cosas para construir ahora que darán sus frutos independientemente
30.5 Tres apuestas a evitar
30.6 Lista de verificación de preparación de un arquitecto
30.7 Las próximas conversaciones
Resumen
Lista de verificación de preparación de un arquitecto
Ejercicios
Notas

Apéndice A. Lista de verificación de preparación para la producción en noventa días

Fase 1: Cimentaciones (Días 1-30)
Fase 2: Gobernanza (Días 31-60)
Fase 3: Evaluaciones y operacionalización (días 61-90)
Métricas para rastrear

Apéndice B. El kit de inicio de evaluación

Evaluaciones canónicas (todos los agentes)
Evaluaciones de servicios financieros
Cómo ejecutar estas evaluaciones
Resultados de grabación

Apéndice C. managed-settings.json Referencia con anotaciones

Explicación campo por campo
Cómo utilizar esta configuración

Apéndice D. MCP Plantilla de auditoría del servidor

MCP Lista de verificación de auditoría del servidor
Puntuación
Después de la auditoría: seguimiento continuo

Apéndice E. Glosario

Patrones y antipatrones
Gobernanza y Cumplimiento
Abreviaturas comunes
Cuando este glosario no está sincronizado

About

Share this book

Categories

Feedback

Author

Translations

Languages

Contents