Cuando Tu Agente Deja el Edificio

Tres Primitivas de Infraestructura que Nadie Más Está Construyendo

por Sam Rogers
10 min de lectura
framework
governance
strategy
advanced
Cuando Tu Agente Deja el Edificio

La semana pasada, Anthropic publicó accidentalmente el código fuente completo del Claude Code. 1.902 archivos. Más de 512.000 líneas. Toda la arquitectura de uno de los sistemas de IA agentic más exitosos comercialmente jamás lanzados, expuesta porque alguien olvidó excluir un mapa de origen de un paquete npm. ¡Uy! Pequeño error, grandes consecuencias.

Internet catalogó las características ocultas. La mascota Tamagotchi. El modo de voz no lanzado. Las 44 banderas de funcionalidad. Eso es interesante durante unos cinco minutos.

Lo que es interesante durante mucho más tiempo es lo que Nate B. Jones encontró al mapear la infraestructura subyacente a esas características. Nate dirige uno de los boletines informativos de estrategia de IA más respetados de la industria, con un historial de traducir desarrollos técnicos brutos en marcos que los líderes de ingeniería y ejecutivos realmente utilizan. Su análisis de la filtración del Claude Code identificó 12 primitivas de infraestructura que determinan si un sistema agentic realmente funciona en producción: persistencia de sesión, tuberías de permisos, gestión del presupuesto de tokens, registros de herramientas, recuperación de fallos, cabinas de verificación y más.

Su conclusión es: la llamada LLM es quizás el 20% de lo que hace que un agente funcione. El otros 80% es la fontanería.

Tiene razón. Y nosotros hemos estado construyendo activamente esa fontanería aquí en PAICE. Pero cuando mapeamos sus 12 primitivas frente a lo que hemos lanzado, algo destacó.

Cada primitiva en el marco es interna para el agente. Lo que sucede dentro de los propios límites del agente: sus propias sesiones, sus propios permisos, su propio presupuesto de tokens, sus propias herramientas. Ninguna de ellas aborda lo que sucede cuando el agente interactúa con el mundo exterior.

Eso no es una crítica al marco de Nate. Es el siguiente capítulo.

Las 12 Primitivas Son Necesarias. No Son Suficientes.

Para ser claros sobre lo que cubre el marco de Nate, y lo que cubre bien: si su agente no puede mantener sesiones a través de fallos, no puede aplicar niveles de permiso a sus propias herramientas, no puede rastrear su propio consumo de tokens antes de hacer una llamada API, y no puede verificar sus propias salidas contra pruebas invariantes, usted no tiene un sistema en producción. Tiene una demostración. Las 12 primitivas son la infraestructura mínima viable para un agente que funciona.

Pero los agentes no existen en aislamiento. Llaman a API externos. Operan a través de jurisdicciones regulatorias. Trabajan junto a humanos que pueden o no estar prestando atención. La infraestructura que gobierna esas interacciones no vive dentro del agente. Vive entre el agente y todo lo que toca.

Hemos identificado tres primitivas que abordan esta brecha. Las tres están lanzadas, son de código abierto y funcionan en producción bajo PAICE.work PBC.

Límites de Permisos entre Servicios

El marco de Nate describe una pila de seguridad de 18 módulos para una herramienta de ejecución de carcasa única dentro del Claude Code. Defensa en profundidad: patrones de comando preaprobados, advertencias de comandos destructivos, comprobaciones de seguridad específicas de git, determinación del entorno aislado (sandbox). Cada módulo puede bloquear la ejecución independientemente.

Eso es riguroso. Pero también está completamente acotado a la ejecución de la herramienta del propio agente. ¿Qué sucede cuando el agente llama a un servicio externo y alcanza un límite de tasa? ¿Es bloqueado? ¿Encuentra un límite de capacidad que el servicio no documentó?

Ahora, los agentes fallan en silencio en los límites de servicio. El servicio devuelve un 429 o un 403, el agente reintenta o alucina alrededor de ello, y el usuario se pregunta por qué la salida es incorrecta. No hay una forma estándar para que un servicio comunique sus límites a un agente, ni una forma estándar para que un agente comprenda y respete esos límites con gracia.

Graceful Boundaries es nuestra especificación publicada que aborda esto. Define cómo los servicios comunican límites operativos tanto a humanos como a agentes, con seis niveles de conformidad y 131 pruebas aprobadas. Cubre la comunicación proactiva de límites (encabezados que informan a los agentes qué está disponible antes de que lleguen a un muro), respuestas de rechazo estructuradas (explicaciones legibles por máquina de por qué se denegó una solicitud) y mecanismos de descubrimiento (para que los agentes comprendan los límites de un servicio antes de su primera solicitud). Gratuito y de código abierto, como debe ser cualquier estándar decente.

Siteline es la implementación de referencia. Escanea sitios web y API para la conformidad con Graceful Boundaries y califica su preparación para agentes utilizando la rúbrica SNAP. Piénselo como el patrón médico que describe Nate, externalizado: en lugar de que su agente realice una comprobación de estado sobre sí mismo, Siteline realiza una comprobación de estado sobre los servicios de los que depende su agente. Esto no es sobre SEO, es sobre cuán amigable con los agentes es su sitio web. También es gratuito.

La pila de permisos interna le da una ejecución de herramientas segura. Los límites entre servicios le dan interacciones seguras con todo lo que está fuera del proceso del agente.

Contexto Regulatorio Consciente de la Procedencia

Una de las primitivas más importantes que identifica Nate es el ensamblaje de contexto consciente de la procedencia: cada pieza de contexto que recupera su agente debe llevar metadatos sobre de dónde proviene, cuándo se generó y cuán confiable es. Sin esos metadatos, el contexto recuperado se convierte en otra superficie de inyección de indicaciones (prompt injection).

El marco describe esto como una preocupación de memoria interna. Pero para los agentes que operan en industrias reguladas, el contexto más crítico no es la memoria interna. Es la verdad legal externa.

Cuando un agente necesita determinar si puede procesar datos personales en la UE, o qué obligaciones de divulgación se aplican al asesoramiento financiero generado por IA en Nueva York, la respuesta no puede provenir de un resumen alucinado de una regulación que el modelo vio durante el entrenamiento. Debe provenir de un instrumento legal verificado, con fuente, fecha y metadatos de jurisdicción claros.

EveryAILaw.com es un rastreador regulatorio centrado en las obligaciones que cubre 51 instrumentos en 31 jurisdicciones, con más de 200 jurisdicciones globales buscadas. El modelo de datos trata las obligaciones como entidades de primera clase (no como leyes), con campos de procedencia integrados en la estructura: jurisdicción, fecha de entrada en vigor, autoridad fuente, historial de enmiendas y estado de cumplimiento. Todo el conjunto de datos está disponible a través de un servidor MCP, lo que significa que cualquier agente puede consultarlo programáticamente y recibir respuestas estructuradas y con fuente.

La distinción entre centrado en la ley y centrado en la obligación es importante aquí. Un rastreador centrado en la ley le dice: "Existe la Ley de IA de la UE". Un rastreador centrado en la obligación le dice: "si está implementando un sistema de IA de alto riesgo en la UE, debe llevar a cabo una evaluación de conformidad bajo el Artículo 43, efectiva en agosto de 2025, aplicada por las autoridades nacionales de vigilancia del mercado". Esa es la diferencia entre una referencia y una herramienta de apoyo a la decisión.

Para la cartera PAICE específicamente, esto alimenta nuestras próximas variantes de evaluación específicas de jurisdicción. Una evaluación PAICE para un asesor financiero en la UE presenta un contexto regulatorio diferente al de un proveedor de atención médica en California. Los metadatos de procedencia hacen esto posible sin codificar la lógica jurisdiccional en el motor de evaluación. Dado que estas regulaciones cambian a menudo, y seguirá haciéndolo.

Cabina de Verificación Humana

La cabina de verificación de Nate es la octava primitiva de su marco. Define pruebas invariantes que detectan regresiones: las herramientas destructivas siempre requieren aprobación, las salidas estructuradas se validan contra un esquema, las herramientas denegadas nunca se ejecutan, el agotamiento del presupuesto produce una parada elegante. Estas pruebas verifican que el agente funciona correctamente.

Nadie está construyendo el equivalente para el humano en el circuito.

Esta es la brecha que existe PAICE para llenar. Todo sistema de agente que involucra supervisión humana (y en las industrias reguladas, todos ellos) depende de la suposición de que el humano está ejerciendo esa supervisión. Detectando errores. Cuestionando las salidas excesivamente seguras. Verificando afirmaciones antes de actuar sobre ellas. Pero esa suposición no está probada en casi ningún sistema desplegado.

PAICE (People + AI Collaboration Effectiveness) mide esto mediante la observación conductual. No es una prueba de conocimiento ni una autoevaluación. Observa cómo las personas responden a los errores de la IA, la exceso de confianza y las alucinaciones durante una conversación real, y produce una puntuación en cinco dimensiones: Performance, Accountability, Integrity, Collaboration y Evolution.

La puntuación sigue una jerarquía de evidencia: detectar errores inyectados siempre supera la fluidez conversacional. Un profesional conciso que detecta cada error plantado obtiene una puntuación más alta que un comunicador pulido que los pasa por alto. La evaluación mide lo que la gente hace, no lo que dice que haría.

Para las industrias reguladas, esto no es un extra agradable. Si un oficial de cumplimiento da el visto bueno a los hallazgos de auditoría generados por IA sin verificación, la pila de permisos de 18 módulos dentro del agente es irrelevante. El humano en el circuito es la capa de verificación final, y ahora mismo, nadie está probando si esa capa funciona.

Estos Tres No Son Opcionales para Industrias Reguladas

Si está construyendo agentes para productos de consumo, redes sociales o herramientas de productividad internas, las 12 primitivas internas pueden ser suficientes. Sus agentes operan en entornos donde los fallos silenciosos son molestos pero no catastróficos.

Si está implementando agentes en atención médica, servicios financieros, legales, seguros, ciberseguridad o gubernamentales, las tres primitivas externas no son opcionales. Los profesionales de GRC deben verificar que los agentes respetan los límites de los servicios externos. Los oficiales de cumplimiento necesitan contexto regulatorio rastreado por procedencia, no resúmenes legales alucinados. Los CISOs necesitan evidencia de que los humanos de su organización están ejerciendo supervisión, no solo ocupando un asiento en el circuito.

Las 12 primitivas internas lo llevan a producción. Estas tres lo llevan a producción en industrias donde los errores tienen consecuencias profesionales.

Los tres están lanzados. Los tres son gratuitos para que los individuos los utilicen. Los tres están interconectados a través de MCP, lo que significa que se componen en un sistema en lugar de existir como herramientas aisladas. Y los tres están disponibles hoy bajo PAICE.work PBC.


¿Quiere evaluar qué tan efectivamente colabora su equipo con la IA? Conozca PAICE para organizaciones o realice una evaluación individual para verlo por sí mismo.


Involúcrese:


Lecturas Recomendadas

📖 Comprendiendo el Ecosistema PAICE:

📖 Construyendo la Verificación en la Práctica:

¿Curioso pero con poco tiempo?

Realiza el PAICE Pulse de 3 minutos — una verificación rápida de confianza que muestra cómo percibes tu propia postura de colaboración con IA. No requiere inicio de sesión.