Argos: lo que viene cuando el agente decide qué hacer, no cuando cumple órdenes
Casi todos los agentes de inteligencia artificial actuales son ejecutores. Argos invierte el problema. Es nuestro proyecto de laboratorio, sin deadline comercial.
Hoy todos hablan de "agentes" de inteligencia artificial. Pero si mirás de cerca lo que está corriendo en producción, son ejecutores. Reciben una misión, la cumplen, esperan la próxima. Más rápidos que un humano, sin dudas. Pero la inteligencia está en quien escribió el prompt, no en el agente.
Argos es un proyecto que arranca desde el otro lado. La pregunta no es "cómo hago que el agente cumpla mejor las órdenes". La pregunta es "qué pasa cuando el agente decide qué hacer él mismo".
El paso que falta
Para que un agente decida qué hacer, necesita cuatro capacidades trabajando juntas, no separadas. Tiene que observar su entorno autónomamente, sin que nadie le pida un reporte. Tiene que construirse un modelo del mundo a partir de esas observaciones. Tiene que derivar sus propios objetivos a partir de ese modelo. Y tiene que planificar acciones con autocorrección en tiempo real cuando el plan choca con la realidad.
Cualquiera de esas cuatro cosas, sola, es un problema interesante. Las cuatro juntas, conectadas en un bucle continuo, son otra cosa. Eso es lo que estamos investigando.
Por qué arrancamos por una casa
Argos arranca en un entorno residencial controlado, una casa con sensores, cámaras, automatización doméstica. Hay tres razones para empezar ahí, y ninguna es comercial.
Primero, una casa es un entorno acotado pero con riqueza sensorial real. Hay luz, temperatura, ruido, presencia, hábitos, anomalías. No es una simulación. Es el mundo, en una escala manejable.
Segundo, los errores son recuperables. Si Argos decide encender la calefacción a la hora equivocada, no pasa nada grave. Si lo mismo lo hicieras en una refinería, te podrías quedar sin planta. La casa nos da espacio para que aprenda.
Tercero, hay alguien observando todo el tiempo. La persona que vive en la casa es el verificador natural. Si Argos hace algo raro, va a haber feedback inmediato.
Laboratorio
De la casa, el siguiente paso es industrial, una planta o un proceso productivo donde los sensores y los efectos sean más complejos pero la lógica siga siendo manejable. Y después, vehicular, donde la dimensión espacial entra a jugar fuerte.
Cada salto es de orden de magnitud. Y cada salto requiere que las cuatro capacidades estén realmente integradas, no funcionando por separado. Eso es lo difícil. Y eso es lo que justifica que Argos no tenga deadline comercial, porque hacerlo mal sería peor que no hacerlo.
Qué tiene que ver con Ágora
Mucho y poco. Mucho porque Argos eventualmente se va a beneficiar del motor deliberativo de Casandra, los mismos principios de verificación cruzada se aplican cuando un agente decide. Poco porque el problema que estamos resolviendo es estructuralmente distinto, no es "ejecutar tareas bien", es "decidir qué tareas ejecutar".
Es un proyecto largo. Vale la pena.
El agente que cumple órdenes ya existe. El agente que decide qué hacer todavía no. Eso es lo que estamos construyendo.