// PROYECTO DE LABORATORIO

Un agente que no necesita que le digamos qué hacer.

Argos es el proyecto de laboratorio de OrvixLabs. La mayoría de los agentes actuales son ejecutores: reciben una misión definida por un humano y la cumplen con mayor o menor sofisticación. Argos invierte el problema. Argos no necesita que se le diga qué hacer: observa su entorno, construye un modelo del mismo, establece sus propios objetivos a partir de esa observación, y planifica con autocorrección continua. Su misión no es un input: es una conclusión a la que llega.

La capacidad de generar misión, no sólo de cumplirla.

Las cuatro capacidades Marco teórico

// OrvixLabs es una agencia híbrida. Estudio de sistemas y consultora técnica con sede en Necochea, Buenos Aires. Diseñamos, construimos y operamos infraestructura privada con inteligencia artificial empresarial.

// AGENTES QUE NO ESPERAN INSTRUCCIONES

Cuando el agente decide qué hacer.

Los agentes de hoy son ejecutores. Reciben una misión, la cumplen, esperan la próxima. Argos invierte el problema. Observa su entorno, modela el mundo, deriva sus propios objetivos y planifica con autocorrección. Sin deadline comercial. La apuesta de OrvixLabs sobre lo que viene.

// LAS CUATRO CAPACIDADES

Lo que separa a Argos de cualquier marco de trabajo existente.

Argos se define por la coexistencia simultánea de cuatro propiedades. Cualquier sistema que demuestre una o dos puede llamarse asistente; sólo cuando las cuatro operan en bucle aparece algo que merece el nombre de agente autónomo de razonamiento.

// 01

Exploración autónoma del entorno

Argos sondea activamente su contexto en lugar de esperar instrucciones. Identifica qué hay, qué cambia, qué patrones se repiten y qué señales son nuevas. La exploración es un proceso constante, no una fase inicial.

// 02

Modelado del mundo a partir de observaciones

Lo observado se condensa en una representación interna: entidades, relaciones, dinámicas, regularidades. El modelo no es estático; se revisa cada vez que la realidad contradice la predicción. El modelo es la materia prima de toda decisión posterior.

// 03

Establecimiento de objetivos sin instrucciones explícitas

A partir del modelo, Argos deriva qué vale la pena hacer. Detecta brechas entre el estado actual y estados deseables, prioriza, y propone metas propias. Aquí ocurre el salto cualitativo: la misión emerge del razonamiento, no del prompt.

// 04

Planificación con autocorrección en tiempo real

Una vez fijado un objetivo, Argos construye un plan, lo ejecuta y lo reescribe en vivo cuando el feedback del entorno no coincide con lo esperado. La corrección no es una excepción sino el modo de operación por defecto.

Las cuatro capacidades deben operar como un bucle cerrado: explorar → modelar → fijar objetivo → planificar → corregir → volver a explorar. Si alguna se rompe, Argos colapsa a un asistente convencional.

// PRINCIPIO RECTOR

Margaret Hamilton: diseñar asumiendo que todo puede fallar.

Hamilton diseñó el software del Apollo 11 partiendo de que cualquier subsistema podía colapsar en cualquier momento, y construyó una arquitectura de prioridades capaz de seguir operando cuando eso ocurriera. Argos hereda esa filosofía: cada capa, sensores, modelo, objetivos, planes, actuadores, se diseña con la hipótesis de que las otras pueden fallar, devolver basura, o quedar desactualizadas.

En términos prácticos, esto define decisiones concretas de arquitectura: degradación elegante, verificación cruzada entre componentes, persistencia de estado, y un comportamiento por defecto siempre seguro cuando el sistema entra en duda.

// PRIMERA APLICACIÓN

Agente central de casa inteligente.

El primer entorno de despliegue es el hogar. No porque sea trivial, no lo es, sino porque combina cuatro condiciones ideales para validar las capacidades: un entorno acotado, rico en señales heterogéneas, con un usuario humano que aporta feedback continuo, y con consecuencias reales si la acción es errónea.

Voz natural

Interacción conversacional como interfaz primaria, no como comando.

Gestión IoT

Control de hardware doméstico: iluminación, clima, seguridad, electrodomésticos.

Asistencia cognitiva

Soporte al usuario en planificación, memoria, decisiones cotidianas.

Anticipación

Predicción de necesidades a partir de patrones observados, no de reglas cableadas.

El hogar es el primer dominio, no el último. Argos se diseña environment-agnostic: la misma arquitectura debe poder trasladarse a un entorno industrial, a un vehículo, o a un contexto digital sin reescritura conceptual.

// MARCO TEÓRICO

Argos no es ciencia ficción.

Las cuatro capacidades de Argos descansan sobre cuerpos de investigación maduros en inteligencia artificial. Esta no es una lista exhaustiva sino una guía de entrada para quien quiera profundizar en cada pilar.

Agentes autónomos y arquitecturas cognitivas

Russell, S. & Norvig, P. (2020). Artificial Intelligence: A Modern Approach, 4ta edición. Pearson. Capítulos 2 (Intelligent Agents) y 26 (Robotics).
Wooldridge, M. (2009). An Introduction to MultiAgent Systems, 2da edición. Wiley.
Sumers, T., Yao, S., Narasimhan, K. & Griffiths, T. (2024). "Cognitive Architectures for Language Agents". Transactions on aprendizaje automático Research.

Modelos del mundo y representaciones internas

Ha, D. & Schmidhuber, J. (2018). "World Models". arXiv:1803.10122. Trabajo fundacional sobre modelos del mundo aprendidos por agentes.
Hafner, D., et al. (2023). "Mastering Diverse Domains through World Models" (DreamerV3). arXiv:2301.04104.
LeCun, Y. (2022). "A Path Towards Autonomous Machine Intelligence". Open Review. Arquitectura JEPA y agentes con modelos del mundo predictivos.

Motivación intrínseca y exploración autónoma

Pathak, D., et al. (2017). "Curiosity-Driven Exploration by Self-Supervised Prediction". ICML 2017.
Schmidhuber, J. (2010). "Formal Theory of Creativity, Fun, and Intrinsic Motivation". IEEE Transactions on Autonomous Mental Development.
Oudeyer, P-Y. & Kaplan, F. (2007). "What is Intrinsic Motivation? A Typology of Computational Approaches". Frontiers in Neurorobotics.

Establecimiento autónomo de objetivos

Colas, C., et al. (2022). "Autotelic Agents with Intrinsically Motivated Goal-Conditioned Reinforcement Learning". Journal of Artificial Intelligence Research.
Stooke, A., et al. (2022). "Open-Ended Learning Leads to Generally Capable Agents". DeepMind. arXiv:2107.12808.
Wang, R., et al. (2019). "POET: Open-Ended Coevolution of Environments and their Optimized Solutions". GECCO 2019.

Planificación adaptativa y autocorrección

Camacho, E.F. & Bordons, C. (2007). Model Predictive Control, 2da edición. Springer.
Sutton, R.S. & Barto, A.G. (2018). Reinforcement Learning: An Introduction, 2da edición. MIT Press. Capítulos sobre planning y planning-learning architectures.
Yao, S., et al. (2023). "ReAct: Synergizing Reasoning and Acting in Language Models". ICLR 2023.

Margaret Hamilton y el software del Apolo 11

Hamilton, M. (1976). "Hamilton's Lessons Learned: Apollo Software Development". NASA Internal Document.
Mindell, D. (2008). Digital Apollo: Human and Machine in Spaceflight. MIT Press.
Eyles, D. (2018). Sunburst and Luminary: An Apollo Memoir. Fort Point Press. Memorias del codiseñador del software del módulo lunar.

// ESTADO ACTUAL

Dónde está el proyecto.

Proyecto formalmente definido y nombrado. Tesis cerrada. Las cuatro capacidades fundamentales están delimitadas conceptualmente. Falta materializar la arquitectura base que las integre en un bucle operativo único. Argos es un proyecto de laboratorio sin deadline comercial, su prioridad es la solidez de la arquitectura, no la velocidad de salida al mercado.

Construir un agente que no necesite que le digamos qué hacer, porque ya entendió, por sí mismo, qué hace falta hacer.

// LO QUE VIENE

Lo que viene cuando los agentes deciden, no obedecen.

La generación actual de agentes de inteligencia artificial es una generación de cumplidores. Reciben una misión, la ejecutan, esperan la próxima. Eso ya está resuelto.

Lo que todavía no existe en producción es un agente que observe su entorno sin que se lo pidan, construya su propio modelo de qué está pasando, decida qué importa y qué no, y actúe en consecuencia con capacidad de corregirse cuando lo que pensaba no se cumple.

Argos es nuestro intento de cruzar esa frontera.

// HORIZONTE INMEDIATO

Hogar inteligente

Un entorno acotado con riqueza sensorial real. Los errores son recuperables. Hay verificador humano continuo.

// HORIZONTE MEDIO

Industrial

Procesos productivos donde la lógica es manejable pero las consecuencias escalan. El salto técnico es de orden de magnitud.

// HORIZONTE LARGO

Vehicular

Donde la dimensión espacial y temporal entran a jugar. La frontera real de la autonomía agentica.

Argos no es un producto en venta. Es la apuesta de OrvixLabs sobre lo que viene. Cuando esté listo para una empresa, vamos a saber. Mientras tanto, investigamos.

// FAQ

Preguntas frecuentes sobre Argos

Qué es Argos? +

Argos es el proyecto de laboratorio de OrvixLabs sobre agentes autónomos de razonamiento. La mayoría de los agentes actuales son ejecutores que reciben una misión y la cumplen. Argos invierte el problema, observa su entorno, construye un modelo del mundo, deriva sus propios objetivos y planifica con autocorrección continua.

Argos está a la venta? +

No. Argos es investigación de laboratorio sin deadline comercial. La prioridad es la solidez arquitectónica de las cuatro capacidades integradas (observar, modelar, derivar objetivos, planificar con autocorrección), no la velocidad al mercado. Cuando un producto Argos esté listo para una empresa, vamos a anunciarlo específicamente.

Cuáles son las cuatro capacidades de Argos? +

Primera, exploración autónoma del entorno sin esperar instrucciones. Segunda, modelado del mundo a partir de observaciones. Tercera, establecimiento de objetivos propios sin instrucciones explícitas. Cuarta, planificación con autocorrección en tiempo real cuando el feedback del entorno no coincide con lo esperado. Las cuatro tienen que operar en bucle continuo, no por separado.

Por qué empiezan probándolo en una casa? +

Una casa combina cuatro condiciones ideales, entorno acotado pero con señales sensoriales heterogéneas, errores recuperables sin consecuencias graves, usuario humano que aporta feedback continuo, y suficiente complejidad para que el problema sea real. En una planta industrial las consecuencias de un error son muy grandes para arrancar ahí. En una casa, el agente aprende rápido y nadie sale herido.

Cuándo escalará Argos a entornos industriales o vehiculares? +

El hoja de ruta conservador apunta a hogar funcional para fin de 2026 o principios de 2027, industrial durante 2027, y vehicular durante 2028. Cada salto es de orden de magnitud técnico y los plazos pueden moverse según la validación arquitectónica. No comprometemos fechas para que el producto esté listo, lo hacemos al revés.

Argos comparte arquitectura con IRIS SCE o con Casandra? +

Argos hereda principios de ambos pero es una arquitectura distinta. Hereda la filosofía Hamilton de IRIS, asumir que cualquier subsistema puede fallar. Hereda la deliberación adversarial de Casandra para validar las conclusiones del modelo del mundo. Pero el bucle exploración-modelo-objetivos-plan es propio de Argos.

Cuál es la diferencia entre un agente Argos y un agente Claude o GPT? +

Los agentes actuales basados en LLMs ejecutan tareas dadas. Vos les decís qué hacer, ellos lo hacen. Argos decide qué hacer. No espera misión. Observa, modela, deriva su propia misión a partir de la observación, y la cumple con autocorrección. La diferencia no es de capacidad técnica, es de iniciativa cognitiva.

Argos cumple con el principio Magnifica Humanitas? +

Sí, deliberadamente. Argos tiene iniciativa para actuar pero las decisiones críticas o de impacto significativo se elevan a humanos para validación. La autonomía no es total, es operacional dentro de un marco donde la responsabilidad última sigue siendo humana.

// LO QUE MÁS NOS MOTIVA

Argos en momentos donde los humanos no pueden llegar a tiempo.

La aplicación que más nos motiva del proyecto Argos no es la doméstica. Es la respuesta a situaciones donde decisiones rápidas, autónomas y observadoras de su entorno pueden salvar vidas. Un agente que ve, modela, infiere objetivos y actúa sin esperar instrucciones tiene un lugar natural ahí, donde mandar a un humano es muy lento, muy peligroso, o directamente imposible.

Desastres naturales

Sismos, inundaciones, incendios forestales, tsunamis. Argos opera donde las redes están caídas, donde no hay conectividad continua, donde la situación cambia hora a hora. Observa con sensores propios, modela el área afectada, prioriza zonas críticas y coordina con quien sí puede llegar.

Emergencias edilicias

Incendios en edificios, derrumbes, evacuaciones. Argos puede operar dentro del edificio mismo, leer el avance del fuego o el daño estructural, identificar dónde hay personas atrapadas, sugerir rutas de evacuación seguras que cambian a medida que cambia la situación. Información en vivo para los rescatistas.

Conflicto y crisis humanitaria

Zonas en guerra, áreas de conflicto activo, situaciones donde la presencia humana es de muy alto riesgo. Un agente autónomo puede entrar a observar, identificar civiles, infraestructura crítica, vías de salida, sin exponer a operadores. La diferencia con un drone tradicional es que decide por su cuenta qué mirar y qué reportar.

Operación en entornos inviables

Plantas nucleares con incidentes, minas con riesgo de derrumbe, infraestructura crítica comprometida. Donde un humano no puede entrar o el costo de entrar es desproporcionado, un agente que decide qué hacer en función de lo que ve y aprende del entorno cambia las reglas del juego.

// EL PRINCIPIO QUE LO HACE POSIBLE

No es un dron con IA. Es un agente con criterio.

Un dron sigue órdenes, va donde le dicen, hace lo que le programan. Argos observa, infiere qué es importante en el contexto que enfrenta, decide qué reportar y qué acción priorizar, y se autocorrige cuando lo que predijo no coincide con lo que ve. La diferencia es de categoría, no de potencia.

Esto se enmarca dentro del principio Magnifica Humanitas. Argos delibera, modela, recomienda y ejecuta tareas operativas. Las decisiones que afectan vidas se elevan siempre a un humano responsable. La autonomía es de movimiento y observación, no de juicio último.