Casandra no es un envoltorio sobre Claude. Es otra cosa.
Casi todo lo que se vende hoy como inteligencia artificial empresarial es un prompt encima de una API. Explicamos por qué nuestro motor deliberativo es estructuralmente distinto.
El 95% de las "soluciones de IA empresarial" que se venden hoy son la misma cosa, un prompt elaborado encima de una API de OpenAI, Anthropic o Google. Funcionan. Resuelven cosas. Pero no son sistemas, son scripts disfrazados.
Casandra es estructuralmente distinta y vale la pena explicar por qué, porque no es una diferencia cosmética.
Qué hace un envoltorio
Un envoltorio típico recibe una pregunta, arma un prompt con instrucciones, lo manda a un modelo (Claude, GPT, Gemini), recibe la respuesta y la devuelve al usuario. Quizás encadena dos o tres llamados. Quizás usa RAG para inyectar contexto. Pero la lógica es lineal, una sola pasada por un solo modelo.
Eso tiene tres problemas serios para uso empresarial:
- Confianza ciega. Lo que dice el modelo, sale. No hay verificación independiente.
- No detecta su propio error. Si el modelo alucinó, no se entera nadie. El usuario lo descubre tarde, cuando ya tomó la decisión.
- No discrimina por contexto. Una respuesta cualquiera sirve para cualquier pregunta. No hay especialización real.
Cómo funciona Casandra
Casandra no hace una sola llamada. Hace cuatro, en paralelo, a modelos distintos, con roles distintos. Uno verifica hechos contra fuentes. Otro cuestiona la lógica buscando contradicciones. Otro sintetiza. Otro aprueba o rechaza. Si los cuatro no llegan a consenso, el sistema dice explícitamente "no tengo certeza" en lugar de inventar.
Eso cambia todo. El costo computacional es mayor, sí, entre tres y cinco veces más caro por consulta que un envoltorio. Pero el costo de una decisión empresarial mal tomada es exponencialmente mayor que eso. Un dossier comercial mal armado, un veredicto operativo equivocado, una recomendación que parecía sólida pero no lo era, esos errores cuestan más que mil consultas caras.
Por qué multi-modelo importa
Si los cuatro agentes corrieran en el mismo modelo, compartirían los mismos sesgos. Si Claude alucina sobre un tema, los cuatro Claudes van a alucinar parecido. Por eso usamos modelos heterogéneos, Claude para razonamiento profundo, GPT para verificación factual, Gemini para auditoría, modelos más rápidos para tareas auxiliares. El sesgo de un modelo lo neutraliza otro.
El resultado es un sistema que sabe cuándo no sabe. Eso, para una empresa que paga consecuencias reales por las decisiones que toma, no es un detalle. Es la diferencia entre una herramienta y un sistema.
Un envoltorio te dice lo que el modelo cree. Casandra te dice lo que el modelo cree, lo que otro modelo refuta, y qué quedó en pie después.