-
El sistema orquesta modelos de distintos proveedores a través de una sola API.
-
Los benchmarks son auto-reportados y no han sido verificados de forma independiente.
Sakana AI, laboratorio de inteligencia artificial con sede en Tokio, lanzó el 22 de junio de 2026 Fugu y Fugu Ultra, un sistema multiagente que coordina modelos de distintos proveedores a través de una única interfaz de programación de aplicaciones (API).
Según la firma, Fugu Ultra equipara el rendimiento de Claude Fable 5 y Mythos Preview en los benchmarks más exigentes de ingeniería, ciencia y razonamiento, sin depender de ningún proveedor único.
El lanzamiento ocurre nueve días después de que el gobierno de Estados Unidos ordenara a Anthropic suspender el acceso a Fable 5 y Mythos 5 para usuarios extranjeros por motivos de seguridad nacional. La medida dejó sin acceso a miles de desarrolladores y empresas que habían integrado esos modelos en sus operaciones, apenas cuatro días después de su lanzamiento público.
Sakana AI fue cofundada por investigadores que participaron en la elaboración del artículo académico original sobre la arquitectura Transformer, la base técnica sobre la que se construye la mayoría de los modelos de lenguaje actuales. La compañía señala que su enfoque no consiste en entrenar un modelo más grande, sino en coordinar los mejores modelos disponibles para cada tarea.
Fugu no actúa como un modelo monolítico. Según la firma, el sistema asigna roles de pensador, ejecutor y verificador entre distintos modelos, sintetiza las respuestas y puede llamarse a sí mismo de forma recursiva para tareas complejas. El respaldo técnico proviene de dos artículos presentados en la conferencia ICLR 2026: TRINITY, que describe el sistema de coordinación, y Conductor, que entrena al coordinador mediante aprendizaje por refuerzo.
Qué puede hacer el sistema y cómo funciona el acceso
Fugu Ultra alcanzó 95,1 puntos en GPQA-Diamond y 73,7 en SWE-Bench Pro, según reportes internos de Sakana AI.
La firma sostiene que esos resultados superan a Claude Opus 4.8, GPT-5.5 y Gemini 3.1 Pro en la mayoría de las pruebas evaluadas, y que quedan al mismo nivel que Fable 5 en los benchmarks en los que hay comparación. La advertencia relevante: Fable 5 y Mythos no integran el pool de Fugu, porque tampoco son accesibles públicamente, por lo que la comparación es indirecta.
El sistema se comercializa en dos versiones:
- Fugu está orientado a tareas cotidianas, como programación y chat, con énfasis en baja latencia.
- Fugu Ultra está diseñado para trabajos de larga duración: investigación autónoma, reproducción de papers científicos, análisis de patentes y evaluaciones de ciberseguridad. Ambas versiones son accesibles a través de una API compatible con OpenAI, con planes de suscripción para usuarios individuales y modalidad de pago por uso para cargas empresariales.
Sakana AI plantea una ventaja estructural frente a los modelos restringidos: si un proveedor corta el acceso a alguno de los modelos de su pool, el sistema puede redirigir las tareas hacia otro sin interrumpir el servicio.
El argumento anterior cobra relevancia directa tras la suspensión de Fable 5, que, como informó CriptoNoticias, afectó a usuarios y empresas que pagaban suscripciones premium específicamente para acceder a esas capacidades.
El debate en torno a los benchmarks es relevante. Los resultados fueron reportados por la propia Sakana AI y no han sido verificados de forma independiente.
Investigadores y desarrolladores en foros técnicos señalaron que los sistemas de orquestación multiagente tienden a obtener mejores puntuaciones en pruebas de razonamiento de múltiples pasos, donde la coordinación entre modelos especializados ofrece ventaja real, pero que esa ganancia puede ser menor en tareas simples o de baja latencia donde la sobrecarga de coordinación añade ruido.
La dependencia de proveedor sigue siendo una variable sin resolver. Si alguno de los modelos del pool de Fugu restringe su acceso por decisión regulatoria o comercial, la capacidad de Sakana para sustituirlo depende de que existan alternativas con rendimiento comparable disponibles en ese momento.








