Anthropic ha presentado Claude Fable 5, su modelo de inteligencia artificial más sofisticado hasta la fecha, marcando un hito en la ingeniería de software, la investigación científica y el manejo de conocimiento complejo. Sin embargo, su lanzamiento al público general viene acompañado de una medida sin precedentes: la imposición de restricciones explícitas que bloquean consultas relacionadas con la ‘ciberseguridad’, biología, química y destilación de modelos, redirigiendo estas funciones a una versión anterior, Claude Opus 4.8. Esta decisión subraya una creciente preocupación por el potencial mal uso de inteligencias artificiales de frontera.
La justificación de estas limitaciones emana directamente de la experiencia de Anthropic con ‘Project Glasswing’, un programa piloto donde Mythos Preview, la versión precursora de Fable 5, demostró capacidades extraordinarias. A través de la colaboración con cerca de 50 entidades, entre las que figuran gigantes tecnológicos como Cloudflare, Mozilla, Microsoft, Oracle y Palo Alto Networks, la IA logró identificar más de 10.000 vulnerabilidades de alta o crítica severidad en lo que Anthropic describe como el software de mayor importancia sistémica a nivel global. Este despliegue restringido reveló la magnitud del ‘poder ofensivo’ de la IA.
La eficacia defensiva de Mythos Preview es, paradójicamente, el núcleo de la cautela de Anthropic. Ejemplos contundentes incluyen la identificación de 2.000 errores en los sistemas de ruta crítica de Cloudflare, de los cuales 400 fueron catalogados como de severidad alta o crítica, con una tasa de falsos positivos que su equipo consideró superior a la de auditores humanos. Por su parte, Mozilla encontró y corrigió 271 vulnerabilidades en Firefox 150, superando en más de diez veces las detectadas con modelos previos. Además, el Instituto de Seguridad de IA del Reino Unido confirmó que Mythos Preview fue el primer modelo en resolver autónomamente dos simulaciones de ciberataques de principio a fin.
Esta dicotomía en las capacidades se materializa en la distinción entre Fable 5 y su contraparte sin restricciones, Mythos 5. Mientras Fable 5 opera con filtros conservadores que, según Anthropic, podrían incluso bloquear solicitudes inofensivas en su afán por mitigar riesgos, Mythos 5, liberado de estas salvaguardas en ciertas áreas, se desplegará inicialmente a través de Project Glasswing, en colaboración estratégica con el gobierno de Estados Unidos. Esta versión sin censura, con ‘las capacidades de ciberseguridad más avanzadas de cualquier modelo en el mundo’, se orienta exclusivamente a la defensa de infraestructuras críticas.
El contexto global en el que Fable 5 llega al público es el de una escalada documentada de ciberataques asistidos por inteligencia artificial, particularmente en el ecosistema de criptomonedas. Expertos del sector, como Maximiliano Carjuzaa, cofundador de Money On Chain, han advertido que cerca del 100% de los ataques a plataformas de Finanzas Descentralizadas (DeFi) registrados en meses recientes involucraron IA en alguna medida. Charles Guillemet, CTO de Ledger, añadió que la IA está reduciendo drásticamente la barrera de entrada para los atacantes, contribuyendo a pérdidas millonarias, como los casi 635 millones de dólares robados en al menos 34 hackeos registrados solo en abril de 2026.
La tensión inherente a esta situación es palpable: mientras los filtros de Fable 5 buscan proteger al público, su verificación independiente frente a intentos sistemáticos de evasión no ha sido documentada. La existencia de Mythos 5, con capacidades defensivas y ofensivas sin precedentes y operando en manos de entidades gubernamentales, plantea interrogantes cruciales sobre la gobernanza global y la democratización de la inteligencia artificial de frontera, así como las implicaciones éticas y de seguridad para un mundo cada vez más interconectado y vulnerable ante la sofisticación de las amenazas digitales.Si le ha parecido interesante este análisis, le invitamos a compartirlo y a dejar su opinión en los comentarios.




