Anthropic ha lanzado al mercado Claude Fable 5, su modelo de inteligencia artificial más avanzado hasta la fecha, marcando un hito en el procesamiento de información compleja y la ingeniería de software. No obstante, la compañía ha implementado estrictas salvaguardas, redirigiendo automáticamente consultas relacionadas con la seguridad cibernética, biología y química a su predecesor, Claude Opus 4.8. Esta decisión subraya una postura conservadora y precautoria frente al potencial uso indebido de las capacidades de frontera de la IA en dominios críticos.
La justificación de estas restricciones radica en la experiencia previa de Anthropic con Project Glasswing, un programa confidencial que distribuyó la versión ‘Mythos Preview’ a un selecto grupo de 50 socios. Durante esta fase, la IA identificó más de 10,000 vulnerabilidades de alta o crítica severidad en sistemas de software globalmente esenciales. Gigantes tecnológicos como Cloudflare y Mozilla validaron la eficacia de este modelo, con Cloudflare reportando una tasa de falsos positivos superior a la de auditores humanos, lo que evidencia el extraordinario poder analítico de la plataforma.
El poder de ‘Mythos Preview’ no se limitó a la detección pasiva. El Instituto de Seguridad de IA del Reino Unido confirmó que fue el primer modelo capaz de resolver simulaciones completas de ciberataques de manera autónoma, desde el inicio hasta la culminación. Esta capacidad ofensiva inherente es precisamente lo que Anthropic busca mitigar en su versión pública, Fable 5, conscientes de que, sin estos filtros, las herramientas podrían ser explotadas para generar daños graves y sistémicos en la infraestructura digital global.
La estrategia de Anthropic, a menudo descrita como ‘constitucional’ por su énfasis en la seguridad y la ética, contrasta notablemente con las políticas más flexibles de otros líderes del sector como OpenAI y Google DeepMind, quienes han relajado progresivamente ciertos filtros para ampliar la utilidad de sus modelos. Si bien esta postura ha sido elogiada por reguladores y expertos en seguridad que priorizan la minimización de riesgos, también ha generado críticas por parte de desarrolladores que demandan mayor libertad y funcionalidad para innovar.
La coyuntura de este lanzamiento se inserta en un contexto global de creciente preocupación por la proliferación de ataques cibernéticos asistidos por inteligencia artificial, especialmente dirigidos al sector de las criptomonedas. Expertos como Maximiliano Carjuzaa, cofundador de Money On Chain, han señalado que casi el 100% de los ataques a finanzas descentralizadas (DeFi) en los meses previos involucraron algún grado de asistencia de IA, mientras que Charles Guillemet, CTO de Ledger, advierte sobre la drástica reducción de la barrera de entrada para los atacantes, magnificando la amenaza.
La tensión principal emerge del hecho de que, mientras Fable 5 ofrece filtros para el público general, su contraparte sin restricciones, Mythos 5, ya opera bajo el amparo de Project Glasswing en colaboración con el gobierno de Estados Unidos y entidades de infraestructura crítica. Las capacidades demostradas de Mythos en la detección autónoma de vulnerabilidades no tienen precedentes, lo que plantea interrogantes fundamentales sobre la suficiencia de los filtros en la versión pública y el control sobre una tecnología con un potencial ofensivo y defensivo tan disruptivo a escala global.
Si le ha parecido interesante este análisis, le invitamos a compartirlo y a dejar su opinión en los comentarios.




