Más honesto, más rápido y mejor en tareas de larga duración. Esto es lo que necesitas saber sobre la última actualización de Opus.

Anthropic acaba de lanzar Claude Opus 4.8, la nueva versión de su modelo de mayor capacidad. No es una revolución —lo reconocen ellos mismos: llaman a esta actualización «modesta pero tangible»— pero hay matices que conviene entender bien, especialmente si trabajas con IA en entornos profesionales o estás evaluando integrarlo en tus flujos de trabajo.

Lo más relevante: un modelo que admite cuando se equivoca

El dato que más me ha llamado la atención no es ningún benchmark de código, sino que Opus 4.8 tiene cuatro veces menos probabilidad que su predecesor de dejar pasar errores en código generado sin señalarlos. En la práctica, eso significa un modelo que dice «esto puede estar mal» en lugar de entregarte el resultado con aplomo y dejarte descubrir el problema tú sólo. Para quien trabaja en tareas técnicas largas o agentes autónomos, esto vale más de lo que parece a primera vista.

El equipo de alineación de Anthropic también ha validado que Opus 4.8 tiene tasas de comportamiento desalineado —engaño, cooperación con usos indebidos— sustancialmente menores que Opus 4.7, comparables a su modelo de investigación más avanzado, Mythos Preview.

Novedades en la plataforma

Este lanzamiento no viene sólo, ya que hay varias novedades técnicas relevantes para desarrolladores. Claude Code incorpora en vista previa los llamados dynamic workflows, que permiten lanzar cientos de subagentes en paralelo dentro de una sola sesión, pensados para migraciones de código a gran escala con verificación automática de resultados.

La Messages API —la API principal de Anthropic para interactuar con Claude— ahora acepta entradas de sistema dentro del propio array de mensajes, lo que permite actualizar las instrucciones del modelo en mitad de una tarea sin romper la caché del prompt. Algo aparentemente menor que tiene implicaciones importantes si construyes agentes con permisos que cambian según el contexto de ejecución.

Los usuarios de claude.ai también pueden ajustar ahora el nivel de esfuerzo que dedica el modelo a cada respuesta: más esfuerzo equivale a mejor resultado pero mayor consumo de tokens; menos esfuerzo, respuesta más rápida y menor impacto en los límites de uso.

Por último, el modo rápido de Opus 4.8 genera tokens a 2,5 veces la velocidad estándar y ahora cuesta tres veces menos que el modo rápido de versiones anteriores.

Precios y disponibilidad

Anthropic ha mantenido los precios de Opus 4.7 para el uso estándar: 5 dólares por millón de tokens de entrada y 25 por millón de salida. El modo rápido tiene un coste adicional: 10 y 50 dólares respectivamente. El modelo está disponible ya en la API de Anthropic, Amazon Web Services, Google Cloud y Microsoft Foundry, con el identificador claude-opus-4-8.

Qué viene después

Anthropic anticipa dos movimientos:

  • El primero, modelos con capacidades similares a Opus pero a menor coste.
  • El segundo, una nueva clase de modelo con mayor inteligencia que Opus: la familia Mythos.

Mythos Preview ya está siendo usado por un grupo reducido de organizaciones dentro del Proyecto Glasswing, centrado en ciberseguridad. Según Anthropic, están desarrollando las salvaguardas necesarias para un despliegue general y esperan tenerlo disponible para todos los clientes en las próximas semanas.

Opus 4.8 es una actualización sólida, no espectacular. Lo que más me importa de este lanzamiento no es el modelo en sí, sino la combinación de tres cosas: un modelo más honesto sobre sus propios errores, la nueva capacidad de inyectar instrucciones de sistema en mitad de una conversación vía API, y el anuncio de Mythos como próxima generación.

Para quienes construimos agentes sobre estos modelos, eso tiene un peso real.