Illustration : Flock
Anthropic a dévoilé une mise à jour importante pour son modèle « milieu de gamme » Sonnet, désormais proposé en version 5. Il gagne en capacités agentiques et il est proposé avec un rabais jusqu’à la fin de l’été.
Anthropic décline ses différents modèles en trois familles principales : Haiku, le plus rapide et le plus économique ; Sonnet, le polyvalent qui vise le meilleur compromis prix/vitesse/intelligence ; et Opus, le haut de gamme et donc, le plus cher. Le labo IA a également lancé Mythos, son modèle expérimental le plus avancé, dont la version « grand public », Fable, a été temporairement bloquée par l’administration Trump jusqu’au 30 juin (on y reviendra dans un autre article).
En attendant que Fable puisse faire l’objet d’un déploiement commercial à plus grande échelle, Anthropic a entrepris d’améliorer Sonnet qui passe de la version 4.6 à la 5 directement, probablement pour se caler sur la nomenclature des nouveaux modèles. Sonnet 5 est censé mieux gérer les tâches dites « agentiques » : planifier une suite d’actions, utiliser un navigateur, manipuler un terminal, écrire ou corriger du code, vérifier son propre travail, poursuivre une tâche sans s’arrêter trop tôt.

L’entreprise affirme que cette nouvelle version de Sonnet réduit l’écart avec Opus 4.8, le modèle supérieur actuel. Ce dernier se montre toujours plus performant que son petit frère comme le montrent les benchmarks d’Anthropic, que ce soit sur le code agentique (63,2 % sur SWE-bench Pro, contre 69,2 % pour Opus 4.8 par exemple). Cela n’en reste pas moins un gain substantiel par rapport à Sonnet 4.6, sur tous les plans.
Un rabais estival avant la douloureuse
Anthropic insiste beaucoup sur la partie prix : Sonnet 5 revient à 3 dollars par million de tokens en entrée et 15 $/M en sortie. C’est le même tarif que Sonnet 4.6, mais il y a un mais. Le modèle reprend le tokenizer inauguré par Opus 4.7 qui fait consommer davantage de tokens au modèle. Anthropic admet que Sonnet 5 peut brûler jusqu’à 35 % de tokens supplémentaires pour un même texte.

Résultat : utiliser le nouveau modèle Sonnet va coûter plus cher. Pour faire passer la pilule, Anthropic offre généreusement un rabais sur le token (2 $/M en entrée, 10 $/M en sortie), mais… jusqu’au 31 août. Opus 4.8 est toujours le plus onéreux, à 5 $/M en entrée, et 25 $/M en sortie.
Sur le plan de la sécurité, Anthropic affirme que les hallucinations de Sonnet 5 sont moins fréquentes. Le modèle est aussi présenté comme plus résistant que Sonnet 4.6 aux injections de prompts et à certaines requêtes malveillantes. La société reconnait néanmoins que sur certains tests de comportement indésirable, Opus 4.8 lui reste supérieur, tout comme (évidemment, pourrait-on dire) Mythos Preview.
Puisqu’on parle du champion toutes catégories de la cybersécurité, restons encore un peu sur le sujet. Sonnet 5 n’a pas été entraîné pour ce genre de tâches, il est donc beaucoup moins capable qu’Opus 4.8 ou Mythos 5. Anthropic l’a doté de garde-fous activés par défaut, mais qui restent moins stricts que ceux de Fable 5. « [Sonnet 5] peut effectuer certaines tâches de cybersécurité courantes et non nuisibles », explique l’entreprise, mais ses performances en matière de développement d’outils exploitant des vulnérabilités sont « largement inférieures » à celles des deux modèles hauts de gamme.
Sonnet 5 devient le modèle par défaut pour les utilisateurs gratuits et les abonnés Pro. Il est aussi disponible pour les clients Max, Team et Enterprise, ainsi que dans Claude Code et pour l’API.
