Claude Sonnet 4.5 veut reprendre la couronne sur les performances en développement

Publié le 30 septembre 2025

•

5 min

Claude Sonnet 4.5 veut reprendre la couronne sur les performances en développement

#Actu

Anthropic a annoncé lundi soir son nouveau modèle de frontière. Baptisé logiquement Claude Sonnet 4.5, il a été présenté comme reprenant la couronne sur les performances et la précision dans plusieurs domaines. L’entreprise américaine veut notamment montrer que ses modèles restent les meilleurs pour le développement, surtout face à un GPT-5 qui a rééquilibré le […]

Source :

Fin mai, Anthropic lançait les versions 4 de ses modèles Claude. En plus de l’habituel Sonnet, la société annonçait en grande pompe son modèle Opus, présenté comme le nouveau fleuron de la gamme. Contrairement à Sonnet qui était orienté vers le « tout venant », Opus était réservé aux tâches les plus exigeantes, avec de plus grandes capacités de raisonnement et une précision accrue. Début aout, Anthropic lançait les version 4.1, avec des améliorations plus ou moins substantielles dans tous les domaines.

Une semaine plus tard, OpenAI présentait GPT-5. Même si le modèle a essuyé diverses critiques, il permettait de relancer la guerre entre les deux familles de modèles, surtout auprès des développeurs et toutes les personnes intéressées par les agents.

Pour ne pas laisser trop longtemps son concurrent sur le devant de la scène, Anthropic a dégainé lundi soir la version 4.5 de Claude Sonnet, avec la volonté affichée de reprendre la couronne sur ce que l’entreprise considère comme sa chasse gardée désormais.

Des scores une nouvelle fois en augmentation

Depuis hier soir, le modèle Claude Sonnet 4.5 est donc disponible, aussi bien dans l’interface du chatbot qu’à travers l’API. Anthropic joue la continuité : l’utilisation et les tarifs sont les mêmes. Pour ces derniers, on parle donc toujours de 3 dollars par million de jetons en entrée et 15 dollars par million de jetons en sortie. Le modèle devrait déjà être disponible chez les outils de vibe coding utilisant Claude, dont Cursor et Windsurf.

Sans surprise, Anthropic revendique une nouvelle fois la première place dans un certain nombre de tests. Sur SWE-Bench Verified notamment, Sonnet 4.5 affiche un score de base de 77,2 %, soit meilleur qu’Opus 4.1 et GPT-5, même dans sa version Codex. Le modèle arrive également en tête du OSWorld avec 61,4 %, contre 42,2 % il y a quatre mois. Le tableau présent dans l’annonce montre de meilleurs scores dans tous les domaines.

Pour illustrer les capacités de son nouveau modèle, Anthropic explique l’avoir vu fonctionner en continu « pendant plus de 30 heures sur des tâches complexes en plusieurs étapes » au sein du même projet. L’entreprise ne donne cependant aucune précision sur ce test et il est difficile pour l’instant de savoir si les conditions étaient standards ou si c’était le résultat d’une demande très spécifique.

Le meilleur pour quelques semaines ?

Qu’importe, car Anthropic est sûre d’elle : « Claude Sonnet 4.5 est le meilleur modèle de codage au monde. C’est le modèle le plus solide pour construire des agents complexes. C’est le meilleur modèle d’utilisation des ordinateurs. Et il montre des gains substantiels en raisonnement et en mathématiques », affirme l’entreprise. Elle assure également que cette version fait moins dans la flagornerie, se trompe moins et résiste mieux aux attaques par injection.

Au-delà des benchmarks, le développeur Simon Willison, qui intervient régulièrement dans les colonnes d’Ars Technica, indique sur son blog avoir pu tester Sonnet 4.5 pendant plusieurs semaines avant l’annonce. Le nouveau venu est selon lui meilleur que GPT5-Codex, qui était jusqu’ici son modèle préféré pour le développement. Il tempère cependant : le domaine évolue très rapidement, Gemini 3 (Google) devrait être lancé très prochainement et Claude Sonnet 4.5 ne gardera pas forcément sa couronne longtemps.

Anthropic ajoute que le nouveau Claude dispose de capacités supplémentaires. Il permet par exemple de générer des feuilles de calcul, des diapositives et autres documents sans quitter l’interface du chatbot. Il prend également en charge l’exécution de code et la création du fichier, toujours depuis l’interface de discussion, ou via les applications l’utilisant via son API.

Claude Code a maintenant son kit de développement

En plus du modèle Sonnet 4.5, Claude Code a désormais un SDK (Software Development Kit). Anthropic estime que le moment est venu, car après six mois de mises à jour constantes pour son outil d’aide à la programmation, elle pense savoir « ce qu’il faut pour créer et concevoir des agents d’IA ».

« Nous avons construit Claude Code parce que l’outil que nous voulions n’existait pas encore. Le SDK Agent vous donne la même base pour créer quelque chose d’aussi performant pour résoudre n’importe quel problème que vous résolvez », assure la société.

Le kit s’appuie sur la même infrastructure que pour Claude Code. L’idée est que les développeurs pourront développer leurs propres agents pour des tâches spécifiques, en profitant des mêmes performances.

Anthropic a également présenté une fonction intitulée « Imagine with Claude ». Réservée aux personnes abonnées Max (100 ou 200 dollars par mois), elle montre ce que Claude produit à la volée quand il génère du code informatique. « Une démonstration ludique montrant ce que Claude Sonnet 4.5 peut faire », selon Anthropic.

La réponse se fera en temps réel, sans fonctionnalité prédéterminée ni code préécrit, affirme la société, qui ajoute : « Ce que vous voyez, c’est Claude qui crée en temps réel, répond et s’adapte à vos demandes au fur et à mesure que vous interagissez ». Cette fonction est en préversion et n’est disponible que pendant cinq jours.

Par Next•

Publié le 30 septembre 2025

Voir sur le site

Voici l'édition du
04 avril ▼

Par Léna Rosada

Dix minutes en prime time, et une heure sur le site de France 2. Arrêt sur images revient sur l'interview, unanimement fustigée, du ministre russe des Affaires étrangères Sergueï Lavrov par Léa Salamé et s'interroge sur quel sens donner à un moment de propagande, dans un contexte de guerre, sur une antenne du service public.

Le leader mondial de la location de barriques et ses millions de dette pourraient bien faire s'écrouler la production de vin. Rue89 Bordeaux raconte les déboires d'une multinationale et la gueule de bois des vignerons.

#International #Médias

Lavrov sur France 2 : "l'une des plus grandes réussites de l'influence russe"

Publié le 03/04/2026 à 15:02

•

2 min

#Pouvoirs

2027 : du centre à l’extrême droite, l’instinct primaire

Publié le 01/04/2026 à 12:41

•

9 min

C’est un mot que la plupart évitent de prononcer. Pourtant, il est dans toutes les têtes des stratèges du bloc central, ce magma macroniste réunissant Renaissance, le MoDem et Horizons, ainsi que Les Républicains (LR). « On n’a pas le choix, c’est la primaire ou la défaite. Ce n’est même pas la défaite, on n’existera même […]

Accès libre

#Libertés #Médias

« Quand la justice est instrumentalisée pour faire taire, le débat public s’effrite »

Publié le 02/04/2026 à 14:41

•

5 min

Alors que les « procédures-bâillons » pour intimider une voix critique se multiplient, un collectif d’associations, de syndicats et de médias, parmi lesquels Mediacités, appelle à transposer d’ici au 7 mai dans le droit français une directive européenne contre ce phénomène.

#Genres #Tech

Clare McGlynn : « l’IA aggrave les violences de genre appuyées sur les technologies »

Publié le 03/04/2026 à 09:20

•

10 min

#Économie

La faillite du groupe H&A menace d’entraîner par le fond toute la filière viticole bordelaise

Publié le 03/04/2026 à 13:00

•

6 min

La chute de H&A, leader mondial de la location de barriques, éclabousse toute la filière viticole. Derrière la liquidation prononcée par le tribunal de commerce de Bordeaux, des millions d’euros d’impayés. L’affaire risque d’être une déflagration supplémentaire dans la crise économique traversée par les viticulteurs bordelais.

Accès libre

#Racisme #Libertés #Médias

Racisme à tous les étages

Publié le 04/04/2026 à 10:52

•

1 min

[Prisme] De nouveaux maires de région parisienne aux livreurs à vélo en passant par une écrivaine, tous racontent le racisme tel qu'ils le subissent dans les colonnes des partenaires de La Presse libre. 

Les
dossiers de
la Presse libre

Municipales 2026

308 articles

Israël-Palestine, enfin la paix ?

45 articles

La France en crise politique

39 articles

Claude Sonnet 4.5 veut reprendre la couronne sur les performances en développement

Des scores une nouvelle fois en augmentation

Le meilleur pour quelques semaines ?

Claude Code a maintenant son kit de développement

À lire aussi

A Villeurbanne, Cédric Van Styvendael entonne sa nouvelle ode à l’union de la gauche, sans éviter les fausses notes

La liste de Johanna Rolland pour 2026 : nouveaux candidats et vieilles recettes

On a posé 20 fois la même question à une IA, on a eu 5 réponses différentes

8 000 manifestants, des cortèges bloqués : revivez la mobilisation du 10 septembre à Lyon

Voici l'édition du
04 avril ▼

Lavrov sur France 2 : "l'une des plus grandes réussites de l'influence russe"

2027 : du centre à l’extrême droite, l’instinct primaire

« Quand la justice est instrumentalisée pour faire taire, le débat public s’effrite »

Clare McGlynn : « l’IA aggrave les violences de genre appuyées sur les technologies »

La faillite du groupe H&A menace d’entraîner par le fond toute la filière viticole bordelaise

Racisme à tous les étages

Les
dossiers de
la Presse libre

Municipales 2026

Israël-Palestine, enfin la paix ?

La France en crise politique

Claude Sonnet 4.5 veut reprendre la couronne sur les performances en développement

Des scores une nouvelle fois en augmentation

Le meilleur pour quelques semaines ?

Claude Code a maintenant son kit de développement

À lire aussi

A Villeurbanne, Cédric Van Styvendael entonne sa nouvelle ode à l’union de la gauche, sans éviter les fausses notes

La liste de Johanna Rolland pour 2026 : nouveaux candidats et vieilles recettes

On a posé 20 fois la même question à une IA, on a eu 5 réponses différentes

8 000 manifestants, des cortèges bloqués : revivez la mobilisation du 10 septembre à Lyon

Voici l'édition du 04 avril ▼

Lavrov sur France 2 : "l'une des plus grandes réussites de l'influence russe"

2027 : du centre à l’extrême droite, l’instinct primaire

« Quand la justice est instrumentalisée pour faire taire, le débat public s’effrite »

Clare McGlynn : « l’IA aggrave les violences de genre appuyées sur les technologies »

La faillite du groupe H&A menace d’entraîner par le fond toute la filière viticole bordelaise

Racisme à tous les étages

Lesdossiers dela Presse libre

Municipales 2026

Israël-Palestine, enfin la paix ?

La France en crise politique

Voici l'édition du
04 avril ▼

« Quand la justice est instrumentalisée pour faire taire, le débat public s’effrite »

Les
dossiers de
la Presse libre