Aller au contenu
Claude Sonnet 5 dépasse Opus sur un benchmark, et son prix cache un piège

Claude Sonnet 5 dépasse Opus sur un benchmark, et son prix cache un piège

Anthropic sort Claude Sonnet 5 le 30 juin 2026. Meilleur qu'Opus sur certains benchmarks, moins cher sur le papier, mais un nouveau tokenizer fait grimper la facture réelle jusqu'à 40%.

Le 30 juin 2026, un modèle Sonnet dépasse un modèle Opus pour la première fois. Sur le benchmark de travail de connaissance utilisé par Anthropic, Claude Sonnet 5 obtient 1618 points Elo. Opus 4.8, le modèle le plus cher de la gamme, reste à 1615.

Trois points d'écart seulement. Mais dans l'histoire de ces modèles, un Sonnet n'avait jamais dépassé un Opus sur quoi que ce soit. Voilà pourquoi cette sortie mérite votre attention, même si vous n'utilisez pas Claude tous les jours.

1618 points Elo pour Sonnet 5, contre 1615 pour Opus 4.8. La première fois qu'un Sonnet dépasse un Opus.


Qu'est-ce que Claude Sonnet 5 exactement ?

Anthropic organise sa gamme Claude en trois niveaux. Haiku file vite mais reste limité. Opus incarne la puissance brute, au prix fort. Entre les deux, Sonnet a toujours été le compromis : moins cher qu'Opus, plus capable que Haiku.

Sonnet 5 bouscule cette hiérarchie. Le communiqué officiel d'Anthropic le décrit comme "le modèle Sonnet le plus agentique jamais conçu" : il planifie ses actions et utilise des outils comme un navigateur ou un terminal, sans supervision constante à chaque étape.


Les chiffres qui comptent

Sur SWE-bench Verified, un test qui mesure la résolution de vrais bugs dans de vrais projets, Sonnet 5 atteint 85,2%. Sonnet 4.6, son prédécesseur, plafonnait à 79,6%. Cinq points et demi de progression en une seule génération.

Sur les tâches agentiques (planifier une action, choisir un outil, corriger une erreur seul), le gain grimpe à treize points face à Sonnet 4.6. C'est la plus grosse marge de progression du modèle, et Anthropic la présente comme l'argument central de cette sortie.


BenchmarkSonnet 5Sonnet 4.6Opus 4.8GPT-5.5
SWE-bench Pro63,2%58,1%69,2%58,6%
SWE-bench Verified85,2%79,6%N/A88,7%
Connaissance (Elo)161813951615N/A
Usage ordinateur (OSWorld)78,5%N/AN/AN/A


Publicité

Face à la concurrence, Sonnet 5 devance GPT-5.5 (58,6%) et Gemini 3.5 Flash (55,1%) sur SWE-bench Pro. GPT-5.5 reprend l'avantage sur SWE-bench Verified (88,7% contre 85,2%) et sur Terminal-Bench 2.1. Aucun modèle ne domine sur tous les tableaux.

Sur le code pur, Opus 4.8 garde l'avantage avec 69,2% contre 63,2% pour Sonnet 5. Le nouveau modèle rattrape son grand frère sans le remplacer partout.


Le prix qui cache un piège

Anthropic annonce un tarif de lancement à 2 dollars par million de tokens en entrée et 10 dollars en sortie, jusqu'au 31 août 2026. Après cette date, le prix standard passe à 3 dollars et 15 dollars. Sur le papier, c'est stable ou moins cher qu'Opus.

Sur le papier. Sonnet 5 utilise un nouveau système de découpage du texte, appelé tokenizer, qui produit environ 30% de tokens en plus que Sonnet 4.6 pour un texte identique. En anglais, la facture réelle grimpe jusqu'à 1,4 fois le prix affiché. En espagnol, 1,33 fois. En mandarin simplifié, la différence disparaît presque.

Le développeur Simon Willison a documenté ce décalage dès la sortie du modèle. Sa conclusion : le prix nominal reste stable, mais le coût effectif grimpe de 20 à 35% selon la langue utilisée. Une hausse de prix qui ne dit pas son nom.

« Une hausse de prix qui ne dit pas son nom. »

Ça pique.


Disponible partout, sans liste d'attente

Sonnet 5 arrive sur Claude.ai (Free, Pro, Max, Team, Entreprise), sur l'API Claude, sur Claude Code, et chez Amazon Bedrock, Google Cloud et Microsoft Foundry. Aucun accès progressif, aucune file d'attente.

Le contraste est net avec Fable 5 et Mythos 1, deux autres modèles Anthropic suspendus le 12 juin 2026 suite à une directive du gouvernement américain sur le contrôle des exportations. Sonnet 5 sort dans ce climat tendu, avec un argument de sécurité mis en avant : 0% de réussite dans les tests visant à lui faire développer un exploit informatique fonctionnel.


Faut-il passer à Sonnet 5 ?

Si vous utilisez Claude pour du code ou des agents autonomes, la réponse est oui. Les gains sur SWE-bench et sur les tâches agentiques sont concrets et mesurables, disponibles dès aujourd'hui sur toutes les plateformes.

Attention si vous traitez de gros volumes de texte en anglais ou en espagnol : vérifiez votre facture avant de basculer en production. Le nouveau tokenizer peut faire grimper vos coûts réels malgré un tarif affiché stable.

Les retours de la communauté restent partagés. Un sondage informel cité par plusieurs analystes donne 38% d'avis positifs, 38% de neutres, 25% de négatifs. Les critiques les plus dures viennent d'utilisateurs habitués aux versions précédentes, qui jugent le changement moins spectaculaire que les benchmarks ne le suggèrent.


Questions fréquentes sur Claude Sonnet 5

Quand Claude Sonnet 5 est-il sorti ?
Le 30 juin 2026, annoncé par Anthropic sur son blog officiel.

Combien coûte Claude Sonnet 5 ?
2 dollars par million de tokens en entrée et 10 dollars en sortie jusqu'au 31 août 2026, puis 3 et 15 dollars ensuite. Le coût réel peut dépasser ce tarif à cause du nouveau tokenizer.

Sonnet 5 est-il meilleur qu'Opus 4.8 ?
Sur certains benchmarks agentiques et de connaissance générale, oui. Sur le code pur (SWE-bench Pro), Opus 4.8 reste devant avec 69,2% contre 63,2%.

Où utiliser Claude Sonnet 5 ?
Sur Claude.ai, l'API Claude, Claude Code, Amazon Bedrock, Google Cloud et Microsoft Foundry, sans liste d'attente.


Mis à jour le 2 juillet 2026.

Publicité

Une newsletter par semaine, gratuite.

Actus IA, tutoriels et outils. Zero spam, desabonnement en 1 clic.

Claude Sonnet 5 Anthropic benchmark IA tokenizer prix API Claude SWE-bench Claude Code Opus 4.8
LC

Le Code IA

Actualites, tutoriels et formations sur l'intelligence artificielle. Contenu redige et verifie par notre equipe editoriale.

Notez cet article

5,0/5 (1 vote)

Commentaires 0

Aucun commentaire pour l'instant.

Tu peux être le premier.

Connectez-vous pour laisser un commentaire

Compte gratuit, 30 secondes.