Par · Publié le · #ia #claude #anthropic #sonnet-5 #benchmarks #llm #futur-travail #2026

Claude Sonnet 5 : ce qui change

Claude Sonnet 5 (30 juin 2026) : benchmarks face à Opus 4.8 et Sonnet 4.6, prix, contexte 1M. Et la méthode en 3 IA pour aller de l'idée au projet livré.

Claude Sonnet 5 : ce qui change

30 juin 2026. Anthropic sort Claude Sonnet 5. Sur le papier, un modèle « intermédiaire ». Dans les faits, un modèle qui talonne le très cher Opus 4.8 sur plusieurs benchmarks — pour deux fois et demi moins cher. Ce qui m'intéresse ici n'est pas seulement le tableau de chiffres. C'est que Sonnet 5 referme un triangle : avec Fable 5 et Opus 4.8, Anthropic a désormais trois modèles dont les rôles se distinguent nettement. Voici les chiffres, et la méthode en trois temps que j'en tire.

En clair —

Claude Sonnet 5 sort le 30 juin 2026, devient le modèle par défaut des offres Claude Free et Pro. Il progresse nettement sur le codage et l'agentivité face à Sonnet 4.6, et se rapproche d'Opus 4.8 sur plusieurs benchmarks — pour 2,5 fois moins cher en tarif de lancement. Trois modèles, trois usages : Fable 5 pour explorer sans limite, Opus 4.8 pour construire un plan solide, Sonnet 5 pour exécuter vite et à moindre coût. C'est la méthode que je détaille plus bas — utile à quiconque construit un projet, y compris comme première preuve dans une reconversion.

Les faits du 30 juin 2026

Claude Sonnet 5 (claude-sonnet-5) est disponible depuis le 30 juin 2026 sur claude.ai, l'API Anthropic, Claude Code, Amazon Bedrock et Google Vertex AI. Il devient le modèle par défaut des offres Claude Free et Pro — remplaçant Sonnet 4.6 dans ce rôle.

Trois chiffres à retenir avant les benchmarks :

  • Contexte : 1 million de tokens, sortie maximale 128 000 tokens — identique à Opus 4.8 et Fable 5.
  • Prix de lancement (jusqu'au 31 août 2026) : 2 $ le million de tokens en entrée, 10 $ en sortie. Passé cette date : 3 $ / 15 $. À comparer aux 5 $ / 25 $ d'Opus 4.8 — Sonnet 5 coûte donc jusqu'à 2,5 fois moins cher par token en tarif de lancement, environ 40 % moins cher au tarif standard.
  • Vision haute résolution : jusqu'à 2576 pixels sur le grand côté d'une image (contre 1568 pixels pour Sonnet 4.6) — une première pour un modèle de la gamme Sonnet.

Les benchmarks, sans le vernis marketing

Voici les chiffres publiés par Anthropic dans l'annonce du 30 juin, tels que rapportés à la fois par la documentation officielle et par la presse spécialisée française.

Benchmark Ce qu'il mesure Sonnet 5 Sonnet 4.6 Opus 4.8
SWE-bench Pro Résolution autonome de tâches d'ingénierie réelles 63,2 % 58,1 % 69,2 %
Terminal-Bench 2.1 Codage agentique en environnement terminal 80,4 % 67,0 % 82,7 %
OSWorld-Verified Pilotage d'ordinateur (computer use) 81,2 % 78,5 %
GDPval-AA v2 Travail de la connaissance (score Elo) 1618 1395 1615

Source : annonce officielle Anthropic, « Introducing Claude Sonnet 5 » (30 juin 2026), corroborée par Clubic. Les chiffres Opus 4.8 sont ceux mesurés dans cette même annonce — Anthropic ayant fait évoluer certaines suites de benchmarks (GDPval passe en version « v2 »), ils peuvent différer légèrement de ceux publiés lors du lancement d'Opus 4.8 le 29 mai.

Trois lectures de ce tableau :

1. L'écart avec Sonnet 4.6 est net, pas cosmétique. +5 points sur SWE-bench Pro, +13 points sur Terminal-Bench 2.1. Ce n'est pas un correctif mineur, c'est un vrai saut de génération sur le codage et l'agentivité.

2. L'écart avec Opus 4.8 se resserre — et se referme sur un point. Sur GDPval-AA v2 (le travail de bureau : rapports, analyses, synthèses), Sonnet 5 dépasse Opus 4.8 : 1618 contre 1615. Sur le reste, l'écart tombe à 2-6 points là où il dépassait 10-15 points face à Sonnet 4.5 quelques mois plus tôt.

3. Le rythme ne ralentit pas. Fable 5 le 9 juin, Sonnet 5 le 30 juin. Trois semaines. C'est le même signal que j'évoquais en juin à propos de Fable 5 : ce n'est plus le modèle qui compte, c'est la cadence.

La méthode en trois temps : Fable, Opus, Sonnet

C'est ici que ce lancement devient concrètement utile, au-delà des chiffres. Anthropic aligne désormais trois modèles aux profils nettement distincts. Voici comment je les articule dans mes propres usages, pour un projet réel — qu'il s'agisse d'un outil, d'une automatisation, ou d'une première preuve technique dans une reconversion.

1. Démarrer avec Fable 5 — explorer sans se brider

Fable 5 est le modèle le plus capable de la gamme, pensé pour le raisonnement le plus exigeant et le travail agentique long. À ce stade — celui où le problème est encore flou, où vous ne savez pas encore ce que vous cherchez vraiment à construire — c'est le bon outil : demandez-lui d'explorer plusieurs pistes, de challenger vos hypothèses, de creuser un sujet que vous ne maîtrisez pas encore. C'est le tarif le plus élevé des trois (10 $ / 50 $ le million de tokens), donc un usage ponctuel et ciblé : le temps de clarifier ce que vous voulez faire, pas pour tourner en boucle dessus.

2. Construire le plan avec Opus 4.8 — la rigueur avant l'action

Une fois l'idée posée, Opus 4.8 est le modèle taillé pour la planification : c'est celui qu'Anthropic positionne sur l'exécution agentique longue durée et la mémoire de projet. Concrètement : lui demander de découper le projet en étapes vérifiables, d'anticiper les points de blocage, de documenter les décisions structurantes avant d'écrire la moindre ligne de code ou de contenu. C'est le temps le plus lent des trois — et c'est voulu. Un plan bâclé coûte toujours plus cher à corriger qu'un plan pris au sérieux dès le départ.

3. Déployer avec Sonnet 5 — exécuter vite, sans exploser le budget

Le plan posé, Sonnet 5 prend le relai pour l'exécution : c'est le modèle le plus agentique de la gamme Sonnet, à un coût qui permet d'itérer sans compter chaque appel. C'est là que vous passez du temps réel — écrire le code, corriger les erreurs, tester, recommencer — et c'est précisément le terrain où Sonnet 5 rattrape Opus 4.8 sur les benchmarks tout en coûtant une fraction du prix. Pour un projet qui demande des dizaines d'allers-retours plutôt qu'une poignée de décisions stratégiques, c'est le bon calibre.

Cas — Karim, 38 ans, technicien de maintenance en reconversion IT

Karim voulait une preuve concrète à montrer en entretien : un petit outil qui automatise le tri de ses candidatures. Il ne savait pas par où commencer. Trois sessions, trois rôles : une exploration avec un modèle de pointe pour clarifier ce que l'outil devait vraiment faire (pas plus, pas moins) ; un plan détaillé en cinq étapes avant d'écrire quoi que ce soit ; puis l'exécution, itérée une bonne vingtaine de fois jusqu'à ce que ça marche. Le total : une soirée, un budget de quelques euros. Le résultat : une preuve technique concrète, pas une promesse sur un CV.

Ce que ça change concrètement

Pour qui explore une reconversion vers les métiers techniques — technicien informatique de proximité, développement, automatisation — cette évolution compte à deux niveaux.

D'abord, le coût d'entrée baisse. À 2 $ / 10 $ le million de tokens en tarif de lancement, itérer sur un projet réel devient accessible sans budget professionnel. Ensuite, la littératie numérique de base évolue : savoir choisir le bon outil pour la bonne étape d'un projet — explorer, planifier, exécuter — devient une compétence transversale, utile bien au-delà du développement pur. C'est le même principe que je détaille dans se former à l'IA en 14h : il ne s'agit pas de devenir ingénieur IA, mais de savoir s'en servir avec méthode.

Ce n'est ni un raccourci vers un métier, ni une garantie de résultat. C'est un outil, à sa juste place — comme je le rappelle dans la phase d'exploration avec l'IA : l'outil prépare, il ne décide pas.

Les limites à connaître

Sonnet 5 est plus « agentique » par défaut : la réflexion adaptative est activée automatiquement si vous ne précisez rien, contrairement à Sonnet 4.6. Concrètement, il tend à utiliser des outils et à vérifier son propre travail plus spontanément — ce qui est un vrai progrès de fiabilité, mais suppose de garder un œil sur ce qu'il fait, pas de le laisser tourner sans supervision sur un sujet sensible.

Les chiffres de benchmark sont un signal, pas une garantie. Un modèle qui progresse de 5 points sur un test standardisé ne règle pas automatiquement votre problème précis. La seule façon de savoir si un modèle vous convient reste de le tester sur votre cas.

Le rythme de sortie ne doit pas devenir une pression. Trois modèles en trois semaines, ça peut donner le vertige. Inutile de changer d'outil à chaque annonce : la méthode compte davantage que la version exacte du modèle.

FAQ

Claude Sonnet 5 remplace-t-il Opus 4.8 ?

Non, et ce n'est pas sa vocation. Sur la majorité des benchmarks, Opus 4.8 garde l'avance (SWE-bench Pro : 69,2 % contre 63,2 % ; Terminal-Bench 2.1 : 82,7 % contre 80,4 %). Sonnet 5 se rapproche fortement pour un coût très inférieur, ce qui en fait le bon choix pour l'exécution à volume — pas pour remplacer Opus 4.8 sur les décisions les plus exigeantes.

Faut-il payer pour utiliser Claude Sonnet 5 ?

Non. Sonnet 5 est désormais le modèle par défaut de l'offre Claude gratuite et de l'offre Pro — accessible sans abonnement premium pour un usage standard.

Quelle est la différence concrète avec Sonnet 4.6 ?

Un saut net sur le codage agentique (+5 points SWE-bench Pro, +13 points Terminal-Bench 2.1) et sur le travail de connaissance (GDPval-AA v2 : 1618 contre 1395). La réflexion adaptative est activée par défaut, et la résolution d'image maximale passe de 1568 à 2576 pixels.

Dois-je toujours utiliser les trois modèles pour un projet ?

Non, la méthode en trois temps est un cadre, pas une règle absolue. Pour un projet simple, Sonnet 5 seul suffit souvent. La distinction devient utile à partir du moment où le projet a une vraie phase de réflexion (que vaut-il la peine de construire), une vraie phase de planification (comment le découper), et une vraie phase d'exécution longue (beaucoup d'itérations).

Cette méthode a-t-elle un lien avec la reconversion professionnelle ?

Directement : construire une preuve technique concrète — un outil, une automatisation, un petit projet fonctionnel — est souvent plus convaincant en entretien qu'une ligne de plus sur un CV. La méthode en trois temps est une façon structurée d'y arriver sans expertise préalable en développement.

🧭 Cluster IA et reconversion


Vous voulez construire une première preuve technique pour votre reconversion ? Faites le point en 3 minutes ou écrivez-moi — sans engagement.

Sources : Anthropic, « Introducing Claude Sonnet 5 » (30 juin 2026) ; couverture française Clubic (1er juillet 2026) — consultées le 3 juillet 2026.