09/02/2026
𝐀𝐧𝐭𝐡𝐫𝐨𝐩𝐢𝐜 𝐞𝐭 𝐎𝐩𝐞𝐧𝐀𝐈 𝐨𝐧𝐭 𝐬𝐨𝐫𝐭𝐢 𝐥𝐞𝐮𝐫𝐬 𝐦𝐨𝐝è𝐥𝐞𝐬 𝐝𝐞 𝐜𝐨𝐝𝐞 à 𝟏𝟓 𝐦𝐢𝐧𝐮𝐭𝐞𝐬 𝐝’𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐥𝐞. 𝐕𝐨𝐢𝐥à 𝐩𝐨𝐮𝐫𝐪𝐮𝐨𝐢 ç𝐚 𝐜𝐨𝐦𝐩𝐭𝐞 𝐯𝐫𝐚𝐢𝐦𝐞𝐧𝐭.
La semaine dernière était franchement un peu f***e.
Mercredi, Anthropic devait sortir Opus 4.6 à 10h. OpenAI, de son côté, sortait son nouveau modèle Codex… à 10h aussi. Exactement au même moment. Ce qui, quand on y pense, est déjà assez absurde — genre, ils se sont coordonnés ? Quelqu’un a fuité quelque chose ?
Bref. Anthropic a finalement décidé de… sortir 15 minutes plus tôt. 9h45. OpenAI est resté sur 10h. Résultat : deux annonces “le modèle de code le plus avancé jamais créé” à un quart d’heure d’intervalle.
J’étais en train de rafraîchir Hacker News et X en boucle pour suivre. C’était le chaos. Un chaos fun, mais du chaos quand même.
Cela dit, après avoir passé la semaine à utiliser les deux modèles, j’ai quelques réflexions qui vont au-delà de “wow, les benchmarks sont élevés”.
𝐂𝐞 𝐪𝐮’𝐎𝐩𝐮𝐬 𝟒.𝟔 𝐟𝐚𝐢𝐭 𝐯𝐫𝐚𝐢𝐦𝐞𝐧𝐭 𝐝𝐢𝐟𝐟é𝐫𝐞𝐦𝐦𝐞𝐧𝐭
La fonctionnalité phare, ce sont les “équipes d’agents” : en gros, tu peux lancer plusieurs instances de Claude qui travaillent en parallèle sur différentes parties d’un projet. Un pour le frontend, un pour l’API, un autre pour les migrations de base de données. Ils communiquent entre eux et se coordonnent.
Je l’ai testé sur une base de code de taille moyenne au boulot. Résultat mitigé, honnêtement.
Quand ça marche, c’est vraiment impressionnant. J’avais trois agents sur différentes parties d’un refactor, et ils ont fait en 20 minutes ce qui m’aurait pris quelques heures. Ils ont même détecté un conflit entre deux de leurs modifications et l’ont résolu sans que j’intervienne.
Quand ça ne marche pas, c’est agaçant. Deux fois, des agents se sont marché dessus d’une manière qui m’a obligé à démêler ça à la main. Pas catastrophique, mais clairement pas l’expérience “je lance et j’oublie” qu’Anthropic vend.
En revanche, la fenêtre de contexte d’un million de tokens est bien réelle. J’ai balancé toute notre base de code — environ 50 000 lignes — et je lui ai demandé de trouver une condition de concurrence qui nous rendait fous depuis des semaines. Il l’a trouvée en 12 minutes. Explication claire. Trois solutions proposées. Rien que ça, ça valait le coup.
𝐆𝐏𝐓-𝟓.𝟑 𝐂𝐨𝐝𝐞𝐱 𝐞𝐬𝐭 𝐩𝐥𝐮𝐬 𝐫𝐚𝐩𝐢𝐝𝐞, 𝐦𝐚𝐢𝐬…
Le nouveau modèle d’OpenAI est clairement plus rapide pour les petites tâches. Écrire une fonction utilitaire, corriger un bug, générer du boilerplate — ça répond plus vite, c’est plus nerveux.
Ils ont beaucoup insisté sur le fait que le modèle avait été “instrumental dans sa propre création”, ce qui… ok ? Je ne sais pas trop ce que ça change concrètement. Je n’ai pas vu de différence flagrante dans sa manière de déboguer son propre code par rapport à Opus.
𝐌𝐨𝐧 𝐬𝐞𝐭𝐮𝐩 𝐚𝐜𝐭𝐮𝐞𝐥 :
Opus quand je dois travailler sur plusieurs fichiers ou gérer beaucoup de contexte.
𝐂𝐨𝐝𝐞𝐱 𝐩𝐨𝐮𝐫 𝐥𝐞𝐬 𝐭â𝐜𝐡𝐞𝐬 𝐫𝐚𝐩𝐢𝐝𝐞𝐬.
Les deux pour la r***e de code, parce que pourquoi pas — ils repèrent parfois des choses différentes.
𝐋𝐚 𝐩𝐚𝐫𝐭𝐢𝐞 𝐝𝐨𝐧𝐭 𝐩𝐞𝐫𝐬𝐨𝐧𝐧𝐞 𝐧𝐞 𝐩𝐚𝐫𝐥𝐞 𝐯𝐫𝐚𝐢𝐦𝐞𝐧𝐭
Deux jours avant ces sorties, les actions de sociétés de logiciels ont perdu 285 milliards de dollars en une seule journée. Thomson Reuters, LegalZoom, plusieurs entreprises européennes — toutes en baisse à deux chiffres.
Pourquoi ? Anthropic a sorti un outil d’automatisation juridique et les investisseurs ont paniqué : “ces boîtes vont se faire démonter”.
Pendant ce temps, le produit Claude Code d’Anthropic a atteint 1 milliard de dollars de revenus annuels. Six mois après son lancement.
Donc les entreprises qui fabriquent les outils d’IA gagnent des sommes délirantes. Celles dont les produits risquent d’être remplacés voient leur valorisation s’effondrer. Ce n’est pas de la science-fiction, c’est maintenant.
𝐋𝐞 𝐜𝐨𝐧𝐜𝐞𝐩𝐭 𝐝𝐞 “𝐯𝐢𝐛𝐞 𝐰𝐨𝐫𝐤𝐢𝐧𝐠”
Scott White, chez Anthropic, a dit un truc intéressant dans une interview CNBC. Il a parlé de “vibe working” — en référence au “vibe coding”, où tu décris ce que tu veux et l’IA le construit.
Son idée : Opus 4.6 n’est plus seulement pour les développeurs. Ils voient des chefs de produit, des analystes financiers, plein de profils utiliser Claude Code parce qu’il est juste efficace pour faire des tâches : feuilles Excel, recherche, présentations.
Je ne sais pas trop quoi en penser. D’un côté, c’est cool : plus de gens peuvent faire plus de choses. De l’autre… qu’est-ce qu’il reste aux humains si l’IA gère le tableur, la r***e de code et la présentation trimestrielle ?
Les VCs interrogés par TechCrunch cette semaine étaient assez cash. Un gars de Battery Ventures a dit que 2026 serait l’année où l’IA passerait de “rendre les humains plus productifs” à “automatiser directement le travail”.
C’est… beaucoup à encaisser.
Ce que je fais concrètement avec tout ça
𝐌𝐨𝐧 𝐰𝐨𝐫𝐤𝐟𝐥𝐨𝐰 𝐡𝐨𝐧𝐧ê𝐭𝐞 𝐚𝐮𝐣𝐨𝐮𝐫𝐝’𝐡𝐮𝐢 :
Grosses tâches (refactor, compréhension d’une nouvelle base de code, bugs complexes) : Opus 4.6.
Petites tâches rapides : Codex.
R***e de code : les deux, sans hésiter.
Équipes d’agents : encore en test. Prometteur, mais pas encore assez fiable pour tourner sans supervision sur quelque chose de critique.
𝐀𝐥𝐨𝐫𝐬, ç𝐚 𝐯𝐞𝐮𝐭 𝐝𝐢𝐫𝐞 𝐪𝐮𝐨𝐢 ?
Je ne pense pas que l’un ou l’autre ait “gagné” cette semaine. Le drama des 15 minutes sera oublié dans un mois.
Ce qui ne sera pas oublié, c’est qu’on est clairement entrés dans une nouvelle phase. Ce ne sont plus des chatbots qui aident à écrire du code. Ce sont des systèmes capables de faire du vrai travail sur de grosses bases de code, de se coordonner entre eux et de fonctionner longtemps sans qu’on les tienne par la main.
Si tu codes pour vivre, la question n’est plus “est-ce que je dois utiliser ça ?”. C’est : quelles parties de ton job restent vraiment les tiennes ? Ceux que je vois bien s’en sortir sont ceux qui savent où leur jugement compte encore — décisions d’architecture, compréhension des vrais besoins utilisateurs, dynamique d’équipe. Des choses que l’IA ne voit pas.
Si tu construis un produit, il faut sérieusement se demander si ton business peut survivre quand des agents de code compétents coûtent quasiment rien. Beaucoup de SaaS, au fond, c’est “on a automatisé ce workflow pour vous”. Sauf que maintenant, l’utilisateur peut juste demander à Claude de faire le workflow directement.
Voilà ma lecture de la semaine. Je continue de tester, comme tout le monde, et d’essayer de comprendre où ça nous mène.
Si tu joues avec l’un de ces modèles, je suis curieux de savoir ce que toi tu observes.
Source : https://x.com/ParasMadan9/status/2020823217464828218