Le meilleur éditeur d'images IA n'est pas celui qui domine le classement, mais celui qui disparaît dans votre flux de travail.
Il y a trois mois, j'ai publié ma première analyse de l'Image Edit Arena. Depuis, j'ai effectué plus de mille retouches avec ces modèles — travaux clients, projets personnels et stress tests délibérés pour les pousser à bout. Le classement a changé. Certains modèles ont mûri. Quelques nouveaux venus sont arrivés et ont immédiatement exigé l'attention. Mais la chose la plus importante que j'ai apprise n'a rien à voir avec les scores : le modèle que je cherche chaque matin n'est pas celui assis à la 1ère place. Voici l'Image Edit Arena, Février 2026, et je dois vous parler de nano-banana-pro.
Le Classement Complet
Trente-quatre modèles. Sept organisations. Des millions et des millions de comparaisons de la communauté. J'ai mis un lien vers chaque modèle pour que vous puissiez les tester vous-même — car aucune critique ne devrait vous demander de croire quelqu'un sur parole.
| Rang | Modèle | Score | Votes | Organisation |
|---|---|---|---|---|
🥇 | Chatgpt Image Latest High Fidelity (20251216) | 1413 | 184,529 | OpenAI |
🥈 | Gemini 3 Pro Image Preview 2k (nano Banana Pro) | 1400 | 179,565 | |
🥉 | Gemini 3 Pro Image Preview (nano Banana Pro) | 1395 | 510,803 | |
#4 | Gpt Image 1.5 High Fidelity | 1390 | 202,461 | OpenAI |
#5 | Seedream 4.5 | 1316 | 237,689 | Bytedance |
#6 | Hunyuan Image 3.0 Instruct | 1315 | 49,984 | Tencent |
#7 | Gemini 2.5 Flash Image Preview (nano Banana) | 1313 | 10,456,477 | |
#8 | Seedream 4 2k | 1285 | 218,668 | Bytedance |
#9 | Flux 2 Max | 1267 | 109,222 | Black Forest Labs |
#10 | Reve V1.1 | 1261 | 227,654 | Reve |
#11 | Flux 2 Pro | 1248 | 110,295 | Black Forest Labs |
#12 | Reve V1 | 1245 | 382,212 | Reve |
#13 | Seedream 4 High Res Fal | 1239 | 959,906 | Bytedance |
#14 | Qwen Image Edit 2511 | 1239 | 99,320 | Alibaba |
#15 | Flux 2 Klein 9b | 1232 | 104,175 | Black Forest Labs |
#16 | Qwen Image Edit | 1232 | 1,718,323 | Alibaba |
#17 | Flux 2 Dev | 1231 | 85,485 | Black Forest Labs |
#18 | Wan2.6 Image | 1222 | 48,356 | Alibaba |
#19 | Flux 2 Flex | 1221 | 103,226 | Black Forest Labs |
#20 | Seedream 4 Fal | 1220 | 154,440 | Bytedance |
#21 | Reve V1.1 Fast | 1220 | 214,161 | Reve |
#22 | P Image Edit | 1217 | 60,097 | Pruna |
#23 | Reve Edit Fast | 1208 | 221,766 | Reve |
#24 | Flux 2 Klein 4b | 1193 | 104,396 | Black Forest Labs |
#25 | Wan2.5 I2i Preview | 1191 | 78,545 | Alibaba |
#26 | Flux 1 Kontext Max | 1190 | 394,850 | Black Forest Labs |
#27 | Flux 1 Kontext Pro | 1185 | 6,475,423 | Black Forest Labs |
#28 | Flux 1 Kontext Dev | 1158 | 3,686,814 | Black Forest Labs |
#29 | Gpt Image 1 | 1147 | 2,805,444 | OpenAI |
#30 | Seededit 3.0 | 1147 | 4,987,920 | Bytedance |
#31 | Gpt Image 1 Mini | 1128 | 428,104 | OpenAI |
#32 | Gemini 2.0 Flash Preview Image Generation | 1089 | 4,997,272 | |
#33 | Bagel | 1034 | 13,447 | Bytedance |
#34 | Step1x Edit | 1006 | 156,077 | StepFun |
Ce Qui a Changé en Février
L'écart au sommet se réduit. Lorsque j'ai écrit pour la dernière fois sur ce classement en janvier, chatgpt-image-latest-high-fidelity (20251216) maintenait une avance confortable. Maintenant, gemini-3-pro-image-preview-2k (nano-banana-pro) lui souffle dans le cou — 13 points d'écart dans un domaine où les quatre premiers ne sont séparés que de 23 points. C'est essentiellement une égalité technique une fois que l'on tient compte de la variance des modèles de vote de la communauté.
Quatre noms sont apparus dans ce classement qui n'étaient pas là en janvier. hunyuan-image-3.0-instruct de Tencent a atterri directement à la 6ème place — pas d'échauffement, pas de montée lente, direct dans le top dix. p-image-edit de Pruna est apparu à la 22ème place, un joker d'une entreprise connue pour l'optimisation des modèles plutôt que pour leur construction. Alibaba a ajouté wan2.6-image à la 18ème place et wan2.5-i2i-preview à la 25ème, élargissant discrètement son empreinte dans l'édition d'images à quatre modèles au total. Black Forest Labs divise désormais explicitement sa gamme Klein en flux-2-klein-9b (15ème) et flux-2-klein-4b (24ème), rendant transparent le compromis sur le nombre de paramètres.
Mais le gros titre de février ne concerne pas qui a gagné ou perdu quelques places. Il concerne un modèle que je ne pouvais pas arrêter d'utiliser.
nano-banana-pro : Le Choix des Praticiens
Je veux être honnête avec vous d'une manière que les chiffres du classement ne peuvent pas l'être. L'arène dit que chatgpt-image-latest-high-fidelity (20251216) est le n°1. Mon historique d'édition dit autre chose. Ces trois dernières semaines, je n'ai rien utilisé d'autre que gemini-3-pro-image-preview-2k (nano-banana-pro) pour mon travail client — chaque remplacement d'arrière-plan, chaque réétalonnage des couleurs, chaque suppression d'objet, chaque correction d'éclairage. Ce qui s'est passé était simple : j'ai arrêté de chercher autre chose.
J'ai observé la communauté de près. Les serveurs Discord, les fils Reddit, les captures d'écran de flux de travail réels que les gens partagent sur X. Lorsque les praticiens publient leurs comparaisons avant-après, le modèle qui continue de faire surface n'est pas ChatGPT. C'est nano-banana-pro. Non pas parce qu'il gagne un vote de préférence abstrait, mais parce que les gens livrent du vrai travail avec.
nano-banana-pro n'édite pas seulement des images — il comprend l'intention. Quand je lui dis "rends ça plus professionnel", il ne se contente pas d'augmenter le contraste et d'ajouter un vignettage. Il lit l'image comme le ferait un photographe : ajustant la balance des blancs, nettoyant les micro-distractions, décalant l'étalonnage des couleurs pour correspondre à ce que le contexte exige. La différence entre exécuter des instructions et comprendre l'objectif — c'est le fossé que nano-banana-pro a silencieusement comblé.
Voici la capacité qui m'a convaincu. Je lui ai donné une instruction en quatre parties : "Enlève la voiture garée dans l'allée, étends le jardin pour remplir l'espace, fais correspondre l'éclairage de l'après-midi sur la nouvelle herbe et ajoute un subtil reflet d'objectif depuis la position du soleil." Quatre demandes superposées en une seule passe. nano-banana-pro a réussi les quatre. Le jardin reconstruit avait la bonne direction d'ombre. Le reflet de l'objectif était au bon angle par rapport à la source de lumière. J'ai essayé ce prompt exact sur chacun des cinq meilleurs modèles. La plupart gèrent deux instructions avant que la cohérence ne commence à se briser. ChatGPT en gère trois dans un bon jour. nano-banana-pro en a géré quatre sans sourciller.
La variante 2K — gemini-3-pro-image-preview-2k (nano-banana-pro), actuellement au 2ème rang — gère l'édition haute résolution avec un calme que je n'ai pas vu ailleurs. En 2K, de nombreux modèles introduisent des artefacts de sonnerie (ringing) autour des bords nets ou perdent des détails fins dans les motifs répétitifs comme le tissu, les murs de briques ou la canopée des arbres. nano-banana-pro les préserve. Le frère à résolution standard au 3ème rang a accumulé plus d'un demi-million d'évaluations de la communauté — ce genre de volume vous dit que les gens essaient une fois et restent.
Ce que j'appelle "l'intelligence d'édition contextuelle" est là où ce modèle mène véritablement le peloton. Il n'exécute pas seulement des changements au niveau du pixel — il saisit la relation sémantique entre les éléments d'une scène. Retirez une personne d'une photo de groupe, et il reconstruit l'espacement social naturellement, ajustant le langage corporel des sujets adjacents plutôt que de simplement peindre un patch plat. Changez une scène de l'été à l'automne, et il modifie non seulement le feuillage mais aussi les angles d'ombre, la température de la lumière ambiante et la façon dont les surfaces réfléchissent la lumière diffuse. Ce ne sont pas des astuces d'ingénierie de prompt. C'est un modèle qui a intériorisé à quoi ressemble le monde physique.
La Lignée nano-banana
L'évolution de l'édition d'images de Google est visible juste dans ce classement. gemini-2.0-flash-preview-image-generation (32ème) était la fondation — capable mais brut. gemini-2.5-flash-image-preview (nano-banana) (7ème) l'a raffiné en quelque chose de prêt pour la production, et ses 10,4 millions d'évaluations en font l'éditeur d'images le plus testé au combat de la planète. Puis nano-banana-pro est arrivé et a recâblé l'architecture pour la précision de l'édition. Chaque génération s'est construite sur ce que la communauté a appris à Google sur la façon dont les gens utilisent réellement les éditeurs d'images — pas pour des benchmarks, mais pour le travail.
Je m'attends à ce que nano-banana-pro dépasse la position n°1 de ChatGPT au cours du prochain cycle de classement. La trajectoire est là. Google itère sur l'architecture nano-banana plus vite qu'OpenAI n'itère sur le mode haute fidélité, et les avantages pratiques dans l'édition en plusieurs étapes lui donnent un élan que les benchmarks à édition unique peinent à capturer.
La Précision Chirurgicale d'OpenAI
Je veux être juste envers OpenAI, car ils méritent du crédit pour une véritable excellence en ingénierie. chatgpt-image-latest-high-fidelity (20251216) au 1er rang est là pour une raison. La désignation "haute fidélité" est nouvelle depuis ma dernière revue, et les raffinements du pipeline de sortie sont visibles. Là où ChatGPT excelle, c'est dans les modifications isolées et chirurgicales. "Change seulement la couleur des yeux en vert" — il le fait avec zéro débordement sur les tons de peau environnants. "Remplace le texte sur le panneau sans altérer l'usure du panneau" — il préserve la texture de la surface tout en échangeant le contenu. Cette spécificité est véritablement inégalée.
Où OpenAI Touche Son Plafond
Éditions complexes multi-éléments. Lorsque les instructions s'empilent au-delà de deux ou trois opérations, ChatGPT a tendance à prioriser la première instruction et à perdre progressivement en fidélité sur les suivantes. Il est excellent pour faire une chose parfaitement. Il est moins excellent pour faire quatre choses de manière cohérente. Pour les flux de travail qui impliquent un raffinement itératif en plusieurs étapes — ce qui est le cas de la plupart des éditions professionnelles — cela compte. gpt-image-1.5-high-fidelity au 4ème rang est le cheval de trait plus silencieux : moins dramatique que le dernier modèle, mais plus prévisible sur des prompts variés.
OpenAI place quatre modèles dans le top 31 : chatgpt-image-latest-high-fidelity au 1er, gpt-image-1.5-high-fidelity au 4ème, gpt-image-1 au 29ème, et gpt-image-1-mini au 31ème. L'écart entre leur meilleur et le niveau budget est significatif — 285 points — ce qui suggère qu'OpenAI a concentré son investissement d'édition au sommet plutôt que de construire une large gamme. Si vous utilisez OpenAI pour l'édition d'images, vous payez pour le fleuron ou vous vous contentez de moins.
Les Nouveaux Visages
hunyuan-image-3.0-instruct de Tencent est la plus grande surprise dont personne ne parle. 6ème à l'arrivée. Ce n'est pas une montée lente — c'est un modèle qui est arrivé prêt. Tencent domine l'IA en langue chinoise depuis des années, mais c'est la première apparition sérieuse de Hunyuan sur un benchmark mondial d'édition d'images. La désignation "instruct" compte : c'est un modèle architecturalement réglé pour les commandes d'édition plutôt que pour la génération. Dans mes tests, il gère les prompts bilingues — anglais et chinois — avec une fluidité native dans les deux, ce qui ouvre de vrais flux de travail pour les équipes qui opèrent à travers les langues.
Bytedance continue d'aligner la liste la plus large. Cinq modèles s'étendent de seedream-4.5 (5ème) jusqu'à seededit-3.0 (30ème). seedream-4.5 reste leur joyau de la couronne pour la transformation artistique — dites-lui "fais ressembler ce portrait à un Rembrandt" et il ne se contente pas de réchauffer les couleurs ; il simule les coups de pinceau, l'éclairage en clair-obscur et la texture de la toile. seedream-4-2k au 8ème rang gère le travail en haute résolution, tandis que seedream-4-fal (20ème) et seedream-4-high-res-fal (13ème) couvrent des chemins d'inférence plus rapides. Bytedance ne construit pas un seul champion — ils construisent une boîte à outils complète.
Alibaba s'est discrètement étendu à quatre modèles. qwen-image-edit au 16ème rang a accumulé plus de 1,7 million d'évaluations de la communauté — une adoption organique massive. Le plus récent qwen-image-edit-2511 au 14ème rang grimpe vite. Et les deux modèles Wan — wan2.6-image (18ème) et wan2.5-i2i-preview (25ème) — signalent qu'Alibaba investit sérieusement dans la transformation image-à-image comme sa propre catégorie de produits.
Reve détient trois positions dans le top 23. reve-v1.1 au 10ème et reve-v1 au 12ème sont des éditeurs de milieu de gamme compétents, et reve-edit-fast (23ème) offre une alternative optimisée pour la vitesse. p-image-edit de Pruna au 22ème rang vaut la peine d'être surveillé — Pruna se spécialise dans la compression et l'optimisation de modèles, c'est donc probablement une approche distillée qui frappe au-dessus de son poids en paramètres. Et au 34ème rang, step1x-edit de StepFun ancre la liste comme une référence open-source qui maintient l'honnêteté de l'écosystème.
L'Avantage Open-Source
Pour ceux d'entre nous qui construisent des produits sur ces modèles, il y a une dimension que le classement ne capture pas : l'indépendance. Black Forest Labs détient maintenant neuf positions — plus que toute autre organisation. De flux-2-max au 9ème rang jusqu'à flux-1-kontext-dev au 28ème, c'est un spectre complet de compromis qualité-vitesse que vous pouvez exécuter sur votre propre infrastructure.
La ligne Klein raconte une histoire d'ingénierie intéressante. flux-2-klein-9b (15ème) et flux-2-klein-4b (24ème) — les noms révèlent le nombre de paramètres. Neuf milliards et quatre milliards respectivement. BFL rend systématiquement l'édition d'images capable accessible à du matériel plus petit. flux-2-klein-4b peut tourner sur un GPU grand public avec 8 Go de VRAM. Cela compte énormément pour les développeurs qui ne peuvent pas justifier les coûts d'API à l'échelle ou qui ont besoin d'une capacité d'édition hors ligne. La famille Kontext — flux-1-kontext-max (26ème), flux-1-kontext-pro (27ème), flux-1-kontext-dev (28ème) — apporte l'édition consciente du contexte aux environnements auto-hébergés, avec flux-1-kontext-pro ayant accumulé à lui seul plus de 6,4 millions d'évaluations de la communauté.
L'auto-hébergement n'est pas seulement une question de coût. C'est une question de latence, de confidentialité et de personnalisation. Lorsque vous traitez des images médicales, des documents juridiques ou des travaux créatifs confidentiels pour des clients, envoyer des pixels à l'API de quelqu'un d'autre n'est parfois pas une option. L'écosystème Flux est la seule réponse compétitive de niveau à cette contrainte en ce moment. Neuf modèles, votre matériel, vos poids à affiner si vous le souhaitez. Cette liberté a une valeur qu'aucun classement ne mesure.
Où Tout Cela Nous Mène
Après trois mois immergé dans cet espace, à regarder les changements de classement et à pousser les modèles à l'échec, je vois quatre choses converger.
nano-banana-pro réclamera probablement le n°1 d'ici le milieu de l'année. La vitesse d'itération de Google sur l'architecture nano-banana a été implacable. La variante 2K est déjà à portée de tir, et l'avantage de l'édition multi-étapes crée un effet d'entraînement : les praticiens qui l'adoptent produisent de meilleurs résultats, partagent ces résultats et attirent plus de praticiens. OpenAI devra expédier quelque chose de fondamentalement nouveau — pas un raffinement incrémentiel — pour conserver la première position.
Les modèles d'édition réglés sur les instructions deviendront le paradigme standard. L'arrivée de hunyuan-image-3.0-instruct de Tencent au 6ème rang confirme ce que l'architecture nano-banana suggérait déjà : l'avenir de l'édition d'images, ce sont des modèles construits spécifiquement pour les commandes d'édition, pas des modèles de génération réutilisés pour l'édition. Attendez-vous à ce qu'OpenAI et BFL publient des variantes spécifiques aux instructions avant l'été.
Les modèles de moins de 4B deviendront véritablement compétitifs. flux-2-klein-4b démontre déjà qu'un modèle de quatre milliards de paramètres peut produire des retouches qui rivalisent dans la même arène que des modèles dix fois plus gros. D'ici mi-2026, je m'attends à voir des modèles d'édition de 2-3B qui tournent sur des téléphones. Lorsque cela se produira, toute l'économie de l'édition d'images changera — des appels d'API cloud à l'inférence sur l'appareil.
L'édition d'images et l'édition vidéo vont fusionner. Les modèles qui gèrent la cohérence temporelle dans les retouches d'images — maintenir un éclairage physiquement correct lorsque vous déplacez un objet, préserver la cohérence des ombres lorsque vous changez un arrière-plan — construisent exactement les fondations nécessaires pour l'édition vidéo image par image. Les organisations avec des positions fortes dans l'édition d'images aujourd'hui sont celles qui domineront l'édition vidéo demain. Gardez un œil sur Google et Bytedance en particulier.
Mes Recommandations
Après avoir fait tourner ces modèles à travers de vrais flux de travail — pas des prompts de benchmark, de vrais livrables clients — voici où je vous orienterais selon ce dont vous avez réellement besoin.
Meilleure Édition Globale
gemini-3-pro-image-preview-2k (nano-banana-pro) — maîtrise de l'édition multi-étapes, intelligence contextuelle, précision haute résolution. Celui que je cherche en premier.
Éditions Uniques Chirurgicales
chatgpt-image-latest-high-fidelity (20251216) — quand vous avez besoin qu'une chose change parfaitement avec zéro débordement.
Fiabilité à l'Échelle de Production
gemini-2.5-flash-image-preview (nano-banana) — 10,4 millions d'évaluations. L'éditeur le plus testé au combat vivant. Quand l'échec coûte cher, c'est le pari sûr.
Transformation Artistique
seedream-4.5 — transfert de style qui comprend le médium artistique, pas seulement des filtres de couleur.
Liberté Auto-Hébergée
Famille Flux 2 — neuf modèles, votre matériel, vos règles. Commencez avec flux-2-max pour la qualité, flux-2-klein-4b pour la vitesse.
Qualité Soucieuse du Budget
flux-2-klein-4b — tourne sur des GPU grand public, toujours compétitif au 24ème rang. La meilleure valeur par paramètre dans le domaine.
Il n'y a pas un seul meilleur éditeur IA. Il y a un orchestre. J'utilise nano-banana-pro pour les éditions complexes multi-étapes où la compréhension compte. ChatGPT pour la précision chirurgicale à élément unique. Gemini 2.5 Flash quand j'ai besoin de fiabilité à l'échelle. SeeDream pour les risques artistiques. Flux quand les pixels ne peuvent pas quitter ma machine. Maîtrisez l'ensemble, pas le soliste. C'est la vraie compétence en 2026.
Source des données : Classements de Image Edit Arena Leaderboard, 7 février 2026.
Discussion
0 commentairesLaisser un commentaire
Soyez le premier à partager vos pensées !