Labākais AI attēlu redaktors nav tas, kurš ir uzvarētāju saraksta augšgalā — tas ir tas, kurš izzūd jūsu darba plūsmā.
Pirms trim mēnešiem es publicēju savu pirmo Image Edit Arena analīzi. Kopš tā laika esmu veicis vairāk nekā tūkstoti rediģēšanas darbību ar šiem modeļiem — klientu darbs, personīgie projekti, apzināti stresa testi, kas paredzēti to salaušanai. Reitingi mainījās. Daži modeļi nobrieda. Ieradās daži jaunpienācēji un nekavējoties pieprasīja uzmanību. Bet vissvarīgākā lieta, ko es iemācījos, nav saistīta ar rezultātiem: modelis, pēc kura es sniedzos katru rītu, nav tas, kurš sēž 1. vietā. Šī ir Image Edit Arena, 2026. gada februāris, un man jums jāpastāsta par nano-banana-pro.
Pilni reitingi
Trīsdesmit četri modeļi. Septiņas organizācijas. Miljoniem un miljoniem kopienas salīdzinājumu. Esmu sasaistījis katru modeli, lai jūs varētu tos pārbaudīt paši — jo nevienā apskatā nevajadzētu lūgt, lai jūs akli ticētu kāda vārdiem.
| Rangs | Modelis | Rezultāts | Balsis | Organizācija |
|---|---|---|---|---|
🥇 | Chatgpt Image Latest High Fidelity (20251216) | 1413 | 184,529 | OpenAI |
🥈 | Gemini 3 Pro Image Preview 2k (nano Banana Pro) | 1400 | 179,565 | |
🥉 | Gemini 3 Pro Image Preview (nano Banana Pro) | 1395 | 510,803 | |
#4 | Gpt Image 1.5 High Fidelity | 1390 | 202,461 | OpenAI |
#5 | Seedream 4.5 | 1316 | 237,689 | Bytedance |
#6 | Hunyuan Image 3.0 Instruct | 1315 | 49,984 | Tencent |
#7 | Gemini 2.5 Flash Image Preview (nano Banana) | 1313 | 10,456,477 | |
#8 | Seedream 4 2k | 1285 | 218,668 | Bytedance |
#9 | Flux 2 Max | 1267 | 109,222 | Black Forest Labs |
#10 | Reve V1.1 | 1261 | 227,654 | Reve |
#11 | Flux 2 Pro | 1248 | 110,295 | Black Forest Labs |
#12 | Reve V1 | 1245 | 382,212 | Reve |
#13 | Seedream 4 High Res Fal | 1239 | 959,906 | Bytedance |
#14 | Qwen Image Edit 2511 | 1239 | 99,320 | Alibaba |
#15 | Flux 2 Klein 9b | 1232 | 104,175 | Black Forest Labs |
#16 | Qwen Image Edit | 1232 | 1,718,323 | Alibaba |
#17 | Flux 2 Dev | 1231 | 85,485 | Black Forest Labs |
#18 | Wan2.6 Image | 1222 | 48,356 | Alibaba |
#19 | Flux 2 Flex | 1221 | 103,226 | Black Forest Labs |
#20 | Seedream 4 Fal | 1220 | 154,440 | Bytedance |
#21 | Reve V1.1 Fast | 1220 | 214,161 | Reve |
#22 | P Image Edit | 1217 | 60,097 | Pruna |
#23 | Reve Edit Fast | 1208 | 221,766 | Reve |
#24 | Flux 2 Klein 4b | 1193 | 104,396 | Black Forest Labs |
#25 | Wan2.5 I2i Preview | 1191 | 78,545 | Alibaba |
#26 | Flux 1 Kontext Max | 1190 | 394,850 | Black Forest Labs |
#27 | Flux 1 Kontext Pro | 1185 | 6,475,423 | Black Forest Labs |
#28 | Flux 1 Kontext Dev | 1158 | 3,686,814 | Black Forest Labs |
#29 | Gpt Image 1 | 1147 | 2,805,444 | OpenAI |
#30 | Seededit 3.0 | 1147 | 4,987,920 | Bytedance |
#31 | Gpt Image 1 Mini | 1128 | 428,104 | OpenAI |
#32 | Gemini 2.0 Flash Preview Image Generation | 1089 | 4,997,272 | |
#33 | Bagel | 1034 | 13,447 | Bytedance |
#34 | Step1x Edit | 1006 | 156,077 | StepFun |
Ko mainīja februāris
Plaisa augšgalā samazinās. Kad es pēdējo reizi rakstīju par šo uzvarētāju sarakstu janvārī, chatgpt-image-latest-high-fidelity (20251216) ieņēma ērtu vadību. Tagad gemini-3-pro-image-preview-2k (nano-banana-pro) elpo tam pakausī — 13 punktu starpība laukā, kur pirmos četrus šķir tikai 23 punkti. Tas būtībā ir neizšķirts, tiklīdz ņemat vērā kopienas balsošanas modeļu variācijas.
Šajā uzvarētāju sarakstā parādījās četri vārdi, kas šeit nebija janvārī. hunyuan-image-3.0-instruct no Tencent nolaidās tieši 6. vietā — bez iesildīšanās, bez lēna kāpuma, vienkārši taisnā ceļā pirmajā desmitniekā. p-image-edit no Pruna parādījās 22. vietā, "wildcard" no uzņēmuma, kas pazīstams ar modeļu optimizāciju, nevis modeļu veidošanu. Alibaba pievienoja wan2.6-image 18. vietā un wan2.5-i2i-preview 25. vietā, klusi paplašinot savu attēlu rediģēšanas nospiedumu līdz četriem modeļiem kopā. Black Forest Labs tagad skaidri sadala savu Klein līniju flux-2-klein-9b (#15) un flux-2-klein-4b (#24), padarot parametru skaita kompromisu caurspīdīgu.
Bet februāra virsraksts nav par to, kurš ieguva vai zaudēja dažas pozīcijas. Tas ir par modeli, kuru es nevarēju pārstāt lietot.
nano-banana-pro: Tas, ko izvēlas praktizētāji
Es vēlos būt ar jums atklāts tādā veidā, kādā uzvarētāju saraksta skaitļi nevar būt. Arēna saka, ka chatgpt-image-latest-high-fidelity (20251216) ir #1. Mana rediģēšanas vēsture saka kaut ko citu. Pēdējās trīs nedēļas savam klientu darbam neizmantoju neko citu kā gemini-3-pro-image-preview-2k (nano-banana-pro) — katru fona nomaiņu, katru pārkrāsošanu, katru objekta noņemšanu, katru apgaismojuma labošanu. Notika vienkārša lieta: es pārstāju sniegties pēc jebkā cita.
Esmu cieši vērojis kopienu. Discord serverus, Reddit pavedienus, reālos darba plūsmas ekrānuzņēmumus, ko cilvēki dalās vietnē X. Kad praktizētāji publicē savus rediģēšanas salīdzinājumus pirms un pēc, modelis, kas turpina parādīties, nav ChatGPT. Tas ir nano-banana-pro. Ne tāpēc, ka tas uzvar kādā abstraktā preferenču balsojumā, bet tāpēc, ka cilvēki ar to veic reālu darbu.
nano-banana-pro ne tikai rediģē attēlus — tas saprot nolūku. Kad es tam saku "padari šo profesionālāku", tas ne tikai palielina kontrastu un uzliek vinjeti. Tas lasa attēlu kā fotogrāfs: pielāgojot baltā balansu, tīrot mikro traucēkļus, mainot krāsu gradāciju, lai tā atbilstu konteksta prasībām. Atšķirība starp instrukciju izpildi un mērķa saprašanu — tā ir plaisa, ko nano-banana-pro ir klusi aizvēris.
Lūk, spēja, kas mani pārliecināja. Es tam devu četrdaļīgu instrukciju: "Noņem stāvošo automašīnu no piebraucamā ceļa, paplašini dārzu, lai aizpildītu telpu, saskaņo pēcpusdienas apgaismojumu uz jaunās zāles un pievieno smalku objektīva atspīdumu no saules pozīcijas." Četras slāņveida prasības vienā piegājienā. nano-banana-pro trāpīja visus četrus. Rekonstruētajam dārzam bija pareizs ēnu virziens. Objektīva atspīdums atradās pareizā leņķī attiecībā pret gaismas avotu. Esmu izmēģinājis tieši šo uzvedni katrā no pieciem labākajiem modeļiem. Lielākā daļa tiek galā ar divām instrukcijām, pirms sāk izjukt saskaņotība. ChatGPT tiek galā ar trim labā dienā. nano-banana-pro tika galā ar četrām, nemirkšķinot acis.
2K variants — gemini-3-pro-image-preview-2k (nano-banana-pro), pašlaik 2. vietā — tiek galā ar augstas izšķirtspējas rediģēšanu ar nosvērtību, kādu neesmu redzējis citur. Pie 2K daudzi modeļi ievieš zvana artefaktus ap asām malām vai zaudē smalkas detaļas atkārtojošos rakstos, piemēram, austā audumā, ķieģeļu sienās vai koku lapotnēs. nano-banana-pro tās saglabā. Standarta izšķirtspējas brālis 3. vietā ir uzkrājis vairāk nekā pusmiljonu kopienas novērtējumu — šāds apjoms liecina, ka cilvēki to izmēģina vienreiz un paliek.
Tas, ko es saucu par "kontekstuālo rediģēšanas inteliģenci", ir vieta, kur šis modelis patiesi vada lauku. Tas ne tikai veic izmaiņas pikseļu līmenī — tas aptver semantiskās attiecības starp elementiem ainā. Noņemiet cilvēku no grupas fotoattēla, un tas dabiski rekonstruē sociālo atstarpi, pielāgojot blakus esošo subjektu ķermeņa valodu, nevis vienkārši ielāpojot plakanu pleķi. Mainiet ainu no vasaras uz rudeni, un tas maina ne tikai lapotni, bet arī ēnu leņķus, apkārtējās gaismas temperatūru un veidu, kā virsmas atstaro izkliedēto gaismu. Tie nav uzvedņu inženierijas triki. Tas ir modelis, kas ir internalizējis, kā izskatās fiziskā pasaule.
nano-banana izcelsme
Google attēlu rediģēšanas evolūcija ir redzama tieši šajā uzvarētāju sarakstā. gemini-2.0-flash-preview-image-generation (#32) bija pamats — spējīgs, bet neapstrādāts. gemini-2.5-flash-image-preview (nano-banana) (#7) to noslīpēja par kaut ko ražošanai gatavu, un tā 10,4 miljoni novērtējumu padara to par kaujās visvairāk pārbaudīto attēlu redaktoru uz planētas. Tad ieradās nano-banana-pro un pārslēdza arhitektūru rediģēšanas precizitātei. Katra paaudze balstījās uz to, ko kopiena iemācīja Google par to, kā cilvēki patiesībā izmanto attēlu redaktorus — nevis etaloniem, bet darbam.
Es sagaidu, ka nano-banana-pro pārņems ChatGPT #1 pozīciju nākamajā reitinga ciklā. Trajektorija ir tur. Google iterē nano-banana arhitektūru ātrāk nekā OpenAI iterē augstas precizitātes režīmā, un praktiskās priekšrocības vairāku soļu rediģēšanā dod tam impulsu, ko viena rediģēšanas etaloniem ir grūti notvert.
OpenAI ķirurģiskā precizitāte
Es gribu būt godīgs pret OpenAI, jo viņi ir pelnījuši atzinību par patiesu inženierijas izcilību. chatgpt-image-latest-high-fidelity (20251216) 1. vietā ir tur pamatota iemesla dēļ. "High-fidelity" apzīmējums ir jauns kopš mana pēdējā apskata, un izvades cauruļvada uzlabojumi ir redzami. Kur ChatGPT izceļas, ir izolētas, ķirurģiskas rediģēšanas. "Mainīt tikai acu krāsu uz zaļu" — tas to dara ar nulles noplūdi apkārtējos ādas toņos. "Nomainīt tekstu uz zīmes, nemainot zīmes laikapstākļu ietekmi" — tas saglabā virsmas tekstūru, kamēr maina saturu. Šī specifika ir patiesi nepārspēta.
Kur OpenAI sasniedz savus griestus
Sarežģītas vairāku elementu rediģēšanas. Kad instrukcijas sakrājas vairāk nekā divas vai trīs operācijas, ChatGPT mēdz piešķirt prioritāti pirmajai instrukcijai un pakāpeniski zaudēt precizitāti nākamajās. Tas ir lielisks, lai paveiktu vienu lietu perfekti. Tas ir mazāk lielisks, lai paveiktu četras lietas saskaņoti. Darba plūsmām, kas ietver iteratīvu, vairāku soļu pilnveidošanu — kas ir lielākā daļa profesionālās rediģēšanas — tam ir nozīme. gpt-image-1.5-high-fidelity 4. vietā ir klusāks darba zirgs: mazāk dramatisks nekā jaunākais modelis, bet paredzamāks dažādās uzvednēs.
OpenAI izvirza četrus modeļus labāko 31 skaitā: chatgpt-image-latest-high-fidelity 1. vietā, gpt-image-1.5-high-fidelity 4. vietā, gpt-image-1 29. vietā un gpt-image-1-mini 31. vietā. Plaisa starp viņu labāko un budžeta līmeni ir ievērojama — 285 punkti — kas liecina, ka OpenAI ir koncentrējis savas rediģēšanas investīcijas augšgalā, nevis veidojis plašu klāstu. Ja jūs izmantojat OpenAI attēlu rediģēšanai, jūs maksājat par flagmani vai arī samierināties.
Jaunās sejas
hunyuan-image-3.0-instruct no Tencent ir lielākais pārsteigums, par kuru neviens nerunā. #6 ierodoties. Tas nav lēns kāpiens — tas ir modelis, kas parādījās gatavs. Tencent gadiem ilgi ir dominējis ķīniešu valodas AI, taču šī ir Hunyuan pirmā nopietnā parādīšanās globālā attēlu rediģēšanas etalonā. "Instruct" apzīmējums ir svarīgs: šis ir modelis, kas arhitektoniski pielāgots rediģēšanas komandām, nevis ģenerēšanai. Manā testēšanā tas apstrādā bilingvālās uzvednes — angļu un ķīniešu — ar dabisku raitumu abās, kas paver reālas darba plūsmas komandām, kas darbojas dažādās valodās.
Bytedance turpina izvirzīt visplašāko sarakstu. Pieci modeļi stiepjas no seedream-4.5 (#5) uz leju līdz seededit-3.0 (#30). seedream-4.5 joprojām ir viņu kroņa dārgakmens mākslinieciskai transformācijai — pasakiet tam "liec šim portretam izskatīties kā Rembrantam", un tas ne tikai sasilda krāsas; tas simulē otas triepienus, chiaroscuro apgaismojumu un audekla tekstūru. seedream-4-2k 8. vietā tiek galā ar augstas izšķirtspējas darbu, kamēr seedream-4-fal (#20) un seedream-4-high-res-fal (#13) aptver ātrākus secinājumu ceļus. Bytedance neveido vienu čempionu — viņi veido pilnu rīku komplektu.
Alibaba klusi paplašinājās līdz četriem modeļiem. qwen-image-edit 16. vietā ir uzkrājis vairāk nekā 1,7 miljonus kopienas novērtējumu — masveida organiska pieņemšana. Jaunākais qwen-image-edit-2511 14. vietā ātri kāpj. Un divi Wan modeļi — wan2.6-image (#18) un wan2.5-i2i-preview (#25) — signalizē, ka Alibaba nopietni iegulda attēla-uz-attēlu transformācijā kā savā produktu kategorijā.
Reve ieņem trīs pozīcijas labāko 23 skaitā. reve-v1.1 10. vietā un reve-v1 12. vietā ir kompetenti vidējas klases redaktori, un reve-edit-fast (#23) piedāvā ātrumam optimizētu alternatīvu. p-image-edit no Pruna 22. vietā ir vērts vērot — Pruna specializējas modeļu saspiešanā un optimizācijā, tāpēc šī, visticamāk, ir destilēta pieeja, kas sit virs sava parametru svara. Un 34. vietā step1x-edit no StepFun noenkuro sarakstu kā atvērtā koda bāzes līnija, kas uztur ekosistēmu godīgu.
Atvērtā koda priekšrocība
Tiem no mums, kas veido produktus uz šiem modeļiem, ir dimensija, ko uzvarētāju saraksts neaptver: neatkarība. Black Forest Labs tagad ieņem deviņas pozīcijas — vairāk nekā jebkura cita organizācija. No flux-2-max 9. vietā uz leju caur flux-1-kontext-dev 28. vietā, šis ir pilnīgs kvalitātes-ātruma kompromisu spektrs, ko varat darbināt savā infrastruktūrā.
Klein līnija stāsta interesantu inženierijas stāstu. flux-2-klein-9b (#15) un flux-2-klein-4b (#24) — nosaukumi atklāj parametru skaitu. Deviņi miljardi un četri miljardi attiecīgi. BFL sistemātiski padara spējīgu attēlu rediģēšanu pieejamu mazākai aparatūrai. flux-2-klein-4b var darboties uz patērētāju GPU ar 8GB VRAM. Tas ir ārkārtīgi svarīgi izstrādātājiem, kuri nevar attaisnot API izmaksas lielā mērogā vai kuriem nepieciešama bezsaistes rediģēšanas iespēja. Kontext ģimene — flux-1-kontext-max (#26), flux-1-kontext-pro (#27), flux-1-kontext-dev (#28) — ienes konteksta apzinātu rediģēšanu pašmitinātās vidēs, kur flux-1-kontext-pro viens pats ir uzkrājis vairāk nekā 6,4 miljonus kopienas novērtējumu.
Pašmitināšana nav tikai par izmaksām. Tā ir par latenci, privātumu un pielāgošanu. Kad apstrādājat medicīniskos attēlus, juridiskos dokumentus vai klientu konfidenciālo radošo darbu, pikseļu sūtīšana uz kāda cita API dažreiz nav iespēja. Flux ekosistēma šobrīd ir vienīgā līmeņa ziņā konkurētspējīgā atbilde uz šo ierobežojumu. Deviņi modeļi, jūsu aparatūra, jūsu svari, lai precizētu, ja vēlaties. Šai brīvībai ir vērtība, ko nemēra neviens uzvarētāju saraksts.
Kur tas viss virzās
Pēc trīs mēnešiem, iegrimstot šajā telpā, blenžot uz uzvarētāju saraksta maiņām un spiežot modeļus līdz neveiksmei, es redzu četras lietas saplūstam.
nano-banana-pro, visticamāk, iegūs 1. vietu līdz gada vidum. Google iterācijas ātrums nano-banana arhitektūrā ir bijis nerimstošs. 2K variants jau ir sitiena attālumā, un vairāku soļu rediģēšanas priekšrocība rada spararatu: praktizētāji, kuri to pieņem, rada labākus rezultātus, dalās ar šiem rezultātiem un piesaista vairāk praktizētāju. OpenAI būs jāpiegādā kaut kas fundamentāli jauns — nevis pakāpenisks uzlabojums — lai noturētu augstāko pozīciju.
Instrukcijām pielāgoti rediģēšanas modeļi kļūs par standarta paradigmu. Tencent hunyuan-image-3.0-instruct ierašanās 6. vietā apstiprina to, ko nano-banana arhitektūra jau ieteica: attēlu rediģēšanas nākotne ir modeļi, kas būvēti tieši rediģēšanas komandām, nevis ģenerēšanas modeļi, kas pārveidoti rediģēšanai. Sagaidiet, ka OpenAI un BFL izlaidīs instrukcijām specifiskus variantus pirms vasaras.
Modeļi zem 4B kļūs patiesi konkurētspējīgi. flux-2-klein-4b jau demonstrē, ka četru miljardu parametru modelis var radīt rediģējumus, kas konkurē tajā pašā arēnā kā modeļi, kas ir desmit reizes lielāki. Līdz 2026. gada vidum es sagaidu redzēt 2-3B rediģēšanas modeļus, kas darbojas tālruņos. Kad tas notiek, visa attēlu rediģēšanas ekonomika mainās — no mākoņa API zvaniem uz ierīces secinājumiem.
Attēlu rediģēšana un video rediģēšana saplūdīs. Modeļi, kas apstrādā laika konsekvenci attēlu rediģēšanā — saglabājot fiziski pareizu apgaismojumu, kad pārvietojat objektu, saglabājot ēnu saskaņotību, kad maināt fonu — būvē tieši to pamatu, kas nepieciešams kadru pa kadram video rediģēšanai. Organizācijas ar spēcīgām attēlu rediģēšanas pozīcijām šodien ir tās, kas rīt dominēs video rediģēšanā. Īpaši vērojiet Google un Bytedance.
Mani ieteikumi
Pēc šo modeļu darbināšanas caur reālām darba plūsmām — nevis etalona uzvednēm, reāliem klientu nodevumiem — lūk, kur es jūs novirzītu atkarībā no tā, kas jums patiesībā nepieciešams.
Labākā vispārējā rediģēšana
gemini-3-pro-image-preview-2k (nano-banana-pro) — vairāku soļu rediģēšanas meistarība, kontekstuālā inteliģence, augstas izšķirtspējas precizitāte. Tas, pēc kura sniedzos vispirms.
Ķirurģiskas atsevišķas rediģēšanas
chatgpt-image-latest-high-fidelity (20251216) — kad jums nepieciešams perfekti mainīt vienu lietu ar nulles noplūdi.
Ražošanas mēroga uzticamība
gemini-2.5-flash-image-preview (nano-banana) — 10,4 miljoni novērtējumu. Visvairāk kaujās pārbaudītais redaktors dzīvē. Kad neveiksme ir dārga, šī ir droša likme.
Mākslinieciskā transformācija
seedream-4.5 — stila pārnešana, kas saprot māksliniecisko mediju, ne tikai krāsu filtrus.
Pašmitināšanas brīvība
Flux 2 ģimene — deviņi modeļi, jūsu aparatūra, jūsu noteikumi. Sāciet ar flux-2-max kvalitātei, flux-2-klein-4b ātrumam.
Budžeta apzināta kvalitāte
flux-2-klein-4b — darbojas uz patērētāju GPU, joprojām konkurētspējīgs 24. vietā. Labākā vērtība uz parametru laukā.
Nav viena labākā AI redaktora. Ir orķestris. Es izmantoju nano-banana-pro sarežģītām, vairāku soļu rediģēšanām, kur svarīga ir sapratne. ChatGPT ķirurģiskai viena elementa precizitātei. Gemini 2.5 Flash, kad man nepieciešama uzticamība mērogā. SeeDream mākslinieciskiem riskiem. Flux, kad pikseļi nevar atstāt manu mašīnu. Apgūstiet ansambli, nevis solistu. Tā ir īstā prasme 2026. gadā.
Datu avots: Reitingi no Image Edit Arena uzvarētāju saraksta, 2026. gada 7. februāris.
Discussion
0 commentsLeave a comment
Be the first to share your thoughts on this article!