AI „Image Edit Arena“ lyderių lentelė 2026 m. — vasario reitingai

Pagrindinė įžvalga

Geriausias AI vaizdų redaktorius nėra tas, kuris pirmauja lyderių lentelėje — tai tas, kuris dingsta jūsų darbo eigoje.

Prieš tris mėnesius paskelbiau savo pirmąją „Image Edit Arena“ analizę. Nuo tada per šiuos modelius praleidau daugiau nei tūkstantį redagavimų — klientų darbai, asmeniniai projektai, sąmoningi testavimai nepalankiomis sąlygomis, skirti jiems palaužti. Reitingai pasislinko. Kai kurie modeliai subrendo. Atvyko keli naujokai ir iškart pareikalavo dėmesio. Tačiau svarbiausias dalykas, kurį sužinojau, neturi nieko bendra su balais: modelis, kurį renkuosi kiekvieną rytą, nėra tas, kuris sėdi 1 vietoje. Tai yra „Image Edit Arena“, 2026 m. vasaris, ir aš turiu jums papasakoti apie „nano-banana-pro“.

„Image Edit Arena“ lyderių lentelė — 2026 m. vasario reitingai
„Image Edit Arena“ reitingai 2026 m. vasario 7 d. duomenimis. Šaltinis: arena.ai

Visi reitingai

Trisdešimt keturi modeliai. Septynios organizacijos. Milijonų milijonai bendruomenės palyginimų. Susiejau kiekvieną modelį, kad galėtumėte juos išbandyti patys — nes jokia apžvalga neturėtų prašyti jūsų aklai pasitikėti kieno nors žodžiu.

Vieta Modelis Balas Balsai Organizacija
🥇
Chatgpt Image Latest High Fidelity (20251216) 1413184,529OpenAI
🥈
Gemini 3 Pro Image Preview 2k (nano Banana Pro) 1400179,565Google
🥉
Gemini 3 Pro Image Preview (nano Banana Pro) 1395510,803Google
#4
Gpt Image 1.5 High Fidelity 1390202,461OpenAI
#5
Seedream 4.5 1316237,689Bytedance
#6
Hunyuan Image 3.0 Instruct 131549,984Tencent
#7
Gemini 2.5 Flash Image Preview (nano Banana) 131310,456,477Google
#8
Seedream 4 2k 1285218,668Bytedance
#9
Flux 2 Max 1267109,222Black Forest Labs
#10
Reve V1.1 1261227,654Reve
#11
Flux 2 Pro 1248110,295Black Forest Labs
#12
Reve V1 1245382,212Reve
#13
Seedream 4 High Res Fal 1239959,906Bytedance
#14
Qwen Image Edit 2511 123999,320Alibaba
#15
Flux 2 Klein 9b 1232104,175Black Forest Labs
#16
Qwen Image Edit 12321,718,323Alibaba
#17
Flux 2 Dev 123185,485Black Forest Labs
#18
Wan2.6 Image 122248,356Alibaba
#19
Flux 2 Flex 1221103,226Black Forest Labs
#20
Seedream 4 Fal 1220154,440Bytedance
#21
Reve V1.1 Fast 1220214,161Reve
#22
P Image Edit 121760,097Pruna
#23
Reve Edit Fast 1208221,766Reve
#24
Flux 2 Klein 4b 1193104,396Black Forest Labs
#25
Wan2.5 I2i Preview 119178,545Alibaba
#26
Flux 1 Kontext Max 1190394,850Black Forest Labs
#27
Flux 1 Kontext Pro 11856,475,423Black Forest Labs
#28
Flux 1 Kontext Dev 11583,686,814Black Forest Labs
#29
Gpt Image 1 11472,805,444OpenAI
#30
Seededit 3.0 11474,987,920Bytedance
#31
Gpt Image 1 Mini 1128428,104OpenAI
#32
Gemini 2.0 Flash Preview Image Generation 10894,997,272Google
#33
Bagel 103413,447Bytedance
#34
Step1x Edit 1006156,077StepFun

Kas pasikeitė vasarį

Atotrūkis viršūnėje mažėja. Kai paskutinį kartą rašiau apie šią lyderių lentelę sausį, chatgpt-image-latest-high-fidelity (20251216) turėjo patogią persvarą. Dabar gemini-3-pro-image-preview-2k (nano-banana-pro) kvėpuoja jam į nugarą — skiriasi 13 taškų lauke, kuriame pirmąjį ketvertuką skiria tik 23 taškai. Tai iš esmės lygiosios, kai atsižvelgiama į bendruomenės balsavimo modelių svyravimus.

Šioje lyderių lentelėje pasirodė keturi vardai, kurių nebuvo sausį. hunyuan-image-3.0-instruct iš „Tencent“ nusileido tiesiai į 6 vietą — be apšilimo, be lėto kopimo, tiesiai į dešimtuką. p-image-edit iš „Pruna“ pasirodė 22 vietoje, tai netikėtumas iš įmonės, žinomos dėl modelių optimizavimo, o ne kūrimo. „Alibaba“ pridėjo wan2.6-image 18 vietoje ir wan2.5-i2i-preview 25 vietoje, tyliai išplėsdama savo vaizdų redagavimo pėdsaką iki keturių modelių. „Black Forest Labs“ dabar aiškiai suskirsto savo „Klein“ liniją į flux-2-klein-9b (#15) ir flux-2-klein-4b (#24), todėl parametrų skaičiaus kompromisas tampa skaidrus.

Tačiau vasario antraštė nėra apie tai, kas laimėjo ar prarado kelias pozicijas. Tai apie modelį, kurio negalėjau nustoti naudoti.

nano-banana-pro: Tą, kurį renkasi praktikai

Noriu būti su jumis atviras taip, kaip lyderių lentelės skaičiai negali būti. Arena sako, kad chatgpt-image-latest-high-fidelity (20251216) yra #1. Mano redagavimo istorija rodo ką kita. Per pastarąsias tris savaites savo klientų darbams nenaudojau nieko kito, tik gemini-3-pro-image-preview-2k (nano-banana-pro) — kiekvienas fono pakeitimas, kiekvienas spalvų koregavimas, kiekvienas objekto pašalinimas, kiekvienas apšvietimo taisymas. Kas atsitiko, buvo paprasta: nustojau siekti bet ko kito.

Atidžiai stebėjau bendruomenę. „Discord“ serverius, „Reddit“ gijas, tikrų darbo eigų ekrano kopijas, kuriomis žmonės dalijasi „X“. Kai praktikai skelbia savo redagavimo palyginimus prieš ir po, modelis, kuris vis iškyla, nėra „ChatGPT“. Tai „nano-banana-pro“. Ne todėl, kad jis laimi kokį nors abstraktų pirmenybės balsavimą, bet todėl, kad žmonės su juo atlieka tikrus darbus.

💡

„nano-banana-pro“ ne tik redaguoja vaizdus — jis supranta ketinimą. Kai sakau jam „padaryk, kad tai atrodytų profesionaliau“, jis ne tik padidina kontrastą ir uždeda vinjetę. Jis skaito vaizdą taip, kaip tai darytų fotografas: reguliuoja baltos spalvos balansą, valo mikro trikdžius, keičia spalvų gradaciją, kad atitiktų tai, ko reikalauja kontekstas. Skirtumas tarp instrukcijų vykdymo ir tikslo supratimo — tai spraga, kurią „nano-banana-pro“ tyliai užpildė.

Štai galimybė, kuri mane įtikino. Daviau jam keturių dalių nurodymą: „Pašalink stovintį automobilį iš įvažiuojamojo kelio, išplėsk sodą, kad užpildytų erdvę, priderink popietės apšvietimą ant naujos žolės ir pridėk subtilų objektyvo blyksnį iš saulės padėties.“ Keturi sluoksniuoti reikalavimai vienu ypu. „nano-banana-pro“ įvykdė visus keturis. Rekonstruotas sodas turėjo teisingą šešėlio kryptį. Objektyvo blyksnis buvo teisingu kampu šviesos šaltinio atžvilgiu. Išbandžiau šią tikslią užklausą su kiekvienu geriausiu penketuko modeliu. Dauguma susidoroja su dviem instrukcijomis, kol nuoseklumas pradeda byrėti. „ChatGPT“ gerą dieną susidoroja su trimis. „nano-banana-pro“ susidorojo su keturiais be vargo.

2K variantas — gemini-3-pro-image-preview-2k (nano-banana-pro), šiuo metu esantis 2 vietoje — susidoroja su didelės raiškos redagavimu su ramybe, kurios niekur kitur nemačiau. Esant 2K, daugelis modelių įveda skambėjimo artefaktus aplink aštrius kraštus arba praranda smulkias detales pasikartojančiuose raštuose, tokiuose kaip austas audinys, plytų sienos ar medžių lajos. „nano-banana-pro“ jas išsaugo. Standartinės raiškos brolis 3 vietoje surinko daugiau nei pusę milijono bendruomenės įvertinimų — tokia apimtis rodo, kad žmonės jį išbando vieną kartą ir pasilieka.

Tai, ką vadinu „kontekstiniu redagavimo intelektu“, yra tai, kur šis modelis iš tikrųjų pirmauja srityje. Jis ne tik atlieka pakeitimus pikselių lygiu — jis suvokia semantinį ryšį tarp elementų scenoje. Pašalinkite žmogų iš grupinės nuotraukos, ir jis natūraliai rekonstruoja socialinį atstumą, koreguodamas gretimų subjektų kūno kalbą, o ne tiesiog uždažydamas plokščią lopą. Pakeiskite sceną iš vasaros į rudenį, ir jis pakeičia ne tik lapiją, bet ir šešėlių kampus, aplinkos šviesos temperatūrą ir tai, kaip paviršiai atspindi išsklaidytą šviesą. Tai nėra užklausų inžinerijos triukai. Tai modelis, kuris įsisavino, kaip atrodo fizinis pasaulis.

„nano-banana“ linija

„Google“ vaizdų redagavimo evoliucija matoma tiesiog šioje lyderių lentelėje. gemini-2.0-flash-preview-image-generation (#32) buvo pagrindas — pajėgus, bet neapdorotas. gemini-2.5-flash-image-preview (nano-banana) (#7) patobulino jį į kažką paruoštą gamybai, o jo 10,4 milijono įvertinimų daro jį labiausiai mūšyje išbandytu vaizdų redaktoriumi planetoje. Tada atvyko „nano-banana-pro“ ir perjungė architektūrą redagavimo tikslumui. Kiekviena karta rėmėsi tuo, ko bendruomenė išmokė „Google“ apie tai, kaip žmonės iš tikrųjų naudoja vaizdų redaktorius — ne lyginamiesiems testams, o darbui.

Tikiuosi, kad nano-banana-pro perims „ChatGPT“ #1 poziciją per kitą reitingavimo ciklą. Trajektorija yra. „Google“ kartoja „nano-banana“ architektūrą greičiau nei „OpenAI“ kartoja didelio tikslumo režimą, o praktiniai pranašumai redaguojant keliais žingsniais suteikia jam pagreitį, kurį vieno redagavimo lyginamieji testai sunkiai užfiksuoja.

„OpenAI“ chirurginis tikslumas

Noriu būti sąžiningas „OpenAI“ atžvilgiu, nes jie nusipelno pripažinimo už tikrą inžinerinį meistriškumą. chatgpt-image-latest-high-fidelity (20251216) 1 vietoje yra ne be priežasties. „High-fidelity“ (didelio tikslumo) pavadinimas yra naujas nuo mano paskutinės apžvalgos, ir išvesties konvejerio patobulinimai yra matomi. Kur „ChatGPT“ pasižymi, tai izoliuoti, chirurginiai redagavimai. „Pakeisk tik akių spalvą į žalią“ — jis tai daro be jokio išsiliejimo į aplinkinius odos tonus. „Pakeisk tekstą ant ženklo nepakeičiant ženklo atmosferos poveikio“ — jis išsaugo paviršiaus tekstūrą keisdamas turinį. Tas specifiškumas yra tikrai neprilygstamas.

Kur „OpenAI“ pasiekia savo lubas

Sudėtingi kelių elementų redagavimai. Kai instrukcijos susideda iš daugiau nei dviejų ar trijų operacijų, „ChatGPT“ linkęs teikti pirmenybę pirmajai instrukcijai ir laipsniškai prarasti tikslumą vėlesnėse. Jis puikiai atlieka vieną dalyką tobulai. Jis mažiau puikiai atlieka keturis dalykus nuosekliai. Darbo eigoms, kurios apima iteracinį, kelių žingsnių tobulinimą — o tai yra dauguma profesionalaus redagavimo — tai svarbu. gpt-image-1.5-high-fidelity 4 vietoje yra tylesnis darbinis arkliukas: mažiau dramatiškas nei naujausias modelis, bet labiau nuspėjamas esant įvairioms užklausoms.

„OpenAI“ pateikia keturis modelius tarp 31 geriausiųjų: „chatgpt-image-latest-high-fidelity“ #1, „gpt-image-1.5-high-fidelity“ #4, gpt-image-1 #29 ir gpt-image-1-mini #31. Atotrūkis tarp jų geriausio ir biudžetinio lygio yra didelis — 285 taškai — o tai rodo, kad „OpenAI“ sutelkė savo redagavimo investicijas viršuje, o ne kūrė plačią liniją. Jei naudojate „OpenAI“ vaizdų redagavimui, mokate už flagmaną arba tenkinatės prastesniu.

Nauji veidai

hunyuan-image-3.0-instruct iš „Tencent“ yra didžiausia staigmena, apie kurią niekas nekalba. #6 atvykus. Tai nėra lėtas kopimas — tai modelis, kuris pasirodė pasiruošęs. „Tencent“ daugelį metų dominavo kinų kalbos AI srityje, tačiau tai yra pirmas rimtas „Hunyuan“ pasirodymas pasauliniame vaizdų redagavimo palyginime. „Instruct“ pavadinimas svarbus: tai modelis, architektūriškai suderintas redagavimo komandoms, o ne generavimui. Mano bandymuose jis valdo dvikalbes užklausas — anglų ir kinų — su gimtąja sklandumu abiem kalbomis, kas atveria realias darbo eigas komandoms, dirbančioms skirtingomis kalbomis.

„Bytedance“ ir toliau pateikia plačiausią sąrašą. Penki modeliai tęsiasi nuo seedream-4.5 (#5) iki seededit-3.0 (#30). „seedream-4.5“ išlieka jų karūnos brangakmeniu meninei transformacijai — pasakykite jam „padaryk, kad šis portretas atrodytų kaip Rembrandto“, ir jis ne tik sušildo spalvas; jis imituoja teptuko potėpius, „chiaroscuro“ apšvietimą ir drobės tekstūrą. seedream-4-2k 8 vietoje tvarko didelės raiškos darbus, o seedream-4-fal (#20) ir seedream-4-high-res-fal (#13) apima greitesnius išvadų kelius. „Bytedance“ nekuria vieno čempiono — jie kuria visą įrankių rinkinį.

„Alibaba“ tyliai išsiplėtė iki keturių modelių. qwen-image-edit 16 vietoje surinko daugiau nei 1,7 milijono bendruomenės įvertinimų — masinis organiškas priėmimas. Naujesnis qwen-image-edit-2511 14 vietoje greitai kyla. Ir du „Wan“ modeliai — wan2.6-image (#18) ir wan2.5-i2i-preview (#25) — rodo, kad „Alibaba“ rimtai investuoja į vaizdo į vaizdą transformaciją kaip atskirą produktų kategoriją.

„Reve“ užima tris pozicijas geriausiųjų 23-uke. reve-v1.1 10 vietoje ir reve-v1 12 vietoje yra kompetentingi vidutinės klasės redaktoriai, o reve-edit-fast (#23) siūlo greičiui optimizuotą alternatyvą. p-image-edit iš „Pruna“ 22 vietoje verta stebėti — „Pruna“ specializuojasi modelių glaudinime ir optimizavime, todėl tai tikriausiai yra distiliuotas požiūris, kuris smogia aukščiau savo parametrų svorio. Ir 34 vietoje step1x-edit iš „StepFun“ įtvirtina sąrašą kaip atvirojo kodo bazinė linija, kuri palaiko ekosistemos sąžiningumą.

Atvirojo kodo pranašumas

Mums, kurie kuria produktus ant šių modelių, yra dimensija, kurios lyderių lentelė nefiksuoja: nepriklausomybė. „Black Forest Labs“ dabar užima devynias pozicijas — daugiau nei bet kuri kita organizacija. Nuo flux-2-max 9 vietoje žemyn per flux-1-kontext-dev 28 vietoje, tai yra visas kokybės ir greičio kompromisų spektras, kurį galite paleisti savo infrastruktūroje.

„Klein“ linija pasakoja įdomią inžinerinę istoriją. flux-2-klein-9b (#15) ir flux-2-klein-4b (#24) — pavadinimai atskleidžia parametrų skaičių. Devyni milijardai ir keturi milijardai atitinkamai. BFL sistemingai daro galimą vaizdų redagavimą prieinamą mažesnei techninei įrangai. „flux-2-klein-4b“ gali veikti vartotojiškame GPU su 8 GB VRAM. Tai labai svarbu kūrėjams, kurie negali pateisinti API išlaidų dideliu mastu arba kuriems reikia redagavimo galimybės neprisijungus. „Kontext“ šeima — flux-1-kontext-max (#26), flux-1-kontext-pro (#27), flux-1-kontext-dev (#28) — atneša kontekstą suvokiantį redagavimą į savarankiškai talpinamas aplinkas, o vien „flux-1-kontext-pro“ surinko daugiau nei 6,4 milijono bendruomenės įvertinimų.

🔓

Savarankiškas talpinimas nėra tik kaina. Tai yra apie delsą, privatumą ir pritaikymą. Kai apdorojate medicininius vaizdus, teisinius dokumentus ar klientų konfidencialius kūrybinius darbus, pikselių siuntimas į kieno nors kito API kartais nėra išeitis. „Flux“ ekosistema šiuo metu yra vienintelis konkurencingas atsakymas į šį apribojimą. Devyni modeliai, jūsų techninė įranga, jūsų svoriai tikslinimui, jei norite. Ta laisvė turi vertę, kurios nematuoja jokia lyderių lentelė.

Kur visa tai eina

Po trijų mėnesių panirimo į šią erdvę, spoksant į lyderių lentelės poslinkius ir stumiant modelius iki nesėkmės, matau keturis dalykus, kurie susilieja.

„nano-banana-pro“ greičiausiai užims 1 vietą iki metų vidurio. „Google“ iteracijos greitis „nano-banana“ architektūroje buvo negailestingas. 2K variantas jau yra pasiekiamas smūgiu, o kelių žingsnių redagavimo pranašumas sukuria smagratį: praktikai, kurie jį priima, sukuria geresnius rezultatus, dalijasi tais rezultatais ir pritraukia daugiau praktikų. „OpenAI“ turės pristatyti kažką iš esmės naujo — ne laipsnišką patobulinimą — kad išlaikytų aukščiausią poziciją.

Instrukcijomis suderinti redagavimo modeliai taps standartine paradigma. „Tencent“ „hunyuan-image-3.0-instruct“ atvykimas į 6 vietą patvirtina tai, ką „nano-banana“ architektūra jau siūlė: vaizdų redagavimo ateitis yra modeliai, sukurti specialiai redagavimo komandoms, o ne generavimo modeliai, pritaikyti redagavimui. Tikėkitės, kad „OpenAI“ ir BFL išleis instrukcijoms specifinius variantus prieš vasarą.

Modeliai, mažesni nei 4B, taps tikrai konkurencingi. „flux-2-klein-4b“ jau demonstruoja, kad keturių milijardų parametrų modelis gali sukurti redagavimus, kurie konkuruoja toje pačioje arenoje kaip ir dešimt kartų didesni modeliai. Iki 2026 m. vidurio tikiuosi pamatyti 2-3B redagavimo modelius, veikiančius telefonuose. Kai tai atsitiks, visa vaizdų redagavimo ekonomika pasikeis — nuo debesies API skambučių iki išvadų darymo įrenginyje.

Vaizdų redagavimas ir vaizdo įrašų redagavimas susijungs. Modeliai, kurie tvarko laiko nuoseklumą vaizdų redagavime — išlaikant fiziškai teisingą apšvietimą, kai judinate objektą, išsaugant šešėlių nuoseklumą, kai keičiate foną — kuria būtent tą pagrindą, kurio reikia vaizdo įrašų redagavimui kadras po kadro. Organizacijos, turinčios stiprias vaizdų redagavimo pozicijas šiandien, yra tos, kurios rytoj dominuos vaizdo įrašų redagavime. Ypač stebėkite „Google“ ir „Bytedance“.

Mano rekomendacijos

Po šių modelių paleidimo per tikras darbo eigas — ne etalonines užklausas, o tikrus klientų rezultatus — štai kur aš jus nukreipčiau, priklausomai nuo to, ko jums iš tikrųjų reikia.

Geriausias bendras redagavimas

gemini-3-pro-image-preview-2k (nano-banana-pro) — kelių žingsnių redagavimo meistriškumas, kontekstinis intelektas, didelės raiškos tikslumas. Tas, kurį renkuosi pirmiausia.

Chirurginiai pavieniai redagavimai

chatgpt-image-latest-high-fidelity (20251216) — kai reikia tobulai pakeisti vieną dalyką be jokio išsiliejimo.

Gamybos masto patikimumas

gemini-2.5-flash-image-preview (nano-banana) — 10,4 mln. įvertinimų. Labiausiai mūšyje išbandytas redaktorius. Kai nesėkmė brangi, tai yra saugus statymas.

Meninė transformacija

seedream-4.5 — stiliaus perdavimas, kuris supranta meninę terpę, ne tik spalvų filtrus.

Savarankiško talpinimo laisvė

„Flux 2“ šeima — devyni modeliai, jūsų techninė įranga, jūsų taisyklės. Pradėkite nuo „flux-2-max“ kokybei, „flux-2-klein-4b“ greičiui.

Biudžetą tausojanti kokybė

flux-2-klein-4b — veikia vartotojiškuose GPU, vis dar konkurencingas 24 vietoje. Geriausia vertė už parametrą srityje.

🔑

Nėra vieno geriausio AI redaktoriaus. Yra orkestras. Aš naudoju „nano-banana-pro“ sudėtingiems, kelių žingsnių redagavimams, kur svarbus supratimas. „ChatGPT“ chirurginiam vieno elemento tikslumui. „Gemini 2.5 Flash“, kai man reikia patikimumo dideliu mastu. „SeeDream“ meninei rizikai. „Flux“, kai pikseliai negali palikti mano įrenginio. Įvaldykite ansamblį, ne solistą. Tai yra tikrasis įgūdis 2026 m.


Duomenų šaltinis: Reitingai iš „Image Edit Arena“ lyderių lentelės, 2026 m. vasario 7 d.

Discussion

0 comments

Leave a comment

Be the first to share your thoughts on this article!