Editor imej AI terbaik bukanlah yang menduduki tempat teratas papan pendahulu — sebaliknya ia adalah yang hilang ke dalam aliran kerja anda.
Tiga bulan lalu saya menerbitkan analisis pertama saya mengenai Arena Suntingan Imej (Image Edit Arena). Sejak itu saya telah melakukan lebih seribu suntingan melalui model-model ini — kerja klien, projek peribadi, ujian tekanan sengaja yang direka untuk memecahkannya. Kedudukan berubah. Beberapa model menjadi matang. Beberapa pendatang baru tiba dan segera menuntut perhatian. Tetapi perkara paling penting yang saya pelajari tiada kaitan dengan skor: model yang saya capai setiap pagi bukanlah yang duduk di #1. Ini adalah Arena Suntingan Imej, Februari 2026, dan saya perlu memberitahu anda tentang nano-banana-pro.
Kedudukan Penuh
Tiga puluh empat model. Tujuh organisasi. Berjuta-juta perbandingan komuniti. Saya telah memautkan setiap model supaya anda boleh mengujinya sendiri — kerana tiada ulasan yang sepatutnya meminta anda mempercayai kata-kata orang lain semata-mata.
| Kedudukan | Model | Skor | Undian | Organisasi |
|---|---|---|---|---|
🥇 | Chatgpt Image Latest High Fidelity (20251216) | 1413 | 184,529 | OpenAI |
🥈 | Gemini 3 Pro Image Preview 2k (nano Banana Pro) | 1400 | 179,565 | |
🥉 | Gemini 3 Pro Image Preview (nano Banana Pro) | 1395 | 510,803 | |
#4 | Gpt Image 1.5 High Fidelity | 1390 | 202,461 | OpenAI |
#5 | Seedream 4.5 | 1316 | 237,689 | Bytedance |
#6 | Hunyuan Image 3.0 Instruct | 1315 | 49,984 | Tencent |
#7 | Gemini 2.5 Flash Image Preview (nano Banana) | 1313 | 10,456,477 | |
#8 | Seedream 4 2k | 1285 | 218,668 | Bytedance |
#9 | Flux 2 Max | 1267 | 109,222 | Black Forest Labs |
#10 | Reve V1.1 | 1261 | 227,654 | Reve |
#11 | Flux 2 Pro | 1248 | 110,295 | Black Forest Labs |
#12 | Reve V1 | 1245 | 382,212 | Reve |
#13 | Seedream 4 High Res Fal | 1239 | 959,906 | Bytedance |
#14 | Qwen Image Edit 2511 | 1239 | 99,320 | Alibaba |
#15 | Flux 2 Klein 9b | 1232 | 104,175 | Black Forest Labs |
#16 | Qwen Image Edit | 1232 | 1,718,323 | Alibaba |
#17 | Flux 2 Dev | 1231 | 85,485 | Black Forest Labs |
#18 | Wan2.6 Image | 1222 | 48,356 | Alibaba |
#19 | Flux 2 Flex | 1221 | 103,226 | Black Forest Labs |
#20 | Seedream 4 Fal | 1220 | 154,440 | Bytedance |
#21 | Reve V1.1 Fast | 1220 | 214,161 | Reve |
#22 | P Image Edit | 1217 | 60,097 | Pruna |
#23 | Reve Edit Fast | 1208 | 221,766 | Reve |
#24 | Flux 2 Klein 4b | 1193 | 104,396 | Black Forest Labs |
#25 | Wan2.5 I2i Preview | 1191 | 78,545 | Alibaba |
#26 | Flux 1 Kontext Max | 1190 | 394,850 | Black Forest Labs |
#27 | Flux 1 Kontext Pro | 1185 | 6,475,423 | Black Forest Labs |
#28 | Flux 1 Kontext Dev | 1158 | 3,686,814 | Black Forest Labs |
#29 | Gpt Image 1 | 1147 | 2,805,444 | OpenAI |
#30 | Seededit 3.0 | 1147 | 4,987,920 | Bytedance |
#31 | Gpt Image 1 Mini | 1128 | 428,104 | OpenAI |
#32 | Gemini 2.0 Flash Preview Image Generation | 1089 | 4,997,272 | |
#33 | Bagel | 1034 | 13,447 | Bytedance |
#34 | Step1x Edit | 1006 | 156,077 | StepFun |
Apa Yang Berubah Pada Februari
Jurang di puncak semakin mengecil. Kali terakhir saya menulis tentang papan pendahulu ini pada bulan Januari, chatgpt-image-latest-high-fidelity (20251216) memegang kelebihan yang selesa. Kini gemini-3-pro-image-preview-2k (nano-banana-pro) berada betul-betul di belakangnya — beza 13 mata dalam medan di mana empat teratas dipisahkan hanya dengan 23 mata. Itu pada dasarnya seri apabila anda mengambil kira variasi dalam corak undian komuniti.
Empat nama muncul di papan pendahulu ini yang tiada pada bulan Januari. hunyuan-image-3.0-instruct dari Tencent mendarat terus di #6 — tiada pemanasan, tiada pendakian perlahan, terus masuk ke sepuluh teratas. p-image-edit dari Pruna muncul di #22, 'wildcard' dari syarikat yang terkenal dengan pengoptimuman model berbanding pembinaan model. Alibaba menambah wan2.6-image di #18 dan wan2.5-i2i-preview di #25, secara senyap memperluaskan jejak penyuntingan imej mereka kepada empat model kesemuanya. Black Forest Labs kini secara eksplisit membahagikan barisan Klein mereka kepada flux-2-klein-9b (#15) dan flux-2-klein-4b (#24), menjadikan pertukaran kiraan parameter telus.
Tetapi tajuk utama Februari bukan tentang siapa yang naik atau turun beberapa kedudukan. Ia adalah tentang model yang saya tidak boleh berhenti gunakan.
nano-banana-pro: Pilihan Para Pengamal
Saya mahu jujur dengan anda dengan cara yang nombor papan pendahulu tidak boleh lakukan. Arena mengatakan chatgpt-image-latest-high-fidelity (20251216) adalah #1. Sejarah penyuntingan saya mengatakan sesuatu yang berbeza. Selama tiga minggu yang lalu saya tidak menjalankan apa-apa selain gemini-3-pro-image-preview-2k (nano-banana-pro) untuk kerja klien saya — setiap penggantian latar belakang, setiap penggredan warna semula, setiap pembuangan objek, setiap pembaikan pencahayaan. Apa yang berlaku adalah mudah: Saya berhenti mencapai yang lain.
Saya telah memerhatikan komuniti dengan teliti. Pelayan Discord, urutan Reddit, tangkapan skrin aliran kerja sebenar yang orang kongsi di X. Apabila pengamal menyiarkan perbandingan penyuntingan sebelum dan selepas mereka, model yang terus muncul bukanlah ChatGPT. Ia adalah nano-banana-pro. Bukan kerana ia memenangi undian keutamaan abstrak, tetapi kerana orang ramai menghantar kerja sebenar dengannya.
nano-banana-pro bukan hanya menyunting imej — ia memahami niat. Apabila saya menyuruhnya "jadikan ini kelihatan lebih profesional," ia bukan hanya menaikkan kontras dan menampal vignet. Ia membaca imej seperti seorang jurugambar: melaraskan keseimbangan putih, membersihkan gangguan mikro, mengalihkan penggredan warna untuk memadankan apa yang dituntut oleh konteks. Perbezaan antara melaksanakan arahan dan memahami tujuan — itulah jurang yang telah ditutup dengan senyap oleh nano-banana-pro.
Inilah keupayaan yang meyakinkan saya. Saya memberinya arahan empat bahagian: "Keluarkan kereta yang diparkir dari laluan masuk, luaskan taman untuk mengisi ruang, padankan pencahayaan petang pada rumput baru, dan tambah sedikit silau kanta dari kedudukan matahari." Empat permintaan berlapis dalam satu laluan. nano-banana-pro berjaya melakukan keempat-empatnya. Taman yang dibina semula mempunyai arah bayang-bayang yang betul. Silau kanta berada pada sudut yang betul berbanding sumber cahaya. Saya telah mencuba gesaan tepat ini pada setiap model lima teratas. Kebanyakannya mengendalikan dua arahan sebelum koheren mula rosak. ChatGPT mengendalikan tiga pada hari yang baik. nano-banana-pro mengendalikan empat tanpa berkelip.
Varian 2K — gemini-3-pro-image-preview-2k (nano-banana-pro), kini di #2 — mengendalikan penyuntingan resolusi tinggi dengan ketenangan yang saya tidak pernah lihat di tempat lain. Pada 2K, banyak model memperkenalkan artifak berdering di sekitar tepi tajam atau kehilangan butiran halus dalam corak berulang seperti kain tenunan, dinding bata, atau kanopi pokok. nano-banana-pro memeliharanya. Saudara resolusi standard di #3 telah mengumpulkan lebih setengah juta penilaian komuniti — jumlah sedemikian memberitahu anda bahawa orang mencubanya sekali dan kekal.
Apa yang saya panggil "kecerdasan penyuntingan kontekstual" adalah di mana model ini benar-benar memimpin bidang. Ia bukan hanya melaksanakan perubahan peringkat piksel — ia memahami hubungan semantik antara elemen dalam satu adegan. Keluarkan seseorang dari foto kumpulan, dan ia membina semula jarak sosial secara semula jadi, melaraskan bahasa badan subjek bersebelahan dan bukannya hanya melukis tampalan rata. Ubah adegan dari musim panas ke musim luruh, dan ia mengubah suai bukan sahaja dedaunan tetapi sudut bayang-bayang, suhu cahaya ambien, dan cara permukaan memantulkan cahaya yang tersebar. Ini bukan helah kejuruteraan gesaan. Ini adalah model yang telah menginternalisasi bagaimana dunia fizikal kelihatan.
Salasilah nano-banana
Evolusi penyuntingan imej Google kelihatan terus di papan pendahulu ini. gemini-2.0-flash-preview-image-generation (#32) adalah asasnya — berkebolehan tetapi mentah. gemini-2.5-flash-image-preview (nano-banana) (#7) memperhalusinya menjadi sesuatu yang sedia untuk pengeluaran, dan 10.4 juta penilaiannya menjadikannya editor imej yang paling teruji dalam pertempuran di planet ini. Kemudian nano-banana-pro tiba dan memasang semula seni bina untuk ketepatan penyuntingan. Setiap generasi dibina berdasarkan apa yang diajar oleh komuniti kepada Google tentang bagaimana orang sebenarnya menggunakan editor imej — bukan untuk penanda aras, tetapi untuk kerja.
Saya menjangkakan nano-banana-pro akan mengambil alih kedudukan #1 ChatGPT dalam kitaran kedudukan seterusnya. Trajektorinya ada di sana. Google mengulangi seni bina nano-banana lebih cepat daripada OpenAI mengulangi mod fideliti tinggi, dan kelebihan praktikal dalam penyuntingan berbilang langkah memberikannya momentum yang sukar ditangkap oleh penanda aras penyuntingan tunggal.
Ketepatan Pembedahan OpenAI
Saya mahu berlaku adil kepada OpenAI, kerana mereka berhak mendapat kredit untuk kecemerlangan kejuruteraan yang tulen. chatgpt-image-latest-high-fidelity (20251216) di #1 berada di sana kerana satu sebab. Penandaan "fideliti tinggi" adalah baru sejak ulasan terakhir saya, dan penambahbaikan saluran output kelihatan. Di mana ChatGPT unggul adalah penyuntingan terpencil dan pembedahan. "Ubah warna mata sahaja kepada hijau" — ia melakukan ini dengan sifar kebocoran ke dalam nada kulit sekeliling. "Gantikan teks pada tanda tanpa mengubah pelapukan tanda" — ia memelihara tekstur permukaan sambil menukar kandungan. Kekhususan itu benar-benar tiada tandingan.
Di Mana OpenAI Mencapai Silingnya
Penyuntingan berbilang elemen yang kompleks. Apabila arahan bertimbun melebihi dua atau tiga operasi, ChatGPT cenderung mengutamakan arahan pertama dan secara progresif kehilangan fideliti pada arahan seterusnya. Ia sangat baik dalam melakukan satu perkara dengan sempurna. Ia kurang baik dalam melakukan empat perkara secara koheren. Untuk aliran kerja yang melibatkan penghalusan berulang, berbilang langkah — yang merupakan kebanyakan penyuntingan profesional — ini penting. gpt-image-1.5-high-fidelity di #4 adalah kuda kerja yang lebih senyap: kurang dramatik daripada model terkini, tetapi lebih boleh diramal merentas pelbagai gesaan.
OpenAI membariskan empat model dalam 31 teratas: chatgpt-image-latest-high-fidelity di #1, gpt-image-1.5-high-fidelity di #4, gpt-image-1 di #29, dan gpt-image-1-mini di #31. Jurang antara yang terbaik dan peringkat bajet mereka adalah ketara — 285 mata — yang menunjukkan OpenAI telah menumpukan pelaburan penyuntingan mereka di puncak dan bukannya membina barisan yang luas. Jika anda menggunakan OpenAI untuk penyuntingan imej, anda membayar untuk perdana atau anda berpuas hati dengan kurang.
Wajah-Wajah Baru
hunyuan-image-3.0-instruct dari Tencent adalah kejutan terbesar yang tiada siapa bincangkan. #6 semasa ketibaan. Itu bukan pendakian perlahan — itu adalah model yang muncul bersedia. Tencent telah mendominasi AI bahasa Cina selama bertahun-tahun, tetapi ini adalah penampilan serius pertama Hunyuan pada penanda aras penyuntingan imej global. Penandaan "instruct" penting: ini adalah model yang ditala secara seni bina untuk arahan penyuntingan dan bukannya penjanaan. Dalam ujian saya, ia mengendalikan gesaan dwibahasa — Inggeris dan Cina — dengan kefasihan asli dalam kedua-duanya, yang membuka aliran kerja sebenar untuk pasukan yang beroperasi merentas bahasa.
Bytedance terus membariskan senarai terluas. Lima model merentang dari seedream-4.5 (#5) turun ke seededit-3.0 (#30). seedream-4.5 kekal sebagai permata mahkota mereka untuk transformasi artistik — beritahunya "jadikan potret ini kelihatan seperti Rembrandt" dan ia bukan sahaja memanaskan warna; ia mensimulasikan sapuan berus, pencahayaan chiaroscuro, dan tekstur kanvas. seedream-4-2k di #8 mengendalikan kerja resolusi tinggi, manakala seedream-4-fal (#20) dan seedream-4-high-res-fal (#13) meliputi laluan inferens yang lebih pantas. Bytedance tidak membina satu juara — mereka membina kit alat lengkap.
Alibaba secara senyap berkembang kepada empat model. qwen-image-edit di #16 telah mengumpulkan lebih 1.7 juta penilaian komuniti — penerimaan organik secara besar-besaran. qwen-image-edit-2511 yang lebih baru di #14 mendaki dengan pantas. Dan dua model Wan — wan2.6-image (#18) dan wan2.5-i2i-preview (#25) — menandakan bahawa Alibaba melabur serius dalam transformasi imej-ke-imej sebagai kategori produknya sendiri.
Reve memegang tiga kedudukan dalam 23 teratas. reve-v1.1 di #10 dan reve-v1 di #12 adalah editor jarak pertengahan yang kompeten, dan reve-edit-fast (#23) menawarkan alternatif yang dioptimumkan kelajuan. p-image-edit dari Pruna di #22 patut diperhatikan — Pruna pakar dalam pemampatan dan pengoptimuman model, jadi ini berkemungkinan pendekatan sulingan yang menumbuk di atas berat parameternya. Dan di #34, step1x-edit dari StepFun menambat senarai sebagai garis dasar sumber terbuka yang mengekalkan ekosistem jujur.
Kelebihan Sumber Terbuka
Bagi kita yang membina produk di atas model-model ini, terdapat satu dimensi yang tidak ditangkap oleh papan pendahulu: kebebasan. Black Forest Labs kini memegang sembilan kedudukan — lebih banyak daripada organisasi lain. Dari flux-2-max di #9 turun melalui flux-1-kontext-dev di #28, ini adalah spektrum lengkap pertukaran kualiti-kelajuan yang boleh anda jalankan pada infrastruktur anda sendiri.
Barisan Klein menceritakan kisah kejuruteraan yang menarik. flux-2-klein-9b (#15) dan flux-2-klein-4b (#24) — nama-nama itu mendedahkan kiraan parameter. Sembilan bilion dan empat bilion masing-masing. BFL secara sistematik menjadikan penyuntingan imej berkebolehan boleh diakses oleh perkakasan yang lebih kecil. flux-2-klein-4b boleh berjalan pada GPU pengguna dengan 8GB VRAM. Itu sangat penting bagi pembangun yang tidak dapat mewajarkan kos API pada skala besar atau yang memerlukan keupayaan penyuntingan luar talian. Keluarga Kontext — flux-1-kontext-max (#26), flux-1-kontext-pro (#27), flux-1-kontext-dev (#28) — membawa penyuntingan sedar konteks ke persekitaran yang dihoskan sendiri, dengan flux-1-kontext-pro sahaja telah mengumpulkan lebih 6.4 juta penilaian komuniti.
Hosting sendiri bukan hanya tentang kos. Ia tentang latensi, privasi, dan penyesuaian. Apabila anda memproses imej perubatan, dokumen undang-undang, atau kerja kreatif sulit klien, menghantar piksel ke API orang lain kadangkala bukan pilihan. Ekosistem Flux adalah satu-satunya jawapan berdaya saing peringkat untuk kekangan itu sekarang. Sembilan model, perkakasan anda, berat anda untuk ditala halus jika anda mahu. Kebebasan itu mempunyai nilai yang tidak diukur oleh mana-mana papan pendahulu.
Ke Mana Semua Ini Menuju
Selepas tiga bulan tenggelam dalam ruang ini, merenung pergeseran papan pendahulu dan menolak model sehingga gagal, saya melihat empat perkara bergabung.
nano-banana-pro mungkin akan menuntut #1 menjelang pertengahan tahun. Kelajuan lelaran Google pada seni bina nano-banana tidak henti-henti. Varian 2K sudah berada dalam jarak serangan, dan kelebihan penyuntingan berbilang langkah mencipta roda tenaga: pengamal yang menggunakannya menghasilkan keputusan yang lebih baik, berkongsi keputusan tersebut, dan menarik lebih ramai pengamal. OpenAI perlu menghantar sesuatu yang pada asasnya baru — bukan penghalusan berperingkat — untuk memegang kedudukan teratas.
Model penyuntingan yang ditala arahan akan menjadi paradigma standard. Ketibaan hunyuan-image-3.0-instruct dari Tencent di #6 mengesahkan apa yang telah dicadangkan oleh seni bina nano-banana: masa depan penyuntingan imej adalah model yang dibina khusus untuk arahan penyuntingan, bukan model penjanaan yang digunakan semula untuk penyuntingan. Jangkakan OpenAI dan BFL mengeluarkan varian khusus arahan sebelum musim panas.
Model di bawah 4B akan menjadi benar-benar kompetitif. flux-2-klein-4b sudah menunjukkan bahawa model empat bilion parameter boleh menghasilkan suntingan yang bersaing dalam arena yang sama dengan model sepuluh kali saiznya. Menjelang pertengahan 2026 saya menjangkakan untuk melihat model penyuntingan 2-3B yang berjalan pada telefon. Apabila itu berlaku, keseluruhan ekonomi penyuntingan imej berubah — dari panggilan API awan ke inferens pada peranti.
Penyuntingan imej dan penyuntingan video akan bergabung. Model yang mengendalikan konsistensi temporal dalam suntingan imej — mengekalkan pencahayaan yang betul secara fizik apabila anda menggerakkan objek, mengekalkan koheren bayang-bayang apabila anda menukar latar belakang — sedang membina asas tepat yang diperlukan untuk penyuntingan video bingkai demi bingkai. Organisasi dengan kedudukan penyuntingan imej yang kuat hari ini adalah mereka yang akan mendominasi penyuntingan video esok. Perhatikan Google dan Bytedance khususnya.
Cadangan Saya
Selepas menjalankan model-model ini melalui aliran kerja sebenar — bukan gesaan penanda aras, hasil kerja klien sebenar — inilah ke mana saya akan mengarahkan anda bergantung pada apa yang anda sebenarnya perlukan.
Penyuntingan Keseluruhan Terbaik
gemini-3-pro-image-preview-2k (nano-banana-pro) — penguasaan penyuntingan berbilang langkah, kecerdasan kontekstual, ketepatan resolusi tinggi. Yang saya capai dahulu.
Penyuntingan Tunggal Pembedahan
chatgpt-image-latest-high-fidelity (20251216) — apabila anda memerlukan satu perkara diubah dengan sempurna tanpa kebocoran.
Kebolehpercayaan Skala Pengeluaran
gemini-2.5-flash-image-preview (nano-banana) — 10.4 juta penilaian. Editor paling teruji dalam pertempuran yang masih hidup. Apabila kegagalan mahal, ini adalah pertaruhan yang selamat.
Transformasi Artistik
seedream-4.5 — pemindahan gaya yang memahami medium artistik, bukan hanya penapis warna.
Kebebasan Hosting Sendiri
Keluarga Flux 2 — sembilan model, perkakasan anda, peraturan anda. Mulakan dengan flux-2-max untuk kualiti, flux-2-klein-4b untuk kelajuan.
Kualiti Sedar Bajet
flux-2-klein-4b — berjalan pada GPU pengguna, masih kompetitif di #24. Nilai terbaik per parameter di padang.
Tiada editor AI tunggal terbaik. Ada orkestra. Saya menggunakan nano-banana-pro untuk penyuntingan berbilang langkah yang kompleks di mana pemahaman itu penting. ChatGPT untuk ketepatan satu elemen pembedahan. Gemini 2.5 Flash apabila saya memerlukan kebolehpercayaan pada skala. SeeDream untuk risiko artistik. Flux apabila piksel tidak boleh meninggalkan mesin saya. Kuasai ensembel, bukan pemain solo. Itulah kemahiran sebenar pada tahun 2026.
Sumber Data: Kedudukan dari Papan Pendahulu Arena Suntingan Imej, 7 Februari 2026.
Discussion
0 commentsLeave a comment
Be the first to share your thoughts on this article!