Perbezaan antara imej AI biasa-biasa dan ciptaan yang membuatkan anda terpukau bukanlah tentang nasib atau alatan mahal — ia tentang memahami cara Nano Banana Pro berfikir dan belajar bercakap bahasa visualnya.
Saya masih ingat saat tepat apabila segala-galanya berubah. Pukul 3 pagi apabila telefon saya mula bergetar tanpa henti. Komuniti kreatif saya terbakar. "Adakah anda nampak ini?" "Google baru sahaja melancarkan sesuatu yang gila." "Lupakan segala yang anda tahu tentang imej AI." Saya menggosok mata, membuka komputer riba saya, dan apa yang saya lihat mengubah segala yang saya fikir saya tahu tentang penjanaan imej AI.
Nano Banana Pro telah tiba. Bukan sebagai kemas kini kecil, bukan sebagai peningkatan berperingkat, tetapi sebagai perubahan paradigma sepenuhnya. Dalam beberapa minit ujian, saya menghasilkan teks yang benar-benar boleh dibaca dalam pelbagai bahasa, mewarnakan manga dengan satu prompt, membuat poster filem yang kelihatan seperti dari studio Hollywood. Kumpulan yang saya masuki meletup dengan contoh — setiap satu lebih menakjubkan daripada yang sebelumnya.
Malam itu, saya tidak tidur. Saya mencipta beratus-ratus imej, menguji setiap teknik yang boleh saya fikirkan, menolak had yang saya tidak tahu wujud. Menjelang matahari terbit, saya telah mendokumenkan lapan aliran kerja kreatif baru yang tidak mungkin hanya 24 jam sebelumnya. Dan dalam minggu-minggu berikutnya, saya menemui tujuh lagi. Ini adalah segala yang saya pelajari — panduan lengkap untuk menguasai Nano Banana Pro yang saya harap wujud apabila saya memulakan perjalanan semalaman saya ke masa depan penjanaan imej AI.
Malam Yang Mengubah Segala-galanya
Mari saya bawa anda kembali ke detik itu. Saya telah menggunakan penjana imej AI selama lebih setahun — DALL-E, Midjourney, Stable Diffusion, model imej Gemini awal. Mereka mengagumkan, pasti, tetapi semuanya berkongsi had yang mengecewakan yang sama. Rendering teks adalah bencana. Skrip bukan Latin keluar seperti hieroglif asing. Mengekalkan konsistensi watak merentas pelbagai imej? Lupakan saja.
Saya telah berkompromi dengan aliran kerja menggunakan AI untuk idea awal, kemudian menghabiskan berjam-jam di Photoshop membetulkan isu yang tidak dapat dielakkan. Teks perlu ditambah secara manual. Muka memerlukan retouching. Ia berguna, tetapi saya berasa seperti teknologi selalu 80% sahaja.
Kemudian Nano Banana Pro dilancarkan.
Perkara pertama yang saya cuba ialah poster filem dengan tipografi kompleks — sesuatu yang sentiasa mustahil. Saya menaip prompt meminta kaligrafi seni yang mengalir, teks tajuk yang bergaya, dan penempatan subtajuk yang elegan. Apa yang muncul di skrin saya membuatkan saya berseru. Hurufnya sempurna. Tipografinya cantik. Komposisi adalah profesional. Saya duduk di sana merenungnya selama seminit penuh.
Saat saya menyedari Nano Banana Pro berbeza: Saya memintanya mencipta kaligrafi bergaya, menjangkakan kebisingan biasa yang bercelaru, dan sebaliknya mendapat tipografi yang kelihatan seperti dari studio reka bentuk profesional. Itulah saat saya sedar peraturan telah berubah.
Dalam jam-jam berikutnya, saya menemui satu keupayaan demi satu yang saya tidak tahu mungkin. Saya mewarnakan halaman manga hitam-putih sambil menterjemah teks secara serentak. Saya menjana pelan seni bina dari foto tunggal. Saya membuat antaramuka permainan begitu realistik sehingga rakan bertanya dari permainan mana ia berasal. Setiap penemuan membawa kepada satu lagi, dan satu lagi, sehingga matahari terbit dan saya menyedari saya tidak bergerak dari meja saya selama lapan jam.
Yang berikut adalah segala yang saya pelajari malam itu dan minggu-minggu eksperimen sengit yang menyusul. Ini bukan gambaran keseluruhan cetek — ini adalah pengetahuan mendalam yang datang dari menolak alatan ini ke had mutlak mereka dan mendokumenkan apa yang berfungsi, apa yang tidak, dan mengapa.
Apa Yang Membuat Nano Banana Pro Berbeza
Sebelum kita menyelami tekniknya, mari saya terangkan dengan tepat apa itu Nano Banana Pro dan mengapa ia mewakili lonjakan maju yang begitu ketara. Nano Banana Pro — secara rasmi dipanggil Gemini 2.0 Flash Image — adalah model penjanaan imej paling canggih Google, dibina di atas asas keupayaan penaakulan kuat Gemini 2.0.
Ini bukan sekadar bahasa pemasaran. Integrasi dengan Gemini 2.0 bermakna Nano Banana Pro bukan sekadar menghasilkan imej berdasarkan padanan corak — ia benar-benar memahami apa yang anda minta. Ia mempunyai pengetahuan dunia. Ia boleh berfikir tentang hubungan spatial, konteks budaya, dan spesifikasi teknikal. Tanya tentang mercu tanda terkenal dan ia tahu gaya seni bina, konteks sejarah, dan cara mewakilkannya dengan tepat.
Rendering Teks Revolusioner
Rendering teks paling canggih dalam pelbagai bahasa dengan ketepatan ejaan yang diperbaiki secara dramatik. Tipografi yang kelihatan benar-benar profesional dalam Latin, CJK, dan skrip lain. Ini sahaja mengubah apa yang mungkin dengan penjanaan imej AI.
Pengetahuan Dunia Yang Mendalam
Dibina di atas keupayaan penaakulan Gemini 2.0 Flash, ia memahami konteks, budaya, dan nuansa. Ia mengetahui rujukan sejarah, gaya seni bina, konsep saintifik, dan nuansa budaya — dan boleh mewakilinya secara visual.
Kawalan Ketepatan
Kawalan tahap studio terhadap pencahayaan, sudut kamera, kedalaman medan, dan komposisi. Jurugambar dan pereka profesional akhirnya boleh mendapatkan hasil yang sepadan dengan visi mereka tanpa regenerasi yang tidak berkesudahan.
Komposisi Berbilang Imej
Gabungkan sehingga 14 imej rujukan menjadi satu komposisi. Kekalkan konsistensi watak, gabungkan gaya, pindahkan elemen antara imej — semua sambil mengekalkan kualiti yang anda mahu simpan.
Output Fleksibel
Resolusi asli 2K dengan output 4K pilihan. Pelbagai nisbah aspek disokong. Buat apa sahaja dari kertas dinding telefon menegak hingga komposisi sinematik ultrawide 21:9.
Penyuntingan Pintar
Ubah suai imej sedia ada dengan arahan teks sambil mengekalkan elemen yang anda mahu simpan. Tukar musim, tukar objek, laraskan pencahayaan — semua tanpa masalah hanyut yang melanda model sebelumnya.
Di Mana Untuk Mengakses Nano Banana Pro
Pada masa ini, Nano Banana Pro tersedia melalui beberapa saluran, masing-masing dengan keupayaan berbeza:
- Aplikasi Gemini: Pilihan paling mudah diakses. Dalam Gemini, dayakan mod "Thinking" dan minta penjanaan imej untuk mengaktifkan Nano Banana Pro. Ini memberi anda keupayaan penuh model dengan antara muka berasaskan perbualan.
- Google AI Studio: Untuk pembangun dan pengguna yang mahukan lebih kawalan. Akses kepada parameter lanjutan dan integrasi dengan aliran kerja tersuai.
- Vertex AI: Akses peringkat perusahaan dengan keupayaan API penuh untuk aplikasi pengeluaran.
- Platform Pihak Ketiga: Perkhidmatan seperti Lovart.ai sering menawarkan akses awal kepada model baru dengan tempoh percubaan percuma.
Petua profesional: Dalam aplikasi Gemini, menjana imej kedua dengan prompt yang sama sering menghasilkan hasil yang lebih baik daripada percubaan pertama. Model nampaknya menggunakan penjanaan pertama sebagai konteks senyap untuk penambahbaikan. Saya telah menjadikannya sebahagian daripada aliran kerja standard saya.
Tiga Penemuan Yang Penting
Walaupun Nano Banana Pro merangkumi berpuluh-puluh penambahbaikan, tiga penemuan khusus mengubah secara asas apa yang mungkin dengan penjanaan imej AI. Memahami ini akan membantu anda memanfaatkan kuasa sebenar model.
Model sebelumnya sama ada tidak dapat menjana imej resolusi tinggi atau memerlukan peningkatan yang sering memperkenalkan artifak. Nano Banana Pro menjana imej 4K asli secara langsung, dengan perincian dan kejelasan terbina dari awal. Ini bukan hanya tentang jumlah piksel — ia tentang perincian asli pada tahap bulu mata individu, corak tenunan kain, dan variasi halus tekstur. Untuk fotografi produk dan kerja komersial, ini mengubah segala-galanya.
Perlukan poster menegak 9:16? Bingkai sinematik 21:9? Persegi sempurna untuk Instagram? Nano Banana Pro mengendalikan sebarang nisbah aspek tanpa masalah komposisi yang melanda model sebelumnya. AI memahami cara menyusun imej dengan betul tanpa mengira format — subjek tidak dipotong dengan janggal, teks tidak meluap, dan keseimbangan visual kekal profesional.
Ini yang besar. Kerana Nano Banana Pro dibina di atas enjin penaakulan Gemini 2.0, ia tidak hanya memadankan corak — ia berfikir tentang apa yang anda minta. Minta rajah seni bina bangunan, dan ia berfikir tentang kejuruteraan struktur. Minta ilustrasi saintifik, dan ia mengambil dari pengetahuan saintifik sebenar. Minta rujukan budaya, dan ia memahami konteks. Keupayaan penaakulan inilah yang membolehkan kebanyakan teknik lanjutan dalam panduan ini.
Revolusi Dalam Rendering Teks
Saya perlu meluangkan sedikit masa pada rendering teks kerana ini adalah keupayaan yang paling mengejutkan saya. Selama bertahun-tahun, penjana imej AI pada dasarnya tidak berguna untuk sebarang kerja serius yang melibatkan teks melebihi perkataan Inggeris mudah. Tipografi kompleks, fon bergaya, dan skrip bukan Latin keluar bercelaru, berulang, kehilangan elemen, atau sekadar salah. Anda boleh mencipta imej cantik dan kemudian perlu membuat semula sepenuhnya sebarang elemen teks di Photoshop.
Nano Banana Pro mengubah ini sepenuhnya. Saya telah membuat poster filem dengan kaligrafi rumit, pembungkusan produk dengan spesifikasi terperinci, infografik dengan teks padat perenggan — semuanya dirender dengan betul. Tipografi bukan sekadar boleh dibaca; ia benar-benar cantik. Gaya fon dihormati. Jarak aksara adalah semula jadi. Keupayaan tunggal ini membuka kategori kerja keseluruhan yang sebelumnya mustahil.
Dan bukan hanya teks bergaya. Rendering teks Inggeris standard juga telah diperbaiki secara dramatik. Teks kecil kekal boleh dibaca. Ketepatan ejaan adalah luar biasa. Anda boleh menyertakan perenggan teks dalam imej dan benar-benar menggunakan hasilnya secara profesional.
Rangka Kerja Prompt Yang Mengubah Segala-galanya
Selepas mencipta beribu-ribu imej dengan Nano Banana Pro, saya telah membangunkan pendekatan berstruktur untuk prompt yang menghasilkan hasil cemerlang secara konsisten. Lupakan teknik sumbat kata kunci lama dari model AI sebelumnya — "masterpiece, ultra-detailed, trending on ArtStation" tidak membantu di sini. Nano Banana Pro bertindak balas kepada kejelasan, struktur, dan kekhususan.
Saya memanggilnya Rangka Kerja ICS: Image type (Jenis Imej), Content (Kandungan), dan Style (Gaya). Setiap prompt berkesan yang saya tulis sekarang mengikuti struktur ini.
IMAGE TYPE (JENIS IMEJ):
- [Jenis imej apa: fotografi, ilustrasi, rajah, poster, mockup UI, dsb.]
- [Penggunaan yang dimaksudkan dan konteks penonton]
CONTENT (KANDUNGAN):
- [Subjek utama dengan butiran khusus]
- [Penerangan latar belakang/persekitaran]
- [Tindakan atau hubungan antara elemen]
- [Sebarang teks yang perlu muncul, dalam petikan]
STYLE (GAYA):
- [Medium: fotografi, cat air, render 3D, vektor, dsb.]
- [Rujukan: \"Fotografi produk Apple\", \"poster perjalanan vintage\", dsb.]
- [Butiran teknikal: lensa kamera, pencahayaan, palet warna]
- [Keperluan kualiti dan resolusi]
Rangka kerja ini memberikan model konteks jelas untuk setiap keputusan visual yang perlu diambilnya.
Prinsip Hierarki
Berikut adalah sesuatu yang kebanyakan panduan tidak akan memberitahu anda: susunan maklumat dalam prompt anda penting. Elemen yang disebut lebih awal mempunyai pengaruh lebih besar terhadap hasil akhir. Saya menstruktur prompt saya dengan elemen paling penting dahulu:
Apakah fokus utama imej? Tentukan dengan jelas dan awal. "Cawan kopi seramik" adalah lebih baik daripada "imej menunjukkan cawan."
Apa yang berlaku? Bagaimana elemen berkaitan antara satu sama lain? "Cawan duduk di meja kayu lusuh, wap naik dari kopi panas."
Di mana ini berlaku? Apa yang mengelilingi subjek? "Cahaya pagi menerangi tingkap kedai kopi, mencipta bayang lembut."
Bagaimana ia harus dirender? Kamera, pencahayaan, atau gaya artistik apa? "Diambil dengan Canon 5D Mark IV, lensa 85mm, f/2.8, gred warna semula jadi."
Tujuh Prinsip Prompt Berkesan
Di luar struktur, prinsip ini mengawal cara saya menulis setiap prompt. Ia adalah perbezaan antara imej yang hampir berfungsi dan imej yang mencapai visi anda dengan tepat.
Struktur Berbanding Kata Kunci
Gunakan susunan konsisten: latar belakang → subjek → butiran → kekangan. Untuk permintaan kompleks, gunakan bahagian berlabel atau jeda baris. Perenggan panjang mengelirukan model; struktur teratur membimbingnya ke arah niat anda.
Kekhususan Berbanding Superlatif
Daripada "kualiti tinggi" atau "sangat terperinci", terangkan sifat visual sebenar. Bahan, tekstur, bentuk, media. "Liang pori kulit boleh dilihat dan bintik halus" mengalahkan "muka sangat terperinci" setiap kali.
Kawalan Komposisi Eksplisit
Namakan pembingkaian anda (closeup, wide shot, panorama), perspektif (aras mata, sudut rendah, sudut Dutch), dan mood pencahayaan (lembut tersebar, golden hour, pencahayaan rim kontras tinggi). Jangan biarkannya kepada nasib.
Kontrak Perubahan vs Pemeliharaan
Untuk penyuntingan, nyatakan secara eksplisit apa yang perlu berubah DAN apa yang perlu kekal tidak berubah. Gunakan "tukar hanya X" dan "kekalkan tepat Y". Ulang senarai pemeliharaan ini dalam setiap iterasi untuk mengelakkan hanyut.
Teks Memerlukan Ketepatan
Letakkan teks yang diperlukan dalam "petikan" atau HURUF BESAR. Tentukan gaya fon, saiz, warna, dan kedudukan. Untuk perkataan sukar atau nama jenama, ejakannya huruf demi huruf. Sentiasa tambah "render tepat sekali, tanpa pendua".
Kejelasan Rujukan Berbilang Imej
Apabila bekerja dengan pelbagai imej input, rujuk setiap satu dengan indeks dan penerangan: "Imej 1: tangkapan produk, Imej 2: rujukan gaya." Nyatakan secara eksplisit bagaimana mereka harus berinteraksi.
Iterasi Berbanding Beban Berlebihan
Mulakan dengan prompt asas yang bersih, kemudian perbaiki dengan perubahan susulan tunggal kecil. "Jadikan pencahayaan lebih hangat." "Keluarkan pokok di latar belakang." Langkah kecil bertambah kepada hasil yang tepat.
Contoh Prompt Praktikal
Mari saya tunjukkan bagaimana rangka kerja ini diterjemahkan ke dalam prompt sebenar merentasi kes penggunaan berbeza:
Potret closeup fotorealistik seorang pembuat tembikar Jepun tua
yang memeriksa mangkuk teh. Cahaya golden hour mengalir melalui tingkap,
mencipta sorotan hangat pada tangan lusuh. Diambil dengan Canon 5D Mark IV
dengan lensa 85mm pada f/2.8. Kedalaman medan cetek dengan latar belakang bokeh.
Gred warna semula jadi, tekstur kulit dan liang pori boleh dilihat. Format 16:9.
Pelekat gaya kawaii panda merah memakai topi buluh.
Garis luar hitam tebal, gaya cel-shading, palet warna pastel
dengan merah jambu dan hijau lembut. Ekspresi comel dengan mata berkilat.
Latar belakang putih untuk pemotongan mudah. Reka bentuk mudah, bersih sesuai
untuk cetakan barang niaga.
Poster artistik untuk misteri film noir. Imej pusat menunjukkan
siluet detektif berlawan tingkap hujan.
Tajuk utama dengan tipografi Art Deco tebal \"SHADOWS OF DOUBT\",
dengan subtajuk serif elegan halus \"Some secrets should stay buried\" di bawah.
Teks kecil kredit pengeluaran di bahagian bawah untuk keaslian.
Semua teks mestilah jelas dan boleh dibaca. Kualiti sinematik, mood atmosfera.
Pencahayaan kontras tinggi dengan bayang dalam dan sorotan dramatik.
Perbezaan utama dengan prompt Nano Banana Pro: terangkan apa yang anda mahu lihat, bukan bagaimana anda mahu rasakan. "Imej indah cantik menakjubkan" tidak memberitahu apa-apa kepada AI. "Cahaya belakang golden hour mencipta bayang panjang di jalan berbatu" memberitahunya tepat apa yang perlu dirender.
Pewarnaan Manga dan Keajaiban Terjemahan
Teknik ini adalah penemuan pertama saya yang membuatkan saya terpukau dengan Nano Banana Pro, dan ia kekal sebagai salah satu keupayaan paling mengagumkan yang pernah saya lihat. Keupayaan untuk mengambil halaman manga hitam-putih, mewarnakannya dan menterjemah teks — semuanya dengan satu prompt — mengubah secara asas aliran kerja untuk peminat manga, penerbit, dan pencipta kandungan.
Begini cara saya menemuinya. Saya selalu sukar membaca manga hitam-putih. Terdapat sesuatu tentang maklumat visual padat tanpa isyarat warna yang menyukarkan saya mengikuti aksi. Saya telah mencuba pelbagai alat pewarnaan, tetapi semuanya memerlukan kerja manual yang ketara dan tidak dapat mengendalikan teks.
Malam pertama dengan Nano Banana Pro, saya memuat naik halaman dari Demon Slayer dan menaip prompt mudah: "Jadikan imej ini berwarna, terjemahkan ke Bahasa Inggeris dan letakkan teks dalam gelembung ucapan yang sesuai, kekalkan segala-galanya sama, dan kemudian berikan saya imej itu."
Apa yang dikembalikan adalah menakjubkan. Warnanya hidup dan sesuai untuk watak — corak hijau kotak Tanjiro dirender dengan sempurna. Teks Jepun dalam gelembung ucapan telah digantikan dengan terjemahan Inggeris yang tepat. Seni garisan dikekalkan. Ia kelihatan seperti keluaran warna rasmi.
Ubah panel manga hitam-putih ini:
1. Warnakan dengan warna bertenaga, sesuai anime
2. Terjemahkan semua teks Jepun ke Bahasa Inggeris
3. Letakkan teks terjemahan dalam gelembung ucapan yang betul
4. Kekalkan semua ekspresi watak asal dan komposisi
5. Kembalikan sebagai imej siap, sedia untuk dicetak
Teknik Manga Lanjutan
Tetapi keajaiban sebenar ialah anda boleh pergi lebih jauh. Jauh lebih jauh. Anda boleh mengubah halaman manga yang sama kepada gaya yang sama sekali berbeza:
// Gaya Mewah 3D
Ubah manga ini menjadi gaya mewah 3D/tekstur kabur.
Kekalkan watak dikenali tetapi render mereka seolah-olah mereka
adalah mainan mewah lembut. Kekalkan gelembung ucapan dan teks.
// Gaya Mozek Zaman Pertengahan
Ubah manga ini menjadi gaya mozek batu zaman pertengahan,
seperti karya seni agama dari gereja kuno. Berikan ia rasa
suci, hormat sambil mengekalkan panel cerita.
// Gaya Relif Gangsa
Tukar halaman manga ini menjadi gaya arca relif gangsa.
Render watak dan adegan seolah-olah mereka timbul dalam
logam gangsa tua, dengan patina dan pencahayaan yang sesuai.
Saya menghabiskan berjam-jam malam pertama itu menjana adegan manga yang sama dalam berpuluh-puluh gaya — ukiran, cat air, seni piksel, claymation. Setiap transformasi mengekalkan struktur cerita sambil membayangkan semula pendekatan visual sepenuhnya. Ini membuka kemungkinan untuk seni peminat, bahan pendidikan, dan projek kreatif yang sebelum ini tidak dapat dicapai.
Petua profesional untuk pewarnaan manga: Nano Banana Pro memahami konvensyen watak anime. Anda tidak perlu menentukan warna rambut untuk watak terkenal — ia tahu Tanjiro mempunyai rambut hitam dengan hujung burgundy dan haori kotak hijau. Pengetahuan terbina ini menjadikan pewarnaan lebih cepat dan lebih tepat.
Reka Bentuk Poster dan Visual Profesional
Reka bentuk poster adalah tempat saya benar-benar mula memahami kuasa rendering teks Nano Banana Pro. Model AI sebelumnya boleh membuat imej yang cantik, tetapi sebaik sahaja anda memerlukan teks — tajuk, kredit, slogan — anda kembali ke kerja manual di Photoshop. Nano Banana Pro mengubah persamaan itu sepenuhnya.
Mari saya tunjukkan beberapa contoh khusus yang menunjukkan apa yang mungkin sekarang:
Poster Filem Sinematik
Cipta poster filem untuk 'Robot Dreams' dalam gaya animasi retro pertengahan abad.
Adegan: Anjing antropomorfik dan robot kelabu-biru berkotak berjalan berpegangan tangan di
pantai berpasir ketika matahari terbenam, melihat ke arah dermaga taman hiburan yang usang dengan roda
ferris dan roller coaster. Langit oren pekat.
Gaya: Ilustrasi rata, garis luar tebal, palet warna retro hangat.
Tipografi: Tajuk \"ROBOT DREAMS\" dalam huruf tebal besar di bahagian tengah atas, warna oren
pekat. Logo festival kecil di bahagian atas. Petikan ulasan putih bertaburan di sekitar
watak.
Mood: Nostalgia, melankolik, menyentuh hati.
Hasilnya kelihatan tidak dapat dibezakan daripada poster filem vintage sebenar. Teksnya bersih dan dijarakkan dengan betul. Gaya ilustrasi konsisten di seluruhnya. Malah butiran halus seperti laurel festival dan petikan ulasan dirender dengan betul.
Poster Berat Tipografi
Di sinilah perkara menjadi sangat mengagumkan. Tipografi kompleks dengan pelbagai fon, saiz, dan gaya yang model AI sebelumnya tidak dapat fahami:
Poster artistik untuk filem \"Dead Poets Society\".
Gaya seni klasik dengan adegan yang menggambarkan detik ikonik
mereka berdiri di atas meja. Tajuk utama dalam kaligrafi tulisan tangan
seni yang mengalir dengan strok elegan dan nipis.
Subtajuk Inggeris \"Carpe Diem\" di bawah dalam sans-serif canggih.
Slogan \"Seize the day\" sebagai elemen teks kecil.
Teks kredit pengeluaran kecil tambahan untuk keaslian.
Semua teks mestilah jelas dan boleh dibaca. Kualiti premium, suasana
sinematik yang menyampaikan kekaguman dan inspirasi.
Poster yang dijana dari prompt ini boleh dengan mudah lulus sebagai kerja studio profesional. Kaligrafi mempunyai variasi berat strok yang betul. Komposisi mengikuti prinsip reka bentuk klasik. Penonton tidak akan pernah menyangka ia dijana AI.
Reka Bentuk Visual Cyberpunk
Untuk reka bentuk kompleks dengan banyak teks, Nano Banana Pro mengendalikan cabaran dengan sangat baik:
Visual utama poster cyberpunk dengan elemen teks padat.
Persekitaran bandar diterangi neon dengan paparan holografik menunjukkan
pelbagai teks dan bacaan data. Subjek utama: watak cybernetic
dengan implan bercahaya. Pelbagai panel teks terapung dengan spesifikasi
teknikal dan label amaran.
Gaya: kontras tinggi, warna neon berlawan latar belakang gelap.
Sertakan kedua-dua teks paparan besar dan teks butiran kecil.
Semua aksara mestilah dibentuk dengan betul dan boleh dibaca.
Format sinematik 16:9.
Petua reka bentuk: Apabila bekerja dengan poster yang banyak teks, sentiasa tentukan "semua teks mestilah jelas dan boleh dibaca" di suatu tempat dalam prompt anda. Ini nampaknya mencetuskan pemeriksaan kualiti tambahan dalam model yang meningkatkan ketepatan rendering teks.
Visualisasi Pengetahuan dan Rajah
Kerana Nano Banana Pro dibina di atas keupayaan penaakulan Gemini 2.0, ia boleh mencipta rajah pendidikan dan visualisasi pengetahuan yang benar-benar masuk akal. Ini bukan sekadar tentang rendering imej cantik — ia tentang mewakili maklumat kompleks dengan tepat.
Saya mengujinya dengan memintanya membuat rajah struktur bangunan bersejarah terkenal. Tanpa memberikan imej rujukan, saya hanya bertanya:
Cipta rajah struktur terperinci katedral gothic
dengan teks penjelasan komprehensif. Tunjukkan sistem buttress,
susun atur nave dan transept, dan ketinggian berbilang tingkat.
Sertakan anotasi terperinci yang menerangkan teknik pembinaan
yang membolehkan struktur zaman pertengahan ini bertahan selama berabad-abad.
Semua teks mestilah jelas dan boleh dibaca.
Hasilnya menakjubkan. Rajah itu menunjukkan keajaiban kejuruteraan struktur seni bina gothic dengan tepat. Perkadaran sepadan dengan bangunan sebenar. Dan anotasi memberikan maklumat sejarah dan kejuruteraan yang tepat. Ini adalah keupayaan penaakulan dalam tindakan — model benar-benar tahu tentang sejarah seni bina dan boleh mewakili pengetahuan itu secara visual.
Dokumentasi Kraf Tradisional
Satu lagi aplikasi hebat ialah mendokumenkan kraf dan teknik tradisional:
Cipta panduan visual terperinci untuk teknik sulaman sashiko Jepun tradisional.
Tunjukkan corak jahitan berbeza dengan
contoh dekat. Sertakan palet warna indigo dan putih tradisional.
Tunjukkan sudut jarum dan ketegangan benang untuk mencapai kesan
berbeza. Tambah teks penjelasan komprehensif yang merangkumi sejarah dan
variasi serantau kraf ini. Gaya infografik pendidikan
dengan susun atur bersih.
Rajah Konsep Teknikal
Untuk fiksyen sains dan kerja konsep, Nano Banana Pro boleh menjana dokumentasi teknikal yang mengagumkan:
Rajah teknikal pandangan meletup terperinci mata prostetik cyberpunk.
Tunjukkan semua komponen dalaman: sensor optik, sambungan antara muka saraf,
bekalan kuasa, unit pemprosesan, mekanisme pelarasan.
Labelkan setiap komponen dengan spesifikasi teknikal. Sertakan pandangan keratan rentas
yang menunjukkan bagaimana ia bersambung dengan saraf optik. Render fotorealistik
dengan anotasi lukisan kejuruteraan. Reka bentuk futuristik tetapi
masuk akal secara saintifik.
Tahap perincian dalam rajah teknikal ini menyaingi apa yang akan dihasilkan oleh artis konsep profesional, tetapi dijana dalam beberapa saat. Untuk pereka permainan, penulis fiksyen sains, dan artis konsep, ini adalah alat prototaip pantas yang luar biasa.
Keupayaan Penyelesaian Matematik Yang Luar Biasa
Ini benar-benar mengejutkan saya. Nano Banana Pro bukan sekadar menjana imej — ia boleh menyelesaikan masalah matematik dan merender proses penyelesaian sebagai halaman kerja tulisan tangan. Enjin penaakulan di belakang penjanaan imej benar-benar bekerja melalui logik matematik.
Saya mengujinya dengan masalah geometri yang melibatkan segitiga dan pengiraan sudut. Saya memuat naik tangkapan skrin masalah dan memberi prompt:
Drafkan helaian kertas conteng yang menunjukkan penyelesaian lengkap
kepada masalah matematik ini. Tunjukkan semua kerja termasuk rajah,
persamaan, dan pengiraan langkah demi langkah. Jadikan ia kelihatan
seperti tulisan tangan pelajar asli dengan variasi semula jadi.
Sertakan lakaran geometri di mana relevan.
Apa yang dikembalikan adalah halaman matematik tulisan tangan yang realistik, lengkap dengan:
- Rajah geometri dengan sudut dan sisi dilabel
- Manipulasi algebra langkah demi langkah
- Teorem dan formula yang digunakan dengan betul
- Jawapan akhir yang dibulatkan
- Ketidaksempurnaan penulisan semula jadi yang menjadikannya kelihatan tulen
Dan inilah perkaranya — matematik itu sebenarnya betul. Model itu tidak sekadar membuat sesuatu yang kelihatan seperti penyelesaian; ia bekerja melalui penaakulan matematik sebenar dan sampai kepada jawapan yang betul. Untuk pencipta kandungan pendidikan, perkhidmatan tunjuk ajar, atau sesiapa sahaja yang perlu menunjukkan kerja matematik, ini luar biasa.
Amaran Penting
Walaupun Nano Banana Pro berjaya menyelesaikan matematik kebanyakan masa, anda harus sentiasa mengesahkan penyelesaian untuk apa-apa yang penting. Penaakulan itu mengagumkan tetapi tidak sempurna. Saya kadang-kadang melihat ralat dalam masalah berbilang langkah yang kompleks.
Penukaran Kertas ke Papan Putih
Salah satu aplikasi paling praktikal yang saya temui ialah menukar kandungan format panjang — kertas penyelidikan, artikel, dokumentasi teknikal — menjadi ringkasan visual papan putih. Teknik ini diketengahkan oleh penyelidik di X (dahulunya Twitter) dan telah menjadi salah satu aliran kerja kegemaran saya.
Pendekatan asasnya mudah: sediakan dokumen teks (sama ada sebagai PDF dimuat naik, teks ditampal, atau melalui tangkapan skrin) dan minta ringkasan visual gaya papan putih:
Ubah kertas penyelidikan/artikel ini menjadi foto papan putih terperinci
yang menunjukkan konsep utama, hubungan, dan penemuan.
Gunakan gaya tulisan tangan semula jadi dengan:
- Kotak dan bekas untuk konsep utama
- Anak panah menunjukkan hubungan dan aliran
- Titik peluru untuk butiran utama
- Rajah mudah di mana membantu
- Pengekodan warna untuk tema berbeza
Jadikan ia kelihatan seperti papan putih sebenar yang difoto
dengan pencahayaan dan perspektif realistik. Sertakan semua maklumat
penting dalam susun atur hierarki yang mudah dibaca.
Saya mencubanya dengan kertas teknikal panjang mengenai seni bina LLaMA 3. Nano Banana Pro menjana ringkasan papan putih yang menangkap inovasi utama, keputusan seni bina, pendekatan latihan, dan keputusan penanda aras — semuanya dalam format yang boleh difahami dengan sepintas lalu.
Aplikasinya sangat luas:
- Pelajar: Menukar nota kuliah atau bab buku teks menjadi alat bantu belajar visual
- Penyelidik: Mencipta ringkasan visual pantas kertas untuk pembentangan
- Guru: Menjana penjelasan gaya papan tanpa benar-benar menulis di papan
- Pencipta kandungan: Menukar kandungan bertulis menjadi format visual yang menarik
Seperti yang dicatat oleh seorang penyelidik, keupayaan ini pada dasarnya boleh menggantikan keperluan untuk guru menulis penjelasan di papan putih secara manual — walaupun saya akan berpendapat ia paling baik digunakan sebagai tambahan dan bukannya penggantian.
Penciptaan Antaramuka Permainan
Nano Banana Pro jelas telah dilatih pada korpus besar rakaman permainan dan tangkapan skrin, kerana keupayaannya untuk menjana antaramuka permainan yang meyakinkan adalah luar biasa. Ini melangkaui mockup mudah — ia memahami konvensyen UI permainan, elemen khusus genre, dan malah variasi serantau dalam reka bentuk permainan.
Permainan Eksplorasi Laut Dalam
Cipta tangkapan skrin dari permainan eksplorasi laut dalam serupa dengan Dave the Diver.
Adegan: Penyelam menghadapi makhluk besar yang tidak diketahui di dalam jurang.
Elemen UI:
- Tolok kedalaman menunjukkan 850m
- Meter oksigen pada 40%
- Slot inventori di kiri bawah
- Peta mini di sudut kanan atas
- Amaran \"AMARAN: Bentuk kehidupan tidak diketahui dikesan\"
Gaya: Seni piksel dengan kesan pencahayaan moden, kabus atmosfera, makhluk bioluminescent.
Tangkapan Skrin Permainan FPS
Cipta tangkapan skrin dari penembak orang pertama gaya Call of Duty,
tetapi musuhnya adalah anjing Shiba Inu (meme Cheems). Antaramuka FPS penuh
dengan retikel, kaunter peluru, peta mini, bar kesihatan, dan penunjuk
killstreak. Cheems harus berada dalam peralatan taktikal. Gaya grafik
fotorealistik dengan pencahayaan sinematik. Sertakan penanda hit dan
kabur gerakan sedikit untuk rasa aksi.
Gabungan mekanik permainan serius dengan humor tidak masuk akal ini mencipta hasil lucu yang kelihatan benar-benar tulen. Elemen UI diletakkan dengan sempurna dan digayakan sesuai untuk genre tersebut.
Antaramuka Permainan MOBA
Di sinilah perkara menjadi sangat menarik ialah pemahaman Nano Banana Pro tentang budaya khusus permainan. Apabila diminta untuk menjana antaramuka League of Legends atau MOBA serupa yang menunjukkan pemain berinteraksi dalam sembang, ia menjana dialog yang sesuai dengan konteks:
Cipta tangkapan skrin dalam permainan League of Legends yang menunjukkan pertarungan
pasukan yang sengit sedang berlaku. Di kawasan sembang (kiri bawah), tunjukkan pemain
mempunyai pertengkaran sengit mengenai strategi permainan. Sertakan elemen UI MOBA tipikal:
bar keupayaan, peta mini, papan skor, slot item. Sembang harus
kelihatan seperti tingkah laku pemain tulen semasa perlawanan kompetitif.
Model memahami konteks budaya komuniti permainan yang berbeza dan mewakilinya dengan tepat — kadang-kadang dengan menyakitkan hati. Untuk pereka permainan, pencipta kandungan, dan sesiapa sahaja dalam ruang permainan, ini adalah keupayaan yang sangat berguna.
Rendering Produk dan Fotografi
Fotografi produk adalah tempat gabungan rendering teks, kawalan pencahayaan, dan kecerdasan komposisi Nano Banana Pro benar-benar bersinar. Keupayaan meletakkan produk dalam sebarang persekitaran sambil mengekalkan konsistensi jenama membuka aliran kerja yang akan menjadi mahal atau mustahil dengan fotografi tradisional.
Contoh Kulit Album
Mari saya tunjukkan contoh terperinci yang menunjukkan keupayaan penuh. Saya bermula dengan idea mudah: kulit album fiksyen. Pertama, saya menjana CD dan bekasnya:
Cipta tangkapan produk album CD. Tajuk album
\"MIDNIGHT ECHOES\" dalam tipografi moden bergaya. Kulit album menunjukkan
imej surealis, seperti mimpi menggabungkan elemen siber dan organik.
Sertakan kedua-dua CD dan bekas permata. Pencahayaan studio,
latar belakang putih bersih, gaya fotografi produk.
Di sinilah perkara menjadi menarik. Dengan produk ini ditubuhkan, saya boleh meletakkannya dalam sebarang persekitaran sambil mengekalkan konsistensi sempurna:
// Kedai Rekod 90-an
Letakkan produk CD ini di rak kayu di kedai rekod
tahun 1990-an. Dikelilingi oleh rekod vinil dan kaset lama. Pencahayaan
tungsten hangat, pantulan tanda neon di latar belakang,
zarah debu terapung di udara. Suasana nostalgia.
// Pengapungan Surealis
CD terapung di udara dikelilingi oleh serpihan kaca hancur
dan gear jam terapung. Konsep: \"mimpi\" dan
\"perjalanan masa\". Pencahayaan sinematik, komposisi dramatik.
// Adegan Pemain CD
CD sedang dimasukkan ke dalam pemain CD mudah alih. Bekas CD
berdiri berdekatan. Cahaya matahari terbenam lewat petang melalui langsir.
Permukaan meja kayu. Mood hangat, kontemplatif.
// Adegan Konsert
Letakkan produk ini dalam persekitaran konsert stadium.
Tenaga orang ramai, pencahayaan pentas, skrin besar di latar belakang.
CD kelihatan mustahil besar, seperti prop pentas konsert.
Dalam setiap persekitaran, teks pada CD kekal tajam dan boleh dibaca. Produk mengekalkan identiti visualnya sambil menyesuaikan diri secara semula jadi dengan setiap keadaan pencahayaan dan konteks baru. Untuk e-dagang, kempen pemasaran, atau visualisasi jenama, ini adalah revolusioner.
Tangkapan Produk Teknikal
Untuk fotografi produk yang lebih teknikal, Nano Banana Pro mengendalikan butiran yang penting:
iPhone 17 Pro, Cosmic Orange, sudut belakang 45 darjah menekankan reka bentuk belakang
dan modul kamera.
Latar belakang: Corak abstrak estetik teknologi kecerunan lembut dengan gerakan
mengalir semula jadi dan suasana seni moden. Elakkan hitam tulen. Tekankan interaksi cahaya-bayang
dan peralihan warna halus.
Elemen teks terapung di sekeliling peranti: \"A19 Pro Chip\", \"8x Optical Zoom\",
\"48MP Rear Camera\" — susun atur terapung moden, kotak teks lutsinar, estetik
bersih dan maju teknologi.
Keseluruhan: Dinamik, futuristik, kualiti fotografi produk profesional.
Penemuan Manik Perler
Ini adalah kejadian yang benar-benar tidak disengajakan. Saya sedang bereksperimen dengan gaya kraf yang berbeza apabila saya terjumpa keupayaan Nano Banana Pro yang luar biasa untuk menjana seni manik perler (juga dikenali sebagai manik fius atau manik hama). Hasilnya sangat konsisten dan comel sehingga ia menjadi salah satu gaya estetik kegemaran saya.
Seni manik perler 3D: kotak paparan mengandungi figura indah.
Gaya: Render fotorealistik menunjukkan tekstur manik individu, kemasan
berkilat, pencahayaan fotografi produk profesional.
Sertakan: Corak grid manik yang kelihatan, bayang halus antara manik, ketidaksempurnaan
ringan untuk keaslian.
Model memahami bahawa manik perler mempunyai ciri khusus — bentuk silinder, jurang kecil antara manik, cara ia bergabung di titik sambungan. Ia merender butiran ini dengan tepat sambil mengekalkan estetik comel yang menjadikan gaya kraf ini begitu menarik.
Variasi yang berfungsi dengan baik:
- Anjing manik perler: Baka berbeza diwakili dalam estetik seni piksel-bertemu-kraf
- Kucing manik perler dengan carta warna: Tunjukkan watak di sebelah warna manik yang digunakan
- Diorama manik perler: Adegan penuh dibina dari estetik manik fius
- Rantai kunci manik perler: Reka bentuk lebih kecil sesuai untuk mockup barang niaga
Untuk pereka corak kraf, pencipta barang niaga, atau sesiapa sahaja yang menyukai estetik comel ini, Nano Banana Pro adalah lombong emas.
Poster Promosi Bandar
Pengetahuan dunia Nano Banana Pro meluas ke geografi dan mercu tanda. Ia mengetahui bangunan ikonik bandar utama dan boleh menyusunnya menjadi bahan promosi yang kohesif. Ini amat mengagumkan untuk bandar dengan warisan seni bina yang kompleks.
Cipta poster promosi untuk New York City. Latar belakang menampilkan
mercu tanda ikonik: Empire State Building, Statue of Liberty, Brooklyn Bridge,
One World Trade Center, Times Square. Mercu tanda harus mempunyai
hierarki visual dengan penekanan utama dan sekunder yang jelas.
Gaya ilustrasi garisan bersih dengan skema warna berani.
Tipografi besar tengah: \"NEW YORK\" dengan teks lebih kecil \"The City
That Never Sleeps\" berdekatan. Slogan di bawah: \"Where Dreams Take Flight\".
Sertakan elemen moden seperti teksi kuning dan pintu masuk kereta api bawah tanah untuk
menunjukkan NYC kontemporari.
Komposisi bersih, mengalir dengan susunan elemen semula jadi.
Tekankan gabungan mercu tanda sejarah dan tenaga moden.
Suasana dinamik, metropolitan.
Model mengiktiraf dan merender ciri tersendiri setiap mercu tanda dengan betul — puncak Art Deco Empire State Building, patina tembaga Lady Liberty, menara gothic Jambatan Brooklyn. Ia juga memahami bahasa visual pemasaran pelancongan dan menggunakan gaya yang sesuai.
Storyboard Komik dan Seni Berurutan
Untuk pencipta yang bekerja pada komik, manga atau storyboard, keupayaan Nano Banana Pro untuk menjana urutan berbilang panel adalah penjimatan masa yang besar. Ia memahami aliran naratif, komposisi panel dan cara memvisualisasikan rentak emosi.
Cipta urutan manga 5 panel yang menggambarkan pertempuran epik:
Panel 1: Hero berdiri di puncak gunung. Penjahat muncul dari bayang-bayang.
Suasana tegang.
Panel 2: Mata mereka bertemu. Pertempuran hampir berlaku. Komposisi skrin terpisah dekat.
Panel 3: Pertempuran sengit. Kilat menyambar. Hero menyerang dengan senjata
bercahaya, Penjahat membalas dengan tenaga gelap.
Panel 4: Pertembungan di udara. Gelombang tenaga meletup ke luar. Pose aksi dinamik.
Panel 5: Kedua-dua pahlawan berhadapan antara satu sama lain. Mata Hero menunjukkan keazaman,
Penjahat menunjukkan emosi kompleks.
Gaya: Gaya aksi manga Shonen. Kontras tinggi. Garisan kelajuan. Bayang dramatik.
Model memahami perbendaharaan kata visual manga — garisan kelajuan, bingkai impak, dekat emosi, sudut dinamik. Ia mengekalkan konsistensi watak di seluruh panel dan mencipta aliran naratif tulen dan bukannya lima imej yang tidak berkaitan.
Saya telah mengujinya dengan pelbagai senario:
- Adegan perpisahan emosi — nada melankolik, menyentuh hati
- Detik ikatan guru-murid — kontemplatif, kompleks
- Watak asal dalam senario slice-of-life
- Urutan aksi dalam gaya bukan anime
Had utama yang saya perhatikan: kadang-kadang panel 1 dan 2 atau 4 dan 5 mungkin terlalu serupa jika prompt tidak menentukan perbezaan yang mencukupi. Menambah elemen visual atau sudut kamera yang berbeza pada setiap keterangan panel membantu mengelakkan ini.
Kualiti 4K dan Kerja Terperinci
Keupayaan output asli 4K Nano Banana Pro bukan hanya tentang nombor resolusi — ia tentang tahap perincian yang dimungkinkan. Untuk fotografi jarak dekat, tangkapan produk dan sebarang aplikasi di mana perincian halus penting, ini mengubah apa yang boleh dicapai.
Cipta foto makro 4K yang sangat terperinci bagi rama-rama
Monarch yang berehat di atas bunga kuning. Fokus tepat pada
sisik sayap dan tekstur, menunjukkan sisik individu yang
membentuk corak. Tangkap tekstur kelopak dalam tahap perincian yang sama.
Pencahayaan tersebar lembut, kedalaman medan cetek dengan bokeh
latar belakang berkrim. Palet warna semula jadi dengan sedikit kehangatan.
Ketepatan saintifik dalam anatomi rama-rama. Jenis tangkapan yang
akan memenangi pertandingan fotografi alam semula jadi.
Apabila anda zum masuk pada imej yang dihasilkan, anda boleh melihat sisik sayap individu, butiran debunga dan struktur sel kelopak bunga. Tahap perincian ini sebelum ini hanya boleh dicapai dengan peralatan fotografi makro khusus dan pasca pemprosesan yang ketara.
Bila Menggunakan 4K
Kualiti Standard
Penjanaan pantas (3-5 saat) dengan kualiti hebat untuk kebanyakan kes penggunaan:
- Penerokaan konsep dan percambahan fikiran
- Kandungan media sosial
- Draf awal sebelum penghalusan akhir
- Keperluan penjanaan volum tinggi
- Komposisi mudah tanpa teks halus
Kualiti Tinggi / 4K
Masa penjanaan dilanjutkan (8-15 saat) untuk kesetiaan maksimum:
- Imej pengeluaran akhir
- Teks padat dan kerja tipografi
- Infografik kompleks dengan butiran kecil
- Potret fotorealistik
- Bahan sedia untuk dicetak
Untuk percambahan fikiran dan iterasi, kekal dengan resolusi lalai untuk mengekalkan gelung maklum balas pantas.
Konsistensi Watak Merentasi Pelbagai Imej
Salah satu masalah yang paling sukar secara sejarah dalam penjanaan imej AI ialah mengekalkan konsistensi watak merentas pelbagai imej. Anda akan mencipta watak yang anda suka, kemudian cuba meletakkannya dalam pose atau persekitaran yang berbeza, dan tiba-tiba mereka kelihatan seperti orang yang sama sekali berbeza.
Nano Banana Pro membuat kemajuan ketara dalam masalah ini melalui keupayaan input berbilang imejnya. Anda boleh memberikan imej rujukan dan model akan mengekalkan identiti dalam penjanaan baru.
Langkah 1: Menubuhkan Watak
\"Cipta helaian rujukan watak untuk Orang 1: seorang wanita Asia
berusia 30 tahun dengan rambut hitam separas bahu, mata coklat hangat dan senyuman
mesra. Tunjukkan pandangan depan, profil sisi dan sudut tiga suku.\"
Langkah 2: Menjana Adegan
\"Orang 1 duduk di meja kafe, membaca buku. Cahaya pagi
melalui tingkap. Pakaian kasual.\"
Langkah 3: Menukar Konteks
\"Orang 1 kini berada dalam mesyuarat perniagaan, memakai pakaian profesional.
Watak yang sama, persekitaran berbeza.\"
Langkah 4: Berbilang Watak
\"Orang 1 dan Orang 2 (tubuhkan Orang 2 dahulu) berjalan bersama
di taman. Pencahayaan petang musim luruh.\"
Aliran kerja ini transformatif untuk:
- E-dagang fesyen: Menunjukkan model yang sama dalam pelbagai pakaian tanpa penggambaran mahal
- Reka bentuk watak: Meneroka variasi sambil mengekalkan identiti
- Penciptaan komik/manga: Mengekalkan protagonis konsisten merentas adegan
- Kandungan influencer maya: Mencipta persona konsisten merentas siaran
- Penciptaan aset permainan: Watak dalam pelbagai pose dan ekspresi
Petua profesional untuk konsistensi watak: Apabila memberikan imej rujukan, sertakan sekurang-kurangnya satu tangkapan muka hadapan yang diterangi dengan baik. Model menggunakannya untuk menambat identiti. Sudut tambahan membantu tetapi tidak begitu kritikal seperti rujukan utama ini.
Templat Adegan Rasmi Google
Google telah menyediakan templat prompt rasmi untuk kes penggunaan biasa. Saya telah mengujinya secara meluas dan ingin berkongsi versi yang diperhalusi berdasarkan hasil dunia nyata. Setiap templat mengikuti struktur konsisten yang model bertindak balas dengan andal.
Templat Fotografi Fotorealistik
Struktur: Jenis Tangkapan + Subjek + Tindakan/Ekspresi + Persekitaran + Pencahayaan + Parameter Kamera + Nisbah Aspek
Satu [jenis tangkapan] fotorealistik [subjek], [tindakan atau ekspresi],
ditetapkan di [persekitaran]. Adegan diterangi oleh [penerangan pencahayaan],
mencipta suasana [mood]. Ditangkap dengan [butiran kamera/lensa],
menekankan [tekstur dan butiran utama]. Imej harus dalam
format [nisbah aspek].
Potret closeup fotorealistik seorang pembuat tembikar Jepun tua
yang memeriksa mangkuk teh, cahaya golden hour mengalir dari tingkap
di sebelah kiri, mencipta suasana kontemplatif. Ditangkap dengan lensa
85mm pada f/2.8, menekankan tekstur kulit, tangan lusuh dan
glaze seramik. Format 16:9.
Templat Ilustrasi dan Pelekat
Struktur: Gaya + Subjek + Ciri Utama + Palet Warna + Gaya Garisan + Latar Belakang
Satu pelekat [gaya] seekor [subjek], menampilkan [ciri utama]
dan [palet warna]. Reka bentuk harus mempunyai [gaya garisan] dan
[gaya lorekan]. Latar belakang harus [keperluan latar belakang].
Templat Reka Bentuk Jenama
Struktur: Jenis Imej + Jenama/Konsep + Kandungan Teks + Tipografi + Gaya Reka Bentuk + Skema Warna
Cipta [jenis imej] untuk [jenama/konsep] dengan teks \"[teks tepat]\"
dalam [gaya fon]. Reka bentuk harus [penerangan gaya], dengan
[skema warna]. Sertakan [elemen reka bentuk tambahan]. Rasa keseluruhan
harus menyampaikan [nilai jenama/mesej].
Templat Fotografi Produk
Struktur: Penerangan Produk + Latar Belakang + Persediaan Pencahayaan + Sudut Kamera + Butiran Utama + Nisbah Aspek
Foto produk resolusi tinggi, diterangi studio bagi [penerangan produk]
di atas [permukaan latar belakang]. Pencahayaan adalah [persediaan pencahayaan] untuk
[tujuan pencahayaan]. Sudut kamera adalah [jenis sudut] untuk menyerlahkan
[ciri tertentu]. Sangat realistik, dengan fokus tajam pada [butiran utama].
[Nisbah aspek].
Templat Ruang Negatif Minimalis
Struktur: Kedudukan Subjek + Ruang Latar Belakang Kosong + Pencahayaan + Nisbah Aspek
Komposisi minimalis yang menampilkan satu [subjek] diletakkan
di [kedudukan: kanan bawah/kiri atas/dsb.] bingkai.
Latar belakang adalah kanvas [warna] kosong yang luas, mencipta ruang
negatif yang ketara. Pencahayaan lembut, bersahaja dari [arah]. [Nisbah aspek].
Templat Panel Komik
Struktur: Gaya Seni + Watak/Aksi Depan + Tetapan Latar Belakang + Dialog/Kapsyen + Mood
Satu panel komik tunggal dalam gaya [gaya seni]. Di hadapan,
[penerangan watak dan aksi]. Di latar belakang, [butiran tetapan].
Panel mempunyai [kotak dialog/kapsyen] dengan teks \"[teks tepat]\".
Pencahayaan mencipta mood [mood]. [Nisbah aspek].
Teknik Penyuntingan Imej Lanjutan
Di luar penjanaan teks-ke-imej, Nano Banana Pro cemerlang dalam mengubah suai imej sedia ada. Kuncinya ialah memahami cara menerangkan suntingan anda dengan jelas sambil menentukan apa yang mesti kekal tidak berubah.
Kontrak Perubahan vs Pemeliharaan
Semasa menyunting imej, saya menggunakan struktur khusus yang menumpukan pada kejelasan tentang apa yang patut dan tidak patut berubah:
KEEP (KEKALKAN): [Elemen yang mesti kekal tidak berubah]
- \"Kekalkan ciri muka dan ekspresi orang itu dengan tepat\"
- \"Kekalkan arah dan intensiti pencahayaan asal\"
CHANGE (TUKAR): [Pengubahsuaian khusus diperlukan]
- \"Gantikan latar belakang dengan adegan pantai matahari terbenam\"
- \"Tukar warna baju dari biru ke merah\"
HOW (BAGAIMANA): [Arah gaya dan kualiti]
- \"Pastikan integrasi pencahayaan semula jadi\"
- \"Padankan gred warna imej asal\"
CONSTRAINTS (KEKANGAN): [Apa yang perlu dielakkan]
- \"Jangan ubah sebarang ciri muka\"
- \"Elakkan menukar arah bayang\"
Menambah dan Membuang Elemen
Menggunakan imej [subjek] yang disediakan, sila tambah [elemen]
ke dalam adegan. Letakkannya [penerangan lokasi]. Pastikan penambahan
[penerangan integrasi: sepadan pencahayaan, sepadan perspektif, dsb.].
Kekalkan semua elemen lain tepat seperti yang muncul dalam asal.
Menggunakan imej kucing saya ini, tambah topi ahli sihir rajut kecil
di kepalanya. Topi harus duduk secara semula jadi, sepadan dengan pencahayaan
lembut foto. Kekalkan ekspresi kucing, pose dan
semua elemen latar belakang tidak berubah.
Pemindahan Gaya
Ubah foto [subjek] yang disediakan ke dalam gaya
artistik [artis/gerakan seni]. Kekalkan komposisi asal
tetapi render semua elemen dengan [penerangan elemen gaya].
Contoh: Ubah foto jalan bandar moden pada waktu malam ini
ke dalam gaya \"Starry Night\" Vincent van Gogh. Kekalkan komposisi
bangunan dan kereta tetapi render segala-galanya dengan berpusar, impasto
brushwork dan palet dramatik biru dalam dan kuning terang.
Komposisi Berbilang Imej
Cipta imej baru menggabungkan elemen dari imej yang disediakan.
Ambil [elemen dari Imej 1] dan letakkannya dengan/di [elemen dari Imej 2].
Imej akhir harus [penerangan hasil yang diingini].
Contoh: Gabungkan imej ini - ambil kapal roket dari Imej 1
dan letakkannya melancarkan dari pantai pulau tropika dalam Imej 2.
Imej akhir harus menunjukkan adegan pantai yang aman dengan roket
melancarkan secara dramatik di latar belakang, pencahayaan matahari terbenam.
Peliharaan Identiti Kesetiaan Tinggi
Untuk suntingan di mana mengekalkan identiti muka adalah kritikal:
Menggunakan imej yang disediakan, letakkan [elemen dari Imej 2] pada
[subjek dalam Imej 1]. Pastikan ciri [subjek] kekal
tidak berubah sepenuhnya — struktur muka, ekspresi dan
perkadaran yang sama. Elemen tambahan harus menyatu secara semula jadi dengan
[penerangan keperluan integrasi].
Contoh: Ambil wanita dengan rambut coklat dan mata biru dari Imej 1.
Tambah logo dari Imej 2 pada t-shirt hitamnya. Kekalkan muka
dan ciri-cirinya tepat tidak berubah. Logo harus kelihatan semula jadi
dicetak pada kain, mengikuti lipatan baju.
Lakaran ke Realiti
Ubah lakaran kasar [medium: pensel/penanda/digital] [subjek] ini
menjadi imej siap [penerangan gaya]. Kekalkan
[ciri khusus untuk dikekalkan] dari lakaran tetapi tambah
[butiran/bahan/kemasan baru].
Contoh: Ubah lakaran pensel kasar kereta futuristik ini
menjadi foto bilik pameran yang digilap bagi kereta prototaip akhir.
Kekalkan garisan anggun dan profil rendah dari lakaran tetapi tambah
cat biru logam dan pencahayaan rim neon.
Kesilapan Yang Membunuh Hasil Saya
Belajar apa yang TIDAK patut dilakukan adalah sama pentingnya dengan belajar apa yang patut dilakukan. Berikut adalah kesilapan yang secara konsisten menghasilkan keputusan buruk sehingga saya mengenal pasti dan menghapuskannya.
Kesilapan 1: Sumbat Kata Kunci
Apa yang saya buat: Menambah kata kunci kualiti seperti "masterpiece, ultra-detailed, 8K, trending on ArtStation, unreal engine" pada setiap prompt.
Kenapa ia gagal: Nano Banana Pro dilatih secara berbeza daripada model lama. Kata kunci ini sama ada tidak mempunyai kesan atau sebenarnya boleh mengelirukan model tentang niat sebenar anda.
Pendekatan lebih baik: Fokus pada kekhususan deskriptif dan bukannya kata kunci kualiti. Terangkan dengan tepat apa yang anda mahu lihat.
Kesilapan 2: Prompt Negatif
Apa yang saya buat: Menulis "no blur, no artifacts, no deformed hands, no extra fingers."
Kenapa ia gagal: Nano Banana Pro tidak menyokong prompt negatif dengan cara yang sama seperti model penyebaran. Memberitahunya apa yang tidak patut dilakukan sebenarnya boleh memperkenalkan elemen tersebut.
Pendekatan lebih baik: Terangkan apa yang anda mahu secara positif. Daripada "no blur," katakan "sharp focus."
Kesilapan 3: Rujukan Gaya Kabur
Apa yang saya buat: Menulis "beautiful image, stunning, amazing, gorgeous."
Kenapa ia gagal: Perkataan ini tidak memberikan maklumat yang boleh diambil tindakan. Apa yang menjadikan sesuatu "cantik" adalah subjektif.
Pendekatan lebih baik: Terangkan sifat visual tertentu. "Warm color palette with golden highlights" memberitahu model dengan tepat apa yang perlu dirender.
Kesilapan 4: Mengabaikan Nisbah Aspek
Apa yang saya buat: Tidak menentukan nisbah aspek dan kemudian cuba memotong hasil agar sesuai dengan keperluan saya.
Kenapa ia gagal: Model menyusun imej secara berbeza berdasarkan nisbah aspek. Komposisi persegi mempunyai keseimbangan berbeza daripada tangkapan lebar sinematik.
Pendekatan lebih baik: Sentiasa tentukan nisbah aspek sasaran anda di hadapan. "16:9 horizontal," "9:16 vertical," "1:1 square."
Kesilapan 5: Prompt Terlalu Rumit
Apa yang saya buat: Cuba menentukan setiap butiran yang mungkin dalam satu prompt besar.
Kenapa ia gagal: Melebihi kerumitan tertentu, elemen mula hilang atau bercanggah antara satu sama lain.
Pendekatan lebih baik: Mulakan dengan elemen teras, jana, kemudian perbaiki melalui perbualan dengan tindakan susulan yang disasarkan.
Kesilapan 6: Melupakan Mod Berfikir
Apa yang saya buat: Menggunakan mod standard untuk komposisi kompleks.
Kenapa ia gagal: Mod standard tidak melibatkan keupayaan penaakulan penuh untuk permintaan rumit.
Pendekatan lebih baik: Untuk komposisi kompleks, dayakan mod berfikir. Ini membolehkan model menganalisis hubungan spatial secara mendalam sebelum menjana.
Pengajaran meta: Nano Banana Pro adalah rakan perbualan, bukan mesin slot. Layan ia seperti anda mengarahkan artis yang sangat berkebolehan — berikan arahan jelas, periksa hasil, perbaiki secara kolaboratif. Pendekatan iteratif mengalahkan cubaan untuk mendapatkan kesempurnaan dalam satu prompt tunggal.
Integrasi API untuk Pembangun
Untuk pembangun yang ingin mengintegrasikan Nano Banana Pro ke dalam aplikasi, API tersedia melalui Google AI Studio dan Vertex AI. Berikut adalah butiran teknikal utama:
Permintaan Penjanaan Asas
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_images(
model='imagen-3.0-generate-002', # Nano Banana Pro
prompt='A photorealistic portrait of a robot barista...',
config=types.GenerateImagesConfig(
number_of_images=1,
aspect_ratio='16:9',
output_mime_type='image/jpeg'
)
)
# Access the generated image
image_data = response.generated_images[0].image.image_bytes
Permintaan Penyuntingan Imej
response = client.models.edit_image(
model='imagen-3.0-capability-001',
prompt='Change the background to a sunset beach...',
reference_images=[open('original.png', 'rb')],
config=types.EditImageConfig(
edit_mode='INPAINT',
number_of_images=1,
input_fidelity='high', # Critical for identity preservation
output_mime_type='image/png'
)
)
Tetapan input_fidelity='high' meningkatkan pemeliharaan identiti secara dramatik apabila membuat suntingan pada imej dengan muka atau butiran penting.
Parameter Utama
aspect_ratio: "1:1", "16:9", "9:16", "4:3", "3:4", "21:9"number_of_images: 1-4 imej setiap permintaanoutput_mime_type: "image/jpeg" atau "image/png"input_fidelity: "low" (lebih cepat) atau "high" (pemeliharaan identiti lebih baik)safety_filter_level: Mengawal ketegasan penapisan kandungan
Had Kadar dan Kuota
Sedar akan had penggunaan:
- Had kuota Gemini 2.0 Flash dikenakan untuk penjanaan imej
- Jika anda mencapai had harian anda, beralih ke mod "Fast" untuk meneruskan dengan penjanaan standard
- Akaun Enterprise Vertex AI mempunyai had yang lebih tinggi
- Pertimbangkan untuk melaksanakan baris gilir permintaan untuk aplikasi volum tinggi
Perpustakaan Prompt Muktamad
Saya telah menyusun prompt paling berjaya saya ke dalam kategori untuk rujukan mudah. Semua ini telah diuji dan diperhalusi melalui pelbagai iterasi.
Fotografi Potret
Potret persekitaran seorang [pekerjaan] di ruang kerja mereka.
Cahaya tingkap semula jadi dari kiri mencipta bayang lembut.
Subjek diletakkan pada tanda satu pertiga, memandang sedikit ke luar kamera.
Latar belakang menunjukkan alat perdagangan mereka yang tulen, sedikit di luar fokus.
Diambil pada setara 50mm f/2.0. Suhu warna hangat.
Gaya fotografi dokumentari tulen.
Tangkapan Produk
Tangkapan produk hero [produk] terapung berlawan latar belakang
kecerunan yang beralih dari [warna 1] ke [warna 2].
Pencahayaan tiga titik mencipta bayang dramatik dan sorotan.
Produk pada sudut sedikit menunjukkan bentuk dimensi.
Pantulan pada permukaan berkilat di bawah.
Ciri utama diserlahkan dengan petak teks terapung minimum.
Resolusi 4K, estetik fotografi jenama premium.
Gaya Ilustrasi
Poster perjalanan vintage untuk [destinasi] dalam gaya Art Deco 1930-an.
Bentuk geometri berani, palet warna terhad [3-4 warna].
Mercu tanda ikonik sebagai fokus utama dengan sinaran matahari bergaya di belakang.
Tajuk sans-serif besar \"[NAMA DESTINASI]\" di bahagian atas.
Slogan kecil \"[frasa menarik]\" di bahagian bawah.
Tekstur sedikit tertekan untuk keaslian.
Format menegak untuk cetakan poster.
Mockup UI/UX
Reka bentuk UI aplikasi mudah alih untuk aplikasi [jenis aplikasi].
Antaramuka moden gaya iOS dengan warna aksen [skema warna].
[Jenis skrin: suapan rumah / profil / tetapan / dsb.]
Sertakan kandungan realistik: [elemen tertentu].
Tipografi bersih dengan SF Pro atau serupa.
Bayang dan kedalaman halus.
Bingkai peranti pilihan.
Fokus pada kebolehgunaan dan hierarki visual.
Seni Konsep
Seni konsep untuk [genre: sci-fi/fantasi/dsb.] [jenis lokasi].
Pencahayaan [masa hari] menetapkan suasana [mood].
Ciri utama: [senaraikan 3-5 elemen tersendiri].
Figura manusia untuk skala di [lokasi].
Gaya pelukis dengan strok berus kelihatan di latar belakang,
seni garisan terperinci untuk elemen seni bina.
Komposisi sinematik dengan pemisahan depan-tengah-latar belakang yang kuat.
Format 16:9 untuk nada permainan/filem.
Infografik
Infografik menerangkan [proses/konsep] dalam [nombor] langkah.
Reka bentuk bersih, moden dengan [skema warna].
Setiap langkah bernombor dengan ikon dan teks penjelasan ringkas.
Aliran visual dari [arah: atas ke bawah / kiri ke kanan].
Anak panah atau garisan penyambung antara langkah.
Tajuk: \"[Tajuk Topik]\" di bahagian atas dalam huruf tebal.
Semua teks mestilah tajam dan boleh dibaca.
Latar belakang putih atau kelabu muda.
Sesuai untuk [platform: media sosial / cetakan / pembentangan].
Pemikiran Akhir
Malam itu apabila Nano Banana Pro dilancarkan, saya mengalami sesuatu yang tidak saya rasai sejak pertemuan awal saya dengan penjanaan imej AI: kekaguman tulen terhadap apa yang tiba-tiba mungkin. Halangan yang telah menentukan aliran kerja saya — had rendering teks, masalah konsistensi, kekurangan penaakulan — sejat satu demi satu semasa saya meneroka.
Tetapi saya juga belajar sesuatu yang lebih mendalam melalui penggunaan intensif berbulan-bulan: alat itu kurang penting daripada orang yang menggunakannya. Nano Banana Pro sangat berkuasa, tetapi kuasa itu hanya berguna jika anda memahami cara menyampaikan visi anda dengan jelas, berulang dengan teliti, dan mengenali kedua-dua potensi dan had teknologi.
Teknik dalam panduan ini adalah titik permulaan, bukan titik akhir. Pencipta yang akan melakukan kerja yang benar-benar luar biasa dengan Nano Banana Pro adalah mereka yang mengambil asas-asas ini dan menolaknya lebih jauh — menggabungkan keupayaan dengan cara yang tidak difikirkan oleh sesiapa, menyelesaikan masalah yang tidak disedari oleh sesiapa boleh diselesaikan, mencipta pengalaman visual yang mengejutkan dan menggembirakan.
"Apabila AI menjadi lebih berkuasa, satu-satunya perkara yang mengehadkan kita adalah imaginasi kita sendiri yang lemah."
Saya menulis itu dalam nota saya pada jam 5 pagi malam Nano Banana Pro dilancarkan, dan ia telah menjadi sesuatu prinsip panduan. Teknologi akan terus maju. Keupayaan baru akan muncul. Tetapi kemahiran asas — menterjemahkan imej dalam fikiran anda kepada arahan yang boleh dilaksanakan oleh mesin — akan kekal berharga tidak kira model mana yang terkini.
Jadi bereksperimenlah tanpa henti. Tolak sempadan. Cuba prompt yang kelihatan mustahil. Jana beribu-ribu imej. Belajar apa yang berkesan dan, sama pentingnya, apa yang tidak. Bina intuisi anda sendiri tentang cara sistem ini berfikir.
Masa depan penciptaan visual adalah kolaboratif — manusia menyediakan visi, arah, dan pertimbangan; AI menyediakan kelajuan pelaksanaan dan kecekapan teknikal. Nano Banana Pro adalah rakan kongsi kolaboratif yang paling berkebolehan yang pernah kami miliki. Soalannya bukan lagi "bolehkah AI melakukan ini?" tetapi "apa yang harus kita cipta bersama?".
Saya tidak sabar untuk melihat apa yang anda bina.
Bersedia untuk bermula? Buka Gemini, dayakan mod Thinking (Berfikir), dan cuba prompt ini: "Cipta poster filem terperinci untuk filem yang hanya wujud dalam imaginasi saya — cerita tentang [idea anda]. Jadikan tajuk sebagai pusat visual dengan tipografi yang indah." Kemudian ulang, perbaiki, dan jadikan ia milik anda.
Discussion
0 commentsLeave a comment
Be the first to share your thoughts on this article!