Skirtumas tarp vidutiniškų AI vaizdų ir kūrinių, nuo kurių atvimpa žandikaulis, nėra sėkmė ar brangūs įrankiai — tai supratimas, kaip Nano Banana Pro mąsto, ir išmokimas kalbėti jo vizualine kalba.
Aš vis dar prisimenu tą tikslų momentą, kai viskas pasikeitė. Buvo 3 valanda ryto, kai mano telefonas pradėjo be perstojo vibruoti. Mano kūrybinės bendruomenės degė. "Ar matai tai?" "Google ką tik išleido kažką beprotiško." "Pamiršk viską, ką žinojai apie AI vaizdus." Pasitryniau akis, atidariau savo nešiojamąjį kompiuterį, ir tai, ką pamačiau, pakeitė viską, ką maniau žinąs apie AI vaizdų generavimą.
Nano Banana Pro atvyko. Ne kaip mažas atnaujinimas, ne kaip laipsniškas patobulinimas, bet kaip pilnas paradigmos pokytis. Per kelias minutes bandymų generavau tekstą, kuris buvo iš tikrųjų įskaitomas keliomis kalbomis, spalvinau mangą vienu promptu, kūriau filmų plakatus, kurie atrodė kaip iš Holivudo studijos. Grupės, kuriose buvau, sprogo pavyzdžiais — kiekvienas įspūdingesnis už ankstesnį.
Tą naktį aš nemiegojau. Sugeneravau šimtus vaizdų, išbandžiau kiekvieną techniką, kurią galėjau sugalvoti, stumdamas ribas, apie kurias nežinojau, kad jos egzistuoja. Kol patekėjo saulė, aš buvau dokumentavęs aštuonis visiškai naujus kūrybinius darbo eigus, kurie buvo neįmanomi tik prieš 24 valandas. Ir per ateinančias savaites atradau dar septynis. Tai yra viskas, ką aš išmokau — pilnas vadovas Nano Banana Pro įvaldymui, kurio norėčiau, kad būtų buvę, kai pradėjau savo visos nakties kelionę į AI vaizdų generavimo ateitį.
Naktis, Kai Viskas Pasikeitė
Leiskite man jus nukelti atgal į tą akimirką. Aš naudojau AI vaizdų generatorius daugiau nei metus — DALL-E, Midjourney, Stable Diffusion, ankstyvuosius Gemini vaizdų modelius. Jie buvo įspūdingi, žinoma, bet visi dalijosi tais pačiais varginančiais apribojimais. Teksto atvaizdavimas buvo katastrofa. Ne lotyniški rašmenys išeidavo kaip ateivių hieroglifai. Išlaikyti personažų nuoseklumą keliuose vaizduose? Pamirškite tai.
Aš buvau susitaikęs su darbo eiga, kai naudojau AI pradinėms idėjoms, o tada praleisdavau valandas Photoshop'e taisydamas neišvengiamas problemas. Tekstą reikėjo pridėti rankiniu būdu. Veidus reikėjo retušuoti. Tai buvo naudinga, bet jaučiausi taip, lyg technologija būtų nuolat įstrigusi ties 80%.
Tada buvo išleistas Nano Banana Pro.
Pirmas dalykas, kurį išbandžiau, buvo filmo plakatas su sudėtinga tipografija — kažkas, kas visada buvo neįmanoma. Įvedžiau promptą prašydamas tekančios meninės kaligrafijos, stilizuoto pavadinimo teksto ir elegantiško paantraštės išdėstymo. Tai, kas pasirodė mano ekrane, privertė mane sušukti. Raidės buvo tobulos. Tipografija buvo graži. Kompozicija buvo profesionali. Aš sėdėjau ten ir žiūrėjau į tai visą minutę.
Akimirka, kai supratau, kad Nano Banana Pro yra kitoks: Paprašiau jo sukurti stilizuotą kaligrafiją, tikėdamasis įprastos painiavos, o vietoj to gavau tipografiją, kuri atrodė kaip iš profesionalios dizaino studijos. Tada aš žinojau, kad taisyklės pasikeitė.
Per kelias kitas valandas atradau vieną gebėjimą po kito, apie kuriuos nežinojau, kad jie įmanomi. Spalvinau nespalvotą mangos puslapį tuo pat metu versdamas tekstą. Generavau architektūrinius brėžinius iš vienos nuotraukos. Kūriau žaidimų sąsajas, kurios buvo tokios tikroviškos, kad draugai klausė, iš kokio tai žaidimo. Kiekvienas atradimas vedė prie kito, ir dar kito, kol patekėjo saulė ir aš supratau, kad nepajudėjau nuo savo stalo aštuonias valandas.
Tai, kas seka, yra viskas, ką išmokau tą naktį ir per intensyvaus eksperimentavimo savaites, kurios sekė. Tai nėra paviršutiniška apžvalga — tai gilios žinios, gautos stumiant šiuos įrankius iki jų absoliučių ribų ir dokumentuojant, kas veikia, kas ne, ir kodėl.
Kuo Nano Banana Pro Skiriasi
Prieš pasinerdami į technikas, leiskite man paaiškinti, kas tiksliai yra Nano Banana Pro ir kodėl jis reiškia tokį reikšmingą šuolį į priekį. Nano Banana Pro — oficialiai vadinamas Gemini 2.0 Flash Image — yra pažangiausias Google vaizdų generavimo modelis, sukurtas ant galingų Gemini 2.0 mąstymo gebėjimų pagrindo.
Tai ne tik rinkodaros kalba. Integracija su Gemini 2.0 reiškia, kad Nano Banana Pro ne tik gamina vaizdus remdamasis modelių atitikimu — jis iš tikrųjų supranta, ko jūs prašote. Jis turi žinių apie pasaulį. Jis gali mąstyti apie erdvinius ryšius, kultūrinius kontekstus ir technines specifikacijas. Paklauskite apie garsų orientyrą ir jis žino architektūrinį stilių, istorinį kontekstą ir kaip jį tiksliai pavaizduoti.
Revoliucinis Teksto Atvaizdavimas
Moderniausias teksto atvaizdavimas keliomis kalbomis su dramatiškai pagerintu rašybos tikslumu. Tipografija, kuri atrodo iš tikrųjų profesionaliai lotynų, CJK ir kitais rašmenimis. Vien tai keičia tai, kas įmanoma su AI vaizdų generavimu.
Gilios Pasaulio Žinios
Sukurtas ant Gemini 2.0 Flash mąstymo gebėjimų, jis supranta kontekstą, kultūrą ir niuansus. Jis žino istorines nuorodas, architektūrinius stilius, mokslines koncepcijas ir kultūrinius niuansus — ir gali juos vizualiai pavaizduoti.
Preciziška Kontrolė
Studijos lygio kontrolė apšvietimui, kameros kampams, lauko gyliui ir kompozicijai. Profesionalūs fotografai ir dizaineriai pagaliau gali gauti rezultatus, atitinkančius jų viziją, be begalinio regeneravimo.
Kelių Vaizdų Kompozicija
Sujunkite iki 14 referencinių vaizdų į vieną kompoziciją. Išlaikykite personažų nuoseklumą, maišykite stilius, perkelkite elementus tarp vaizdų — viskas išlaikant savybes, kurias norite išsaugoti.
Lankstus Išvedimas
Natyvi 2K rezoliucija su pasirenkamu 4K išvedimu. Palaikomi keli kraštinių santykiai. Kurkite viską nuo vertikalių telefonų fono paveikslėlių iki kinematografinių 21:9 ultraplačių kompozicijų.
Išmanusis Redagavimas
Modifikuokite esamus vaizdus teksto komandomis išlaikydami elementus, kuriuos norite išsaugoti. Keiskite metų laikus, keiskite objektus, reguliuokite apšvietimą — viskas be dreifo problemų, kurios kamavo ankstesnius modelius.
Kur Gauti Prieigą prie Nano Banana Pro
Šiuo metu Nano Banana Pro yra prieinamas per kelis kanalus, kiekvienas su skirtingomis galimybėmis:
- Gemini Programėlė: Prieinamiausia parinktis. Gemini įjunkite "Thinking" (Mąstymo) režimą ir paprašykite vaizdų generavimo, kad aktyvuotumėte Nano Banana Pro. Tai suteikia jums pilnas modelio galimybes su pokalbių pagrindu veikiančia sąsaja.
- Google AI Studio: Programuotojams ir vartotojams, norintiems daugiau kontrolės. Prieiga prie pažangių parametrų ir integracija su pritaikytais darbo eigais.
- Vertex AI: Įmonių lygio prieiga su pilnomis API galimybėmis gamybos programoms.
- Trečiųjų Šalių Platformos: Paslaugos kaip Lovart.ai dažnai siūlo ankstyvą prieigą prie naujų modelių su nemokamais bandomaisiais laikotarpiais.
Profesionalo patarimas: Gemini programėlėje antro vaizdo generavimas su tuo pačiu promptu dažnai duoda geresnius rezultatus nei pirmasis bandymas. Modelis, atrodo, naudoja pirmąjį generavimą kaip tylų kontekstą tobulinimui. Padariau tai savo standartinio darbo eigos dalimi.
Trys Proveržiai, Kurie Svarbūs
Nors Nano Banana Pro apima dešimtis patobulinimų, trys konkretūs proveržiai iš esmės keičia tai, kas įmanoma su AI vaizdų generavimu. Jų supratimas padės jums panaudoti tikrąją modelio galią.
Ankstesni modeliai arba negalėjo generuoti didelės raiškos vaizdų, arba reikalavo didinimo, kuris dažnai įvesdavo artefaktus. Nano Banana Pro generuoja natyvius 4K vaizdus tiesiogiai, su detalėmis ir aiškumu, įmontuotais nuo pat pradžių. Tai ne tik apie pikselių skaičių — tai apie autentiškas detales atskirų blakstienų, audinių audimo raštų ir subtilių tekstūros variacijų lygmenyje. Produktų fotografijai ir komerciniam darbui tai keičia viską.
Reikia 9:16 vertikalaus plakato? 21:9 kinematografinio kadro? Tobulo kvadrato Instagramui? Nano Banana Pro susidoroja su bet kokiu kraštinių santykiu be kompozicijos problemų, kurios kamavo ankstesnius modelius. AI supranta, kaip teisingai komponuoti vaizdus nepriklausomai nuo formato — subjektai nėra nerangiai nukerpami, tekstas neišsilieja, o vizualinis balansas išlieka profesionalus.
Tai yra didysis. Kadangi Nano Banana Pro sukurtas ant Gemini 2.0 mąstymo variklio, jis ne tik derina raštus — jis mąsto apie tai, ko prašote. Paprašykite pastato architektūrinės diagramos, ir jis mąsto apie struktūrinę inžineriją. Paprašykite mokslinės iliustracijos, ir jis remiasi tikromis mokslinėmis žiniomis. Paprašykite kultūrinės nuorodos, ir jis supranta kontekstą. Šis mąstymo gebėjimas yra tai, kas leidžia daugumą pažangių technikų šiame vadove.
Revoliucija Teksto Atvaizdavime
Turiu praleisti akimirką ties teksto atvaizdavimu, nes tai buvo gebėjimas, kuris mane labiausiai šokiravo. Daugelį metų AI vaizdų generatoriai buvo iš esmės nenaudingi bet kokiam rimtam darbui, susijusiam su tekstu už paprastų angliškų žodžių ribų. Sudėtinga tipografija, stilizuoti šriftai ir ne lotyniški rašmenys išeidavo iškraipyti, pasikartojantys, trūkstami elementai arba tiesiog neteisingi. Galėjote sukurti gražų vaizdą ir tada turėti visiškai perdaryti bet kokius teksto elementus Photoshop'e.
Nano Banana Pro tai visiškai pakeičia. Kūriau filmų plakatus su sudėtinga kaligrafija, produktų pakuotes su detaliomis specifikacijomis, infografikus su tankiais teksto pastraipomis — viskas teisingai atvaizduota. Tipografija ne tik įskaitoma; ji tikrai graži. Šriftų stiliai gerbiami. Tarpai tarp simbolių natūralūs. Šis vienas gebėjimas atveria ištisas darbo kategorijas, kurios anksčiau buvo neįmanomos.
Ir tai ne tik stilizuotas tekstas. Standartinis angliško teksto atvaizdavimas taip pat dramatiškai pagerėjo. Mažas tekstas išlieka įskaitomas. Rašybos tikslumas yra nepaprastas. Galite įtraukti teksto pastraipas į vaizdą ir iš tikrųjų naudoti išvestį profesionaliai.
Promptų Struktūra, Kuri Keičia Viską
Sugeneravęs tūkstančius vaizdų su Nano Banana Pro, sukūriau struktūruotą požiūrį į promptus, kuris nuosekliai duoda puikius rezultatus. Pamirškite senas raktinių žodžių kimšimo technikas iš ankstesnių AI modelių — "masterpiece, ultra-detailed, trending on ArtStation" čia nepadeda. Nano Banana Pro reaguoja į aiškumą, struktūrą ir specifiškumą.
Vadinu tai ICS Struktūra: Image type (Vaizdo tipas), Content (Turinys), ir Style (Stilius). Kiekvienas efektyvus promptas, kurį dabar rašau, seka šia struktūra.
IMAGE TYPE (VAIZDO TIPAS):
- [Koks vaizdo tipas: fotografija, iliustracija, diagrama, plakatas, UI maketas ir t.t.]
- [Numatomas naudojimas ir auditorijos kontekstas]
CONTENT (TURINYS):
- [Pagrindinis subjektas su specifinėmis detalėmis]
- [Fono/aplinkos aprašymas]
- [Veiksmas arba ryšys tarp elementų]
- [Bet koks tekstas, kuris turi pasirodyti, kabutėse]
STYLE (STILIUS):
- [Medija: fotografija, akvarelė, 3D renderis, vektorius ir t.t.]
- [Nuoroda: \"Apple produktų fotografija\", \"vintažinis kelionių plakatas\" ir t.t.]
- [Techninės detalės: kameros lęšis, apšvietimas, spalvų paletė]
- [Kokybės ir rezoliucijos reikalavimai]
Ši struktūra suteikia modeliui aiškų kontekstą kiekvienam vizualiniam sprendimui, kurį jis turi priimti.
Hierarchijos Principas
Štai kažkas, ko dauguma vadovų jums nepasakys: informacijos tvarka jūsų prompte yra svarbi. Elementai, paminėti anksčiau, turi didesnę įtaką galutiniam rezultatui. Savo promptus struktūruoju svarbiausiais elementais pirmiausia:
Kas yra pagrindinis vaizdo fokusas? Apibrėžkite tai aiškiai ir anksti. "Keraminis kavos puodelis" yra geriau nei "vaizdas, rodantis puodelį."
Kas vyksta? Kaip elementai susiję vienas su kitu? "Puodelis stovi ant sudėvėto medinio stalo, garai kyla nuo karštos kavos."
Kur tai vyksta? Kas supa subjektą? "Ryto šviesa sklinda per kavinės langą, kurdama minkštus šešėlius."
Kaip tai turėtų būti atvaizduota? Kokia kamera, apšvietimas ar meninis stilius? "Nufotografuota su Canon 5D Mark IV, 85mm lęšis, f/2.8, natūrali spalvų gradacija."
Septyni Efektyvaus Promptavimo Principai
Be struktūros, šie principai valdo, kaip aš rašau kiekvieną promptą. Jie yra skirtumas tarp vaizdų, kurie beveik veikia, ir vaizdų, kurie tiksliai atitinka jūsų viziją.
Struktūra Virš Raktinių Žodžių
Naudokite nuoseklią tvarką: fonas → subjektas → detalės → apribojimai. Sudėtingiems prašymams naudokite pažymėtus skyrius arba eilučių lūžius. Ilgos pastraipos klaidina modelį; organizuota struktūra veda jį link jūsų tikslo.
Specifiškumas Virš Superlatyvų
Vietoj "aukšta kokybė" ar "ypač detalus", aprašykite tikrąsias vizualines savybes. Medžiagos, tekstūros, formos, medijos. "Matomos odos poros ir subtilios strazdanos" nugali "labai detalų veidą" kiekvieną kartą.
Eksplicitinė Kompozicijos Kontrolė
Įvardinkite savo kadrą (stambus planas, platus kadras, panorama), perspektyvą (akių lygis, žemas kampas, olandiškas kampas) ir apšvietimo nuotaiką (minkštas išsklaidytas, auksinė valanda, didelio kontrasto kraštų apšvietimas). Nepalikite to atsitiktinumui.
Keitimo vs. Išlaikymo Kontraktas
Redagavimui, aiškiai nurodykite, kas turi pasikeisti IR kas turi likti tiksliai nepaliesta. Naudokite "keisti tik X" ir "išlaikyti tiksliai Y". Kartokite šį išlaikymo sąrašą kiekvienoje iteracijoje, kad išvengtumėte nukrypimo.
Tekstas Reikalauja Tikslumo
Įdėkite reikiamą tekstą į "kabutes" arba DIDŽIĄSIAS RAIDES. Nurodykite šrifto stilių, dydį, spalvą ir poziciją. Sunkiems žodžiams ar prekių ženklų pavadinimams paraidžiui. Visada pridėkite "atvaizduoti tiksliai vieną kartą, be dublikatų".
Kelių Vaizdų Nuorodų Aiškumas
Dirbdami su keliais įvesties vaizdais, nurodykite kiekvieną indeksu ir aprašymu: "Vaizdas 1: produkto kadras, Vaizdas 2: stiliaus nuoroda." Aiškiai nurodykite, kaip jie turėtų sąveikauti.
Iteracija Virš Perkrovos
Pradėkite nuo švaraus bazinio prompto, tada tobulinkite mažais, vienetiniais tolesniais pakeitimais. "Padaryk apšvietimą šiltesnį." "Pašalink medį fone." Maži žingsniai susideda į tikslius rezultatus.
Praktiniai Promptų Pavyzdžiai
Leiskite man parodyti, kaip ši struktūra verčiama į tikrus promptus skirtingais naudojimo atvejais:
Fotorealistinis stambaus plano portretas senyvo japonų puodžiaus
tikrinančio arbatos dubenėlį. Auksinės valandos šviesa sklinda pro langą,
kurdama šiltus akcentus ant sudėvėtų rankų. Nufotografuota su Canon 5D Mark IV
su 85mm lęšiu prie f/2.8. Mažas lauko gylis su bokeh fonu.
Natūrali spalvų gradacija, matoma odos tekstūra ir poros. 16:9 formatas.
Kawaii stiliaus lipdukas raudonosios pandos, dėvinčios bambuko skrybėlę.
Stori juodi kontūrai, cel-shading stilius, pastelinė spalvų paletė
su švelnia rožine ir žalia. Mielas veidas su blizgančiomis akimis.
Baltas fonas lengvam iškirpimui. Paprastas, švarus dizainas tinkamas
prekių spausdinimui.
Meninis plakatas film noir paslapčiai. Centrinis vaizdas rodo
detektyvo siluetą prieš lietingus langus.
Pagrindinis pavadinimas drąsia Art Deco tipografija \"SHADOWS OF DOUBT\",
su elegantiška, plona serif paantrašte \"Some secrets should stay buried\" apačioje.
Mažas gamybos kreditų tekstas apačioje autentiškumui.
Visas tekstas turi būti švarus ir įskaitomas. Kinematografinė kokybė, nuotaikinga atmosfera.
Didelio kontrasto apšvietimas su giliais šešėliais ir dramatiškais akcentais.
Esminis skirtumas su Nano Banana Pro promptavimu: aprašykite tai, ką norite matyti, ne tai, kaip norite jaustis. "Stulbinantis gražus nuostabus vaizdas" AI nieko nesako. "Auksinės valandos foninis apšvietimas kuriantis ilgus šešėlius ant grįstų gatvių" tiksliai pasako jam, ką atvaizduoti.
Mangos Spalvinimas ir Vertimo Magija
Ši technika buvo mano pirmasis atradimas, kuris mane pribloškė su Nano Banana Pro, ir ji lieka viena įspūdingiausių galimybių, kurias esu matęs. Galimybė paimti nespalvotą mangos puslapį, jį nuspalvinti ir išversti tekstą — viskas vienu promptu — iš esmės keičia darbo eigas mangos gerbėjams, leidėjams ir turinio kūrėjams.
Štai kaip aš tai atradau. Aš visada sunkiai skaičiau nespalvotą mangą. Yra kažkas tankioje vizualinėje informacijoje be spalvų užuominų, dėl ko man sunku sekti veiksmą. Išbandžiau įvairius spalvinimo įrankius, bet visi reikalavo didelio rankinio darbo ir negalėjo susidoroti su tekstu.
Tą pirmąją naktį su Nano Banana Pro įkėliau puslapį iš Demon Slayer ir įvedžiau paprastą promptą: "Padaryk šį vaizdą spalvotą, išversk į anglų kalbą ir įdėk tekstą į atitinkamus kalbos burbulus, viską kitą palik taip pat, ir tada duok man vaizdą."
Tai, kas grįžo, buvo stulbinančio. Spalvos buvo ryškios ir teisingos personažams — Tanjiro žalias languotas haori buvo atvaizduotas tobulai. Japoniškas tekstas kalbos burbuluose buvo pakeistas tiksliais angliškais vertimais. Linijinis menas buvo išsaugotas. Tai atrodė kaip oficialus spalvotas leidimas.
Transformuok šį nespalvotą mangos skydelį:
1. Nuspalvink ryškiomis, anime tinkamomis spalvomis
2. Išversk visą japonišką tekstą į anglų kalbą
3. Įdėk išverstą tekstą į teisingus kalbos burbulus
4. Išlaikyk visas originalias personažų išraiškas ir kompoziciją
5. Grąžink kaip užbaigtą, spausdinimui paruoštą vaizdą
Pažangios Mangos Technikos
Bet tikroji magija yra ta, kad galite eiti toliau. Daug toliau. Galite transformuoti tą patį mangos puslapį į visiškai skirtingus stilius:
// 3D Pliušinis Stilius
Transformuok šią mangą į 3D pliušinio/pūkuoto tekstūros stilių.
Išlaikyk personažus atpažįstamus, bet atvaizduok juos taip, lyg jie
būtų minkšti pliušiniai žaislai. Išlaikyk kalbos burbulus ir tekstą.
// Viduramžių Mozaikos Stilius
Transformuok šią mangą į viduramžių akmens mozaikos stilių,
kaip religiniai meno kūriniai iš senovinių bažnyčių. Suteik jam
šventą, pagarbumo jausmą išlaikant istorijos skydelius.
// Bronzos Reljefo Stilius
Pakeisk šį mangos puslapį į skulptūrinio bronzos reljefo stilių.
Atvaizduok personažus ir scenas taip, lyg jie būtų iškilę
sendintame bronzos metale, su atitinkama patina ir apšvietimu.
Praleidau valandas tą pirmąją naktį generuodamas tą pačią mangos sceną dešimtimis stilių — medžio raižinių, akvarelės, pikselių meno, plastilino animacijos. Kiekviena transformacija išlaikė istorijos struktūrą, tuo pačiu visiškai iš naujo įsivaizduodama vizualinį požiūrį. Tai atveria galimybes fanų menui, mokomajai medžiagai ir kūrybiniams projektams, kurie anksčiau tiesiog nebuvo pasiekiami.
Profesionalo patarimas mangos spalvinimui: Nano Banana Pro supranta anime personažų konvencijas. Jums nereikia nurodyti plaukų spalvų garsiems personažams — jis žino, kad Tanjiro turi juodus plaukus su bordo galiukais ir žalią languotą haori. Šios įmontuotos žinios daro spalvinimą greitesnį ir tikslesnį.
Profesionalus Plakatų Dizainas ir Vizualai
Plakatų dizainas buvo vieta, kur aš tikrai pradėjau suprasti Nano Banana Pro teksto atvaizdavimo galią. Ankstesni AI modeliai galėjo sukurti gražius vaizdus, bet kai tik reikėjo teksto — pavadinimų, kreditų, šūkių — grįždavote prie rankinio darbo Photoshop'e. Nano Banana Pro visiškai keičia šią lygtį.
Leiskite man parodyti keletą konkrečių pavyzdžių, rodančių, kas dabar įmanoma:
Kinematografiniai Filmų Plakatai
Sukurk filmo plakatą 'Robot Dreams' retro vidurio amžiaus animacijos stiliumi.
Scena: Antropomorfinis šuo ir dėžutės formos melsvai pilkas robotas eina susikibę rankomis
smėlėtame paplūdimyje saulėlydžio metu, žiūrėdami į apgriuvusį pramogų parko molą su apžvalgos
ratu ir amerikietiškais kalneliais. Giliai oranžinis dangus.
Stilius: Plokščia iliustracija, stori kontūrai, šilta retro spalvų paletė.
Tipografija: Pavadinimas \"ROBOT DREAMS\" didžiulėmis paryškintomis raidėmis viršuje centre, giliai oranžinė
spalva. Maži festivalių logotipai viršuje. Baltos recenzijų citatos išbarstytos aplink
personažus.
Nuotaika: Nostalgiška, melancholiška, šildanti širdį.
Rezultatas atrodo neatskiriamas nuo tikrų vintažinių filmų plakatų. Tekstas yra švarus ir teisingai išdėstytas. Iliustracijos stilius yra nuoseklus visur. Net smulkios detalės, tokios kaip festivalių laurai ir recenzijų citatos, yra atvaizduojamos teisingai.
Tipografijos Gausūs Plakatai
Čia viskas tampa tikrai įspūdinga. Sudėtinga tipografija su keliais šriftais, dydžiais ir stiliais, kurių ankstesni AI modeliai tiesiog negalėjo suprasti:
Meninis plakatas film noir paslapčiai \"Dead Poets Society\".
Klasikinis meno stilius su scena, vaizduojančia ikoninę akimirką
stovėjimo ant stalų. Pagrindinis pavadinimas tekančia menine
rankraštine kaligrafija su elegantiškais, plonais potėpiais.
Angliška paantraštė \"Carpe Diem\" apačioje rafinuotu sans-serif šriftu.
Šūkis \"Seize the day\" kaip mažas teksto elementas.
Papildomas mažas gamybos kreditų tekstas apačioje autentiškumui.
Visas tekstas turi būti švarus ir įskaitomas. Premium kokybė, kinematografinė
atmosfera perteikianti pagarbią baimę ir įkvėpimą.
Plakatas, sugeneruotas pagal šį promptą, galėtų lengvai praeiti kaip profesionalus studijos darbas. Kaligrafija turi teisingą potėpio storio variaciją. Kompozicija seka klasikiniais dizaino principais. Žiūrovai niekada neatspėtų, kad tai sugeneravo AI.
Kiberpanko Vizualinis Dizainas
Sudėtingiems dizainams su daug teksto Nano Banana Pro susidoroja su iššūkiu išskirtinai gerai:
Kiberpanko pagrindinis vizualinis plakatas su tankiais teksto elementais.
Neonais apšviesta miesto aplinka su holografiniais ekranais, rodančiais
įvairius tekstus ir duomenų rodmenis. Pagrindinis subjektas: kibernetinis personažas
su švytinčiais implantais. Kelios plūduriuojančios teksto plokštės su techninėmis
specifikacijomis ir įspėjamaisiais ženklais.
Stilius: didelis kontrastas, neoninės spalvos prieš tamsius fonus.
Įtraukite tiek didelį ekrano tekstą, tiek mažą detalų tekstą.
Visi simboliai turi būti teisingai suformuoti ir įskaitomi.
Kinematografinis 16:9 formatas.
Dizaino patarimas: Kai dirbate su plakatais, kuriuose yra daug teksto, visada nurodykite "visas tekstas turi būti švarus ir įskaitomas" kur nors savo prompte. Atrodo, kad tai suaktyvina papildomus kokybės patikrinimus modelyje, kurie pagerina teksto atvaizdavimo tikslumą.
Žinių Vizualizacija ir Diagramos
Kadangi Nano Banana Pro sukurtas ant Gemini 2.0 mąstymo gebėjimų, jis gali kurti mokomąsias diagramas ir žinių vizualizacijas, kurios iš tikrųjų turi prasmę. Tai ne tik apie gražių vaizdų atvaizdavimą — tai apie tikslų sudėtingos informacijos atvaizdavimą.
Išbandžiau tai paprašydamas sukurti struktūrinę diagramą garsių istorinių pastatų. Nepateikdamas referencinių vaizdų, tiesiog paklausiau:
Sukurk detalų struktūrinį gotikinės katedros diagramą
su išsamiu aiškinamuoju tekstu. Parodyk kontraforsų sistemą,
navos ir transepto išdėstymą, ir daugiaaukštį aukštį.
Įtrauk detalias anotacijas, paaiškinančias statybos technikas,
kurios leido šioms viduramžių struktūroms išlikti šimtmečius.
Visas tekstas turi būti švarus ir įskaitomas.
Rezultatas buvo stulbinantis. Diagrama tiksliai parodė gotikinės architektūros struktūrinės inžinerijos stebuklus. Proporcijos atitiko tikrus pastatus. Ir anotacijos pateikė tikslią istorinę ir inžinerinę informaciją. Tai yra mąstymo gebėjimas veiksme — modelis iš tikrųjų žino apie architektūros istoriją ir gali tas žinias atvaizduoti vizualiai.
Tradicinių Amatų Dokumentavimas
Dar viena galinga aplikacija yra tradicinių amatų ir technikų dokumentavimas:
Sukurk detalų vizualinį vadovą tradicinėms japonų sashiko siuvinėjimo technikoms.
Parodyk skirtingus dygsnių raštus su
stambaus plano pavyzdžiais. Įtrauk tradicinę indigo ir baltą spalvų paletę.
Demonstruok adatos kampus ir siūlų įtempimą skirtingiems
efektams pasiekti. Pridėk išsamų aiškinamąjį tekstą, apimantį istoriją ir
šio amato regionines variacijas. Mokomojo infografiko stilius
su švariu išdėstymu.
Techninių Koncepcijų Diagramos
Mokslinei fantastikai ir koncepciniam darbui Nano Banana Pro gali generuoti įspūdingą techninę dokumentaciją:
Detali techninė išskleisto vaizdo diagrama kiberpanko protezinės akies.
Parodyk visus vidinius komponentus: optinius jutiklius, nervinės sąsajos jungtis,
maitinimo šaltinį, apdorojimo vienetą, reguliavimo mechanizmus.
Pažymėk kiekvieną komponentą su techninėmis specifikacijomis. Įtrauk skerspjūvio vaizdą
rodantį, kaip ji jungiasi prie regos nervo. Fotorealistinis
atvaizdavimas su inžinerinio brėžinio anotacijomis. Futuristinis, bet
moksliškai tikėtinas dizainas.
Detalių lygis šiose techninėse diagramose konkuruoja su tuo, ką sukurtų profesionalus koncepcijų menininkas, bet sugeneruota per kelias sekundes. Žaidimų dizaineriams, mokslinės fantastikos rašytojams ir koncepcijų menininkams tai yra neįtikėtinas įrankis greitam prototipų kūrimui.
Neįtikėtinas Matematikos Sprendimo Gebėjimas
Tai mane tikrai šokiravo. Nano Banana Pro ne tik generuoja vaizdus — jis gali spręsti matematinius uždavinius ir atvaizduoti sprendimo procesą kaip ranka rašytą darbo lapą. Mąstymo variklis už vaizdų generavimo iš tikrųjų dirba per matematinę logiką.
Išbandžiau tai su geometrijos uždaviniu, susijusiu su trikampiais ir kampų skaičiavimais. Įkėliau uždavinio ekrano kopiją ir pateikiau promptą:
Sukurk juodraščio lapą, rodantį pilną sprendimą
šiam matematiniam uždaviniui. Parodyk visą darbą, įskaitant diagramas,
lygtis ir skaičiavimus žingsnis po žingsnio. Padaryk, kad tai atrodytų
kaip autentiškas mokinio raštas su natūraliomis variacijomis.
Įtrauk geometrinius eskizus, kur aktualu.
Tai, kas grįžo, buvo tikroviškas ranka rašytos matematikos puslapis, pilnas:
- Geometrinių diagramų su pažymėtais kampais ir kraštinėmis
- Algebrinių manipuliacijų žingsnis po žingsnio
- Teisingai pritaikytų teoremų ir formulių
- Apibrėžto galutinio atsakymo
- Natūralių rašymo netobulumų, dėl kurių tai atrodė tikra
Ir štai kas svarbiausia — matematika iš tikrųjų buvo teisinga. Modelis ne tik sukūrė kažką, kas atrodė kaip sprendimas; jis dirbo per tikrą matematinį mąstymą ir priėjo prie teisingo atsakymo. Švietimo turinio kūrėjams, korepetitorių paslaugoms ar bet kam, kam reikia parodyti matematinį darbą, tai yra nepaprasta.
Svarbus Įspėjimas
Nors Nano Banana Pro matematiką išsprendžia teisingai dažniausiai, visada turėtumėte patikrinti sprendimus dėl bet ko svarbaus. Mąstymas yra įspūdingas, bet ne neklystantis. Mačiau atsitiktinių klaidų sudėtinguose kelių žingsnių uždaviniuose.
Konversijos iš Popieriaus į Baltąją Lentą
Viena iš praktiškiausių programų, kurias radau, yra ilgo formato turinio — mokslinių straipsnių, straipsnių, techninės dokumentacijos — konvertavimas į vizualias santraukas ant baltosios lentos. Šią techniką pabrėžė tyrėjai X (buvęs Twitter) ir ji tapo vienu iš mano mėgstamiausių darbo eigų.
Pagrindinis požiūris yra paprastas: pateikite tekstinį dokumentą (kaip įkeltą PDF, įklijuotą tekstą arba per ekrano kopiją) ir paprašykite vizualios santraukos baltosios lentos stiliumi:
Paversk šį mokslinį darbą/straipsnį į detalią baltosios lentos nuotrauką
kuri rodo pagrindines koncepcijas, ryšius ir išvadas.
Naudok natūralų rankraštinį stilių su:
- Dėžutėmis ir konteineriais pagrindinėms koncepcijoms
- Rodyklėmis, rodančiomis ryšius ir srautą
- Punktų sąrašais pagrindinėms detalėms
- Paprastomis diagramomis, kur padeda
- Spalvų kodavimu skirtingoms temoms
Padaryk, kad tai atrodytų kaip tikra nufotografuota balta lenta
su tikrovišku apšvietimu ir perspektyva. Įtrauk visą svarbią
informaciją įskaitomame, hierarchiniame išdėstyme.
Išbandžiau tai su ilgu techniniu straipsniu apie LLaMA 3 architektūrą. Nano Banana Pro sugeneravo baltosios lentos santrauką, kuri užfiksavo pagrindines inovacijas, architektūrinius sprendimus, mokymo metodą ir etaloninius rezultatus — viskas formatu, kurį buvo galima suprasti iš pirmo žvilgsnio.
Pritaikymo galimybės yra didžiulės:
- Studentai: Paskaitų užrašų ar vadovėlių skyrių konvertavimas į vizualias mokymosi priemones
- Tyrėjai: Greitų vizualinių straipsnių santraukų kūrimas pristatymams
- Mokytojai: Lentos stiliaus paaiškinimų generavimas be faktinio rašymo ant lentos
- Turinio kūrėjai: Rašytinio turinio konvertavimas į įtraukiančius vizualinius formatus
Kaip pastebėjo vienas tyrėjas, šis gebėjimas iš esmės galėtų pakeisti poreikį mokytojams rankiniu būdu rašyti paaiškinimus ant baltųjų lentų — nors aš teigčiau, kad tai geriausia naudoti kaip priedą, o ne pakaitalą.
Žaidimų Sąsajų Kūrimas
Nano Banana Pro akivaizdžiai buvo apmokytas naudojant didžiulį žaidimų vaizdo įrašų ir ekrano kopijų korpusą, nes jo gebėjimas generuoti įtikinamas žaidimų sąsajas yra nepaprastas. Tai peržengia paprastų maketų ribas — jis supranta žaidimų UI konvencijas, žanrui specifinius elementus ir net regionines žaidimų dizaino variacijas.
Giliavandenio Tyrinėjimo Žaidimas
Sukurk ekrano kopiją iš giliavandenio tyrinėjimo žaidimo, panašaus į Dave the Diver.
Scena: Naras susiduria su didžiuliu nežinomu padaru bedugnėje.
UI Elementai:
- Gylio matuoklis rodantis 850m
- Deguonies matuoklis ties 40%
- Inventoriaus lizdai apačioje kairėje
- Mini žemėlapis viršutiniame dešiniajame kampe
- Įspėjimas \"ĮSPĖJIMAS: Aptikta nežinoma gyvybės forma\"
Stilius: Pikselių menas su moderniais apšvietimo efektais, atmosferine migla, bioliuminescenciniais padarais.
FPS Žaidimo Ekrano Kopija
Sukurk ekrano kopiją iš pirmojo asmens šaudyklės Call of Duty stiliumi,
bet priešas yra Shiba Inu šuo (Cheems memas). Pilna FPS sąsaja
su taikikliu, šaudmenų skaitikliu, mini žemėlapiu, sveikatos juosta ir
killstreak indikatoriais. Cheems turėtų būti su taktine įranga. Fotorealistinis
grafikos stilius su kinematografiniu apšvietimu. Įtrauk pataikymo žymeklius ir
lengvą judesio susiliejimą veiksmo pojūčiui.
Šis rimtos žaidimo mechanikos derinys su absurdišku humoru sukuria linksmus rezultatus, kurie atrodo visiškai autentiški. UI elementai yra tobulai išdėstyti ir stilizuoti tinkamai žanrui.
MOBA Žaidimų Sąsajos
Kur viskas tampa tikrai įdomu, tai Nano Banana Pro supratimas apie specifinę žaidimų kultūrą. Paprašius sugeneruoti League of Legends ar panašias MOBA sąsajas, rodančias žaidėjus, bendraujančius pokalbių lange, jis generuoja kontekstui tinkamą dialogą:
Sukurk žaidimo ekrano kopiją League of Legends, rodančią intensyvų
komandinį mūšį. Pokalbių srityje (apačioje kairėje), parodyk žaidėjus,
turinčius karštą ginčą dėl žaidimo strategijos. Įtrauk tipinius MOBA UI elementus:
gebėjimų juosta, mini žemėlapis, rezultatų lentelė, daiktų lizdai. Pokalbis turėtų
atrodyti kaip autentiškas žaidėjo elgesys konkurencinio mačo metu.
Modelis supranta skirtingų žaidimų bendruomenių kultūrinį kontekstą ir atvaizduoja juos tiksliai — kartais skausmingai taip. Žaidimų dizaineriams, turinio kūrėjams ir bet kam žaidimų erdvėje tai yra neįtikėtinai naudingas gebėjimas.
Produktų Atvaizdavimas ir Fotografija
Produktų fotografija yra ten, kur Nano Banana Pro teksto atvaizdavimo, apšvietimo valdymo ir kompozicinio intelekto derinys tikrai spindi. Galimybė patalpinti produktus į bet kokią aplinką išlaikant prekės ženklo nuoseklumą atveria darbo eigas, kurios būtų brangios arba neįmanomos su tradicine fotografija.
Albumo Viršelio Pavyzdys
Leiskite man parodyti jums detalų pavyzdį, rodantį pilną galimybę. Pradėjau nuo paprastos idėjos: fiktyvus albumo viršelis. Pirma, sugeneravau CD ir dėklą:
Sukurk produkto kadrą CD albumui. Albumo pavadinimas
\"MIDNIGHT ECHOES\" stilizuota modernia tipografija. Albumo viršelis rodo
siurrealistinę, svajingą ikonografiją, derinančią kibernetinius ir organinius elementus.
Įtrauk tiek CD, tiek plastikinę dėžutę. Studijinis apšvietimas,
švarus baltas fonas, produkto fotografijos stilius.
Čia viskas tampa įdomu. Turėdamas šį produktą, galėjau jį patalpinti į bet kokią aplinką išlaikant tobulą nuoseklumą:
// 90-ųjų Įrašų Parduotuvė
Padėk šį CD produktą ant medinės lentynos įrašų parduotuvėje
iš 1990-ųjų. Apsuptas vinilinių plokštelių ir senų kasečių. Šiltas
volframo apšvietimas, neoninių ženklų atspindžiai fone,
dulkių dalelės plaukiojančios ore. Nostalgiška atmosfera.
// Siurrealistinė Levitacija
CD kybo ore apsuptas sudužusių stiklo šukių
ir plūduriuojančių laikrodžio krumpliaračių. Koncepcija: \"sapnai\" ir
\"kelionės laiku\". Kinematografinis apšvietimas, dramatiška kompozicija.
// CD Grotuvo Scena
CD dedamas į nešiojamąjį CD grotuvą. CD dėklas
stovi netoliese. Vėlyvos popietės saulės šviesa pro užuolaidas.
Medinis stalo paviršius. Šilta, kontempliatyvi nuotaika.
// Koncerto Scena
Patalpink šį produktą į stadiono koncerto aplinką.
Minios energija, scenos apšvietimas, didžiuliai ekranai fone.
CD atrodo neįmanomai didelis, kaip scenos rekvizitas.
Kiekvienoje aplinkoje tekstas ant CD išliko ryškus ir įskaitomas. Produktas išlaikė savo vizualinį identitetą, natūraliai prisitaikydamas prie kiekvienos naujos apšvietimo situacijos ir konteksto. E-komercijai, rinkodaros kampanijoms ar prekės ženklo vizualizacijai tai yra revoliucinga.
Techniniai Produktų Kadrai
Techniškesnei produktų fotografijai Nano Banana Pro susidoroja su detalėmis, kurios svarbios:
iPhone 17 Pro, Kosminė Oranžinė, 45 laipsnių galinis kampas pabrėžiantis galinį dizainą
ir kameros modulį.
Fonas: Minkštas gradientas tech-estetinis abstraktus raštas su natūraliu tekančiu
judesiu ir modernaus meno atmosfera. Venkite grynos juodos. Pabrėžkite šviesos-šešėlių sąveiką
ir subtilius spalvų perėjimus.
Plūduriuojantys teksto elementai aplink įrenginį: \"A19 Pro Chip\", \"8x Optical Zoom\",
\"48MP Rear Camera\" — modernus plūduriuojantis išdėstymas, skaidrūs teksto langeliai, švari
ir technologiškai pažangi estetika.
Bendrai: Dinamiškas, futuristinis, profesionalios produkto fotografijos kokybė.
Perler Karoliukų Atradimas
Tai buvo visiškai atsitiktinis įvykis. Eksperimentavau su skirtingais rankdarbių stiliais, kai aptikau Nano Banana Pro nuostabų gebėjimą generuoti perler karoliukų (taip pat žinomų kaip lydomi karoliukai arba hama karoliukai) meną. Rezultatai yra tokie nuoseklūs ir žavingi, kad tai tapo vienu iš mano mėgstamiausių estetinių stilių.
3D perler karoliukų menas: ekspozicijos dėžutė, kurioje yra išskirtinė figūrėlė.
Stilius: Fotorealistinis atvaizdavimas rodantis atskiras karoliukų tekstūras, blizgų
paviršių, profesionalų produkto fotografijos apšvietimą.
Įtraukti: Matomas karoliukų tinklelio raštas, subtilūs šešėliai tarp karoliukų, lengvi
netobulumai autentiškumui.
Modelis supranta, kad perler karoliukai turi specifines savybes — cilindrinę formą, mažą tarpą tarp karoliukų, būdą, kaip jie susilydo sujungimo taškuose. Jis tiksliai atvaizduoja šias detales, išlaikydamas mielą estetiką, dėl kurios šis rankdarbių stilius yra toks patrauklus.
Variacijos, kurios puikiai veikia:
- Perler karoliukų šunys: Skirtingos veislės atvaizduotos pikselių meno-susitinka-rankdarbius estetikoje
- Perler karoliukų katės su spalvų lentelėmis: Parodykite personažą šalia naudojamų karoliukų spalvų
- Perler karoliukų dioramos: Pilnos scenos sukurtos iš lydomų karoliukų estetikos
- Perler karoliukų raktų pakabukai: Mažesni dizainai tinkami prekių maketams
Rankdarbių raštų kūrėjams, prekių kūrėjams ar bet kam, kas mėgsta šią žavingą estetiką, Nano Banana Pro yra aukso kasykla.
Miestų Reklaminiai Plakatai
Nano Banana Pro pasaulio žinios apima geografiją ir orientyrus. Jis žino ikoninius didžiųjų miestų pastatus ir gali juos sukomponuoti į nuoseklią reklaminę medžiagą. Tai ypač įspūdinga miestams su sudėtingu architektūriniu paveldu.
Sukurk reklaminį plakatą Niujorkui. Fone yra
ikoniniai orientyrai: Empire State Building, Laisvės statula, Bruklino tiltas,
One World Trade Center, Times Square. Orientyrai turėtų turėti
vizualinę hierarchiją su aiškiu pirminiu ir antriniu pabrėžimu.
Švarus linijinės iliustracijos stilius su drąsia spalvų schema.
Centrinė didelė tipografija: \"NEW YORK\" su mažesniu tekstu \"The City
That Never Sleeps\" netoliese. Šūkis apačioje: \"Where Dreams Take Flight\".
Įtrauk modernius elementus kaip geltonieji taksi ir metro įėjimai, kad
parodytum šiuolaikinį NYC.
Švari, tekanti kompozicija su natūraliu elementų išdėstymu.
Pabrėžk istorinių orientyrų ir modernios energijos derinį.
Dinamiška, metropolinė atmosfera.
Modelis atpažįsta ir teisingai atvaizduoja skiriamuosius kiekvieno orientyro bruožus — Empire State Building Art Deco smailę, Laisvės statulos vario patiną, Bruklino tilto gotikinius bokštus. Jis taip pat supranta vizualinę turizmo rinkodaros kalbą ir taiko tinkamą stilių.
Komiksų Kadruotės ir Nuoseklus Menas
Kūrėjams, dirbantiems su komiksais, manga ar kadruotėmis, Nano Banana Pro gebėjimas generuoti kelių skydelių sekas yra didžiulis laiko taupymas. Jis supranta pasakojimo tėkmę, skydelių kompoziciją ir kaip vizualizuoti emocinius ritmus.
Sukurk 5 skydelių mangos seką vaizduojančią epinę kovą:
Skydelis 1: Herojus stovi ant kalno viršūnės. Piktadarys išnyra iš šešėlių.
Įtempta atmosfera.
Skydelis 2: Jų akys susitinka. Kova neišvengiama. Stambus planas padalinto ekrano kompozicija.
Skydelis 3: Intensyvi kova. Žaibai blyksi. Herojus puola su švytinčiu
ginklu, Piktadarys atremia tamsia energija.
Skydelis 4: Susidūrimas ore. Energijos bangos sprogsta į išorę. Dinamiška veiksmo poza.
Skydelis 5: Abu kariai stovi vienas prieš kitą. Herojaus akys rodo ryžtą,
Piktadario rodo sudėtingą emociją.
Stilius: Shonen manga veiksmo stilius. Didelis kontrastas. Greičio linijos. Dramatiški šešėliai.
Modelis supranta vizualinį mangos žodyną — greičio linijas, smūgio kadrus, emocinius stambius planus, dinamiškus kampus. Jis išlaiko personažų nuoseklumą per visus skydelius ir sukuria tikrą pasakojimo tėkmę, o ne penkis nesusijusius vaizdus.
Išbandžiau tai su įvairiais scenarijais:
- Emocinės atsisveikinimo scenos — melancholiškas, jaudinantis tonas
- Mokytojo ir mokinio ryšio akimirkos — kontempliatyvios, sudėtingos
- Originalūs personažai gyvenimiškuose scenarijuose
- Veiksmo sekos ne anime stiliuose
Pagrindinis apribojimas, kurį pastebėjau: kartais 1 ir 2 arba 4 ir 5 skydeliai gali būti per daug panašūs, jei promptas nenurodo pakankamai diferenciacijos. Pridėjus skirtingus vizualinius elementus ar kameros kampus į kiekvieną skydelio aprašymą padeda to išvengti.
4K Kokybė ir Detalus Darbas
Nano Banana Pro natyvaus 4K išvedimo galimybė nėra tik apie rezoliucijos skaičius — tai apie detalių lygį, kuris tampa įmanomas. Artimai fotografijai, produktų kadrams ir bet kokiai programai, kur svarbios smulkios detalės, tai keičia tai, kas pasiekiama.
Sukurk labai detalų 4K makro Monarch drugelio
nuotrauką, besiilsinčio ant geltonos gėlės. Fokusuokis tiksliai į
sparnų žvynelius ir tekstūrą, rodydamas atskirus žvynelius, kurie
sudaro raštą. Užfiksuok žiedlapio tekstūrą lygiu detalumo lygiu.
Minkštas išsklaidytas apšvietimas, mažas lauko gylis su kreminiu
bokeh fonu. Natūrali spalvų paletė su lengva šiluma.
Mokslinis tikslumas drugelio anatomijoje. Tokio tipo kadras, kuris
laimėtų gamtos fotografijos konkursą.
Kai priartinate gautą vaizdą, galite pamatyti atskirus sparnų žvynelius, žiedadulkių grūdelius ir gėlių žiedlapių ląstelinę struktūrą. Šis detalių lygis anksčiau buvo pasiekiamas tik su specializuota makro fotografijos įranga ir dideliu post-procesingu.
Kada Naudoti 4K
Standartinė Kokybė
Greitas generavimas (3-5 sekundės) su puikia kokybe daugumai naudojimo atvejų:
- Koncepcijos tyrinėjimas ir idėjų generavimas
- Socialinių tinklų turinys
- Pradiniai juodraščiai prieš galutinį tobulinimą
- Didelės apimties generavimo poreikiai
- Paprastos kompozicijos be smulkaus teksto
Aukšta Kokybė / 4K
Prailgintas generavimo laikas (8-15 sekundžių) maksimaliam tikslumui:
- Galutiniai gamybos vaizdai
- Tankus tekstas ir tipografinis darbas
- Sudėtingi infografikai su mažomis detalėmis
- Fotorealistiniai portretai
- Spausdinimui paruoštos medžiagos
Idėjų generavimui ir iteracijai, laikykitės numatytosios rezoliucijos, kad išlaikytumėte greitus grįžtamojo ryšio ciklus.
Personažų Nuoseklumas Keliuose Vaizduose
Viena iš istoriškai sunkiausių problemų AI vaizdų generavime buvo išlaikyti personažų nuoseklumą keliuose vaizduose. Sukurtumėte personažą, kurį mylėjote, tada bandytumėte įdėti jį į kitą pozą ar aplinką, ir staiga jis atrodytų kaip visiškai kitas asmuo.
Nano Banana Pro daro didelę pažangą šioje problemoje per savo kelių vaizdų įvesties galimybę. Galite pateikti referencinius vaizdus ir modelis išlaikys tapatybę naujose generacijose.
1 Žingsnis: Personažo Nustatymas
\"Sukurk personažo nuorodų lapą Asmeniui 1: 30-metė azijietė
moteris su pečius siekiančiais juodais plaukais, šiltomis rudomis akimis ir draugiška
šypsena. Parodyk vaizdą iš priekio, šoninį profilį ir trijų ketvirčių kampą.\"
2 Žingsnis: Scenų Generavimas
\"Asmuo 1 sėdi prie kavinės stalo, skaito knygą. Ryto šviesa
pro langą. Kasdieniai drabužiai.\"
3 Žingsnis: Konteksto Keitimas
\"Asmuo 1 dabar yra verslo susitikime, dėvi profesionalią aprangą.
Tas pats personažas, skirtinga aplinka.\"
4 Žingsnis: Keli Personažai
\"Asmuo 1 ir Asmuo 2 (pirmiausia nustatyk Asmenį 2) eina kartu
parke. Rudens popietės apšvietimas.\"
Ši darbo eiga yra transformuojanti:
- Mados e-komercija: Rodyti tą patį modelį su keliais drabužiais be brangių fotosesijų
- Personažų dizainas: Variacijų tyrinėjimas išlaikant tapatybę
- Komiksų/mangos kūrimas: Protagonistų nuoseklumo išlaikymas per scenas
- Virtualių influencerių turinys: Nuoseklios asmenybės kūrimas per įrašus
- Žaidimų turto kūrimas: Personažai keliose pozose ir išraiškose
Profesionalo patarimas personažų nuoseklumui: Pateikdami referencinius vaizdus, įtraukite bent vieną gerai apšviestą priekinį veido kadrą. Modelis tai naudoja tapatybei įtvirtinti. Papildomi kampai padeda, bet nėra tokie kritiški kaip ši pagrindinė nuoroda.
Oficialūs Google Scenų Šablonai
Google pateikė oficialius promptų šablonus įprastiems naudojimo atvejams. Aš juos plačiai išbandžiau ir noriu pasidalinti savo patobulintomis versijomis, pagrįstomis realaus pasaulio rezultatais. Kiekvienas šablonas seka nuoseklią struktūrą, į kurią modelis reaguoja patikimai.
Fotorealistinės Fotografijos Šablonas
Struktūra: Kadro Tipas + Subjektas + Veiksmas/Išraiška + Aplinka + Apšvietimas + Kameros Parametrai + Kraštinių Santykis
Fotorealistinis [kadro tipas] [subjektas], [veiksmas arba išraiška],
nustatytas [aplinka]. Scena apšviesta [apšvietimo aprašymas],
kuriant [nuotaika] atmosferą. Užfiksuota su [kameros/lęšio detalės],
pabrėžiant [pagrindinės tekstūros ir detalės]. Vaizdas turi būti
[kraštinių santykis] formatu.
Fotorealistinis stambaus plano portretas senyvo japonų puodžiaus
tikrinančio arbatos dubenėlį, auksinės valandos šviesa sklinda pro langą
kairėje, kurdama kontempliatyvią atmosferą. Užfiksuota su
85mm lęšiu prie f/2.8, pabrėžiant odos tekstūrą, sudėvėtas rankas ir
keramikos glazūrą. 16:9 formatas.
Iliustracijos ir Lipduko Šablonas
Struktūra: Stilius + Subjektas + Pagrindinės Savybės + Spalvų Paletė + Linijos Stilius + Fonas
[Stilius] lipdukas [subjektas], pasižymintis [pagrindinės savybės]
ir [spalvų paletė]. Dizainas turėtų turėti [linijos stilius] ir
[šešėliavimo stilius]. Fonas turėtų būti [fono reikalavimas].
Prekės Ženklo Dizaino Šablonas
Struktūra: Vaizdo Tipas + Prekės Ženklas/Koncepcija + Teksto Turinys + Tipografija + Dizaino Stilius + Spalvų Schema
Sukurk [vaizdo tipas] [prekės ženklas/koncepcija] su tekstu \"[tikslus tekstas]\"
[šrifto stilius]. Dizainas turėtų būti [stiliaus aprašymas], su
[spalvų schema]. Įtrauk [papildomi dizaino elementai]. Bendras jausmas
turėtų komunikuoti [prekės ženklo vertybės/žinutė].
Produktų Fotografijos Šablonas
Struktūra: Produkto Aprašymas + Fonas + Apšvietimo Sąranka + Kameros Kampas + Pagrindinės Detalės + Kraštinių Santykis
Aukštos rezoliucijos, studijoje apšviesta produkto nuotrauka [produkto aprašymas]
ant [fono paviršius]. Apšvietimas yra [apšvietimo sąranka] skirtas
[apšvietimo tikslas]. Kameros kampas yra [kampo tipas] skirtas pabrėžti
[konkreti savybė]. Labai realistiška, su aštriu fokusu į [pagrindinė detalė].
[Kraštinių santykis].
Minimalistinis Negatyvios Erdvės Šablonas
Struktūra: Subjekto Pozicija + Tuščia Fono Erdvė + Apšvietimas + Kraštinių Santykis
Minimalistinė kompozicija su vienu [subjektas] patalpintu
[pozicija: apačioje dešinėje/viršuje kairėje/t.t.] kadre.
Fonas yra plati, tuščia [spalva] drobė, kurianti reikšmingą
negatyvią erdvę. Minkštas, neįkyrus apšvietimas iš [kryptis]. [Kraštinių santykis].
Komikso Skydelio Šablonas
Struktūra: Meno Stilius + Priekinio Plano Personažas/Veiksmas + Fono Aplinka + Dialogas/Antraštė + Nuotaika
Vienas komikso skydelis [meno stilius] stiliumi. Priekiniame plane,
[personažo aprašymas ir veiksmas]. Fone, [aplinkos detalės].
Skydelis turi [dialogo/antraštės dėžutė] su tekstu \"[tikslus tekstas]\".
Apšvietimas kuria [nuotaika] nuotaiką. [Kraštinių santykis].
Pažangios Vaizdų Redagavimo Technikos
Be teksto į vaizdą generavimo, Nano Banana Pro pasižymi esamų vaizdų modifikavimu. Raktas yra suprasti, kaip aiškiai aprašyti savo redagavimus, nurodant, kas turi likti nepakeista.
Keitimo vs. Išlaikymo Kontraktas
Redaguodamas vaizdus, naudoju specifinę struktūrą, kuri orientuota į aiškumą, kas turėtų ir neturėtų keistis:
KEEP (IŠLAIKYTI): [Elementai, kurie turi likti nepakeisti]
- \"Išlaikyk tikslius asmens veido bruožus ir išraišką\"
- \"Išlaikyk originalią apšvietimo kryptį ir intensyvumą\"
CHANGE (KEISTI): [Reikalingi specifiniai pakeitimai]
- \"Pakeisk foną į paplūdimio sceną saulėlydžio metu\"
- \"Pakeisk marškinių spalvą iš mėlynos į raudoną\"
HOW (KAIP): [Stiliaus ir kokybės kryptis]
- \"Užtikrink natūralią apšvietimo integraciją\"
- \"Suderink spalvų gradaciją su originaliu vaizdu\"
CONSTRAINTS (APRIBOJIMAI): [Ko vengti]
- \"Nekeisk jokių veido bruožų\"
- \"Venk šešėlių krypčių keitimo\"
Elementų Pridėjimas ir Pašalinimas
Naudojant pateiktą vaizdą [subjektas], prašau pridėti [elementas]
į sceną. Padėk jį [vietos aprašymas]. Užtikrink, kad priedas
[integracijos aprašymas: atitinka apšvietimą, atitinka perspektyvą, t.t.].
Išlaikyk visus kitus elementus tiksliai taip, kaip jie pasirodo originale.
Naudojant šį mano katės vaizdą, pridėk mažą megztą burtininko kepurę
ant jos galvos. Kepurė turėtų sėdėti natūraliai, atitinkanti minkštą
nuotraukos apšvietimą. Išlaikyk katės išraišką, pozą ir
visus fono elementus nepakeistus.
Stiliaus Perkėlimas
Transformuok pateiktą nuotrauką [subjektas] į meninį
stilių [menininkas/meno judėjimas]. Išlaikyk originalią kompoziciją
bet atvaizduok visus elementus su [stiliaus elementų aprašymas].
Pavyzdys: Transformuok šią modernios miesto gatvės naktį nuotrauką
į Vincent van Gogh \"Žvaigždėta naktis\" stilių. Išlaikyk kompoziciją
pastatų ir automobilių, bet atvaizduok viską su besisukančiais, impasto
potėpiais ir dramatiška gilių mėlynų ir ryškių geltonų palete.
Kelių Vaizdų Kompozicija
Sukurk naują vaizdą derindamas elementus iš pateiktų vaizdų.
Paimk [elementas iš Vaizdas 1] ir padėk jį su/į [elementas iš Vaizdas 2].
Galutinis vaizdas turėtų būti [norimo rezultato aprašymas].
Pavyzdys: Suderink šiuos vaizdus - paimk raketą iš Vaizdas 1
ir padėk ją kylančią iš tropinės salos paplūdimio iš Vaizdas 2.
Galutinis vaizdas turėtų rodyti ramią paplūdimio sceną su raketa
dramatiškai kylančia fone, saulėlydžio apšvietimas.
Aukšto Tikslumo Tapatybės Išsaugojimas
Redagavimams, kur veido tapatybės išsaugojimas yra kritinis:
Naudojant pateiktus vaizdus, padėk [elementas iš Vaizdas 2] ant
[subjektas iš Vaizdas 1]. Užtikrink, kad [subjektas] bruožai liktų
visiškai nepakeisti — ta pati veido struktūra, išraiška ir
proporcijos. Pridėtas elementas turėtų natūraliai integruotis su
[integracijos reikalavimų aprašymas].
Pavyzdys: Paimk moterį rudais plaukais ir mėlynomis akimis iš Vaizdas 1.
Pridėk logotipą iš Vaizdas 2 ant jos juodų marškinėlių. Išlaikyk jos veidą
ir bruožus tiksliai nepakeistus. Logotipas turėtų atrodyti natūraliai
atspausdintas ant audinio, sekantis marškinėlių klostes.
Eskizas į Realybę
Transformuok šį grubų [medija: pieštukas/markeris/skaitmeninis] eskizą
[subjektas] į [stiliaus aprašymas] užbaigtą vaizdą. Išlaikyk
[specifinės savybės išlaikymui] iš eskizo bet pridėk
[naujos detalės/medžiagos/apdaila].
Pavyzdys: Transformuok šį grubų pieštuko eskizą futuristinio automobilio
į nušlifuotą parodų salės nuotrauką galutinio prototipo automobilio.
Išlaikyk elegantiškas linijas ir žemą profilį iš eskizo bet pridėk
metalo mėlynus dažus ir neoninį ratlankių apšvietimą.
Klaidos, Kurios Žudė Mano Rezultatus
Išmokti ko NEDARYTI yra lygiai taip pat svarbu, kaip išmokti ką daryti. Štai klaidos, kurios nuosekliai davė blogus rezultatus, kol jas identifikavau ir pašalinau.
Klaida 1: Raktinių Žodžių Kimšimas
Ką aš dariau: Pridėdavau kokybės raktinius žodžius kaip "masterpiece, ultra-detailed, 8K, trending on ArtStation, unreal engine" prie kiekvieno prompto.
Kodėl tai nepavyko: Nano Banana Pro yra apmokytas kitaip nei senesni modeliai. Šie raktiniai žodžiai arba neturi jokio poveikio, arba gali iš tikrųjų suklaidinti modelį dėl jūsų tikrojo ketinimo.
Geresnis požiūris: Susitelkite į aprašomąjį specifiškumą vietoj kokybės raktinių žodžių. Aprašykite tiksliai, ką norite matyti.
Klaida 2: Neigiamas Promptavimas
Ką aš dariau: Rašiau "no blur, no artifacts, no deformed hands, no extra fingers."
Kodėl tai nepavyko: Nano Banana Pro nepalaiko neigiamo promptavimo taip pat kaip difuzijos modeliai. Sakymas jam, ko nedaryti, gali iš tikrųjų įvesti tuos elementus.
Geresnis požiūris: Aprašykite tai, ko norite teigiamai. Vietoj "no blur," sakykite "sharp focus."
Klaida 3: Neaiškios Stiliaus Nuorodos
Ką aš dariau: Rašiau "beautiful image, stunning, amazing, gorgeous."
Kodėl tai nepavyko: Šie žodžiai nepateikia jokios veiksmingos informacijos. Kas daro kažką "gražiu", yra subjektyvu.
Geresnis požiūris: Aprašykite specifines vizualines savybes. "Warm color palette with golden highlights" pasako modeliui tiksliai, ką atvaizduoti.
Klaida 4: Kraštinių Santykio Ignoravimas
Ką aš dariau: Nenurodžiau kraštinių santykio ir tada bandžiau apkarpyti rezultatus, kad tiktų mano poreikiams.
Kodėl tai nepavyko: Modelis komponuoja vaizdus skirtingai pagal kraštinių santykį. Kvadratinė kompozicija turi kitokį balansą nei kinematografinis platus kadras.
Geresnis požiūris: Visada nurodykite savo tikslinį kraštinių santykį iš anksto. "16:9 horizontal," "9:16 vertical," "1:1 square."
Klaida 5: Per Daug Sudėtingi Promptai
Ką aš dariau: Bandžiau nurodyti kiekvieną įmanomą detalę viename didžiuliame prompte.
Kodėl tai nepavyko: Peržengus tam tikrą sudėtingumą, elementai pradeda dingti arba konfliktuoti vienas su kitu.
Geresnis požiūris: Pradėkite nuo pagrindinių elementų, sugeneruokite, tada tobulinkite per pokalbį su tikslingais tolesniais veiksmais.
Klaida 6: Mąstymo Režimo Pamiršimas
Ką aš dariau: Naudojau standartinį režimą sudėtingoms kompozicijoms.
Kodėl tai nepavyko: Standartinis režimas neįjungia pilnų mąstymo gebėjimų painiems prašymams.
Geresnis požiūris: Sudėtingoms kompozicijoms įjunkite mąstymo režimą. Tai leidžia modeliui giliai analizuoti erdvinius ryšius prieš generuojant.
Meta-pamoka: Nano Banana Pro yra pokalbio partneris, ne lošimų automatas. Elkitės su juo taip, lyg vadovautumėte labai gabiam menininkui — duokite aiškią kryptį, peržiūrėkite rezultatus, tobulinkite bendradarbiaudami. Iteratyvus požiūris nugali bandymą pasiekti tobulumą vienu promptu.
API Integracija Programuotojams
Programuotojams, norintiems integruoti Nano Banana Pro į programas, API yra prieinama per Google AI Studio ir Vertex AI. Štai pagrindinės techninės detalės:
Pagrindinė Generavimo Užklausa
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_images(
model='imagen-3.0-generate-002', # Nano Banana Pro
prompt='A photorealistic portrait of a robot barista...',
config=types.GenerateImagesConfig(
number_of_images=1,
aspect_ratio='16:9',
output_mime_type='image/jpeg'
)
)
# Access the generated image
image_data = response.generated_images[0].image.image_bytes
Vaizdo Redagavimo Užklausa
response = client.models.edit_image(
model='imagen-3.0-capability-001',
prompt='Change the background to a sunset beach...',
reference_images=[open('original.png', 'rb')],
config=types.EditImageConfig(
edit_mode='INPAINT',
number_of_images=1,
input_fidelity='high', # Critical for identity preservation
output_mime_type='image/png'
)
)
Nustatymas input_fidelity='high' dramatiškai pagerina tapatybės išsaugojimą atliekant redagavimus vaizduose su veidais ar svarbiomis detalėmis.
Pagrindiniai Parametrai
aspect_ratio: \"1:1\", \"16:9\", \"9:16\", \"4:3\", \"3:4\", \"21:9\"number_of_images: 1-4 vaizdai per užklausąoutput_mime_type: \"image/jpeg\" arba \"image/png\"input_fidelity: \"low\" (greičiau) arba \"high\" (geresnis tapatybės išsaugojimas)safety_filter_level: Kontroliuoja turinio filtravimo griežtumą
Spartos Limitai ir Kvotos
Būkite informuoti apie naudojimo limitus:
- Gemini 2.0 Flash kvotos limitai taikomi vaizdų generavimui
- Jei pasieksite savo dienos limitą, perjunkite į \"Fast\" režimą, kad tęstumėte standartinį generavimą
- Enterprise Vertex AI paskyros turi aukštesnius limitus
- Apsvarstykite užklausų eilės įgyvendinimą didelės apimties programoms
Galutinė Promptų Biblioteka
Aš suorganizavau savo sėkmingiausius promptus į kategorijas lengvai nuorodai. Visi šie buvo išbandyti ir patobulinti per kelias iteracijas.
Portretų Fotografija
Aplinkos portretas [profesija] jų darbo vietoje.
Natūrali lango šviesa iš kairės sukuria minkštus šešėlius.
Subjektas patalpintas trečdalio žymėje, žiūri šiek tiek toliau nuo kameros.
Fonas rodo autentiškus jų amato įrankius, šiek tiek nefokusuotus.
Nufotografuota 50mm ekvivalentu f/2.0. Šilta spalvų temperatūra.
Autentiškas, dokumentinis fotografijos stilius.
Produktų Kadrai
Herojaus produkto kadras [produktas] plūduriuojantis prieš gradientinį
foną, kuris pereina nuo [spalva 1] į [spalva 2].
Trijų taškų apšvietimas sukuria dramatiškus šešėlius ir akcentus.
Produktas nedideliu kampu rodo erdvinę formą.
Atspindys ant blizgaus paviršiaus apačioje.
Pagrindinės savybės paryškintos minimaliais plūduriuojančiais teksto paaiškinimais.
4K rezoliucija, premium prekės ženklo fotografijos estetika.
Iliustracijų Stiliai
Vintažinis kelionių plakatas [paskirties vieta] 1930-ųjų Art Deco stiliumi.
Drąsios geometrinės formos, ribota spalvų paletė [3-4 spalvos].
Ikoninis orientyras kaip centrinis fokusas su stilizuotais saulės spinduliais už nugaros.
Didelis sans-serif pavadinimas \"[PASKIRTIES PAVADINIMAS]\" viršuje.
Mažas šūkis \"[kabliukas]\" apačioje.
Šiek tiek sudėvėta tekstūra autentiškumui.
Vertikalus formatas plakato spausdinimui.
UI/UX Maketai
Mobiliosios programėlės UI dizainas [programėlės tipas] programėlei.
Moderni iOS stiliaus sąsaja su akcentinėmis spalvomis [spalvų schema].
[Ekrano tipas: pradinis srautas / profilis / nustatymai / t.t.]
Įtrauk realistinį turinį: [specifiniai elementai].
Švari tipografija su SF Pro ar panašiu.
Subtilūs šešėliai ir gylis.
Įrenginio rėmelis neprivalomas.
Fokusas į naudojimo patogumą ir vizualinę hierarchiją.
Koncepcinis Menas
Koncepcinis menas [žanras: sci-fi/fantasy/t.t.] [vietos tipas].
Apšvietimas [dienos laikas] nustato [nuotaika] nuotaiką.
Pagrindinės savybės: [sąrašas 3-5 išskirtinių elementų].
Žmogaus figūros masteliui [vietose].
Tapybiškas stilius su matomais teptuko potėpiais fone,
detalus linijinis menas architektūriniams elementams.
Kinematografinė kompozicija su stipriu priekinio plano-vidurio-fono atskyrimu.
16:9 formatas žaidimo/filmo pristatymui.
Infografikai
Infografikas paaiškinantis [procesas/koncepcija] per [skaičius] žingsnių.
Švarus, modernus dizainas su [spalvų schema].
Kiekvienas žingsnis sunumeruotas su ikona ir trumpu paaiškinamuoju tekstu.
Vizualinis srautas iš [kryptis: viršaus į apačią / kairės į dešinę].
Jungiančios rodyklės ar linijos tarp žingsnių.
Pavadinimas: \"[Temos Pavadinimas]\" viršuje paryškintu šriftu.
Visas tekstas turi būti ryškus ir įskaitomas.
Baltas arba šviesiai pilkas fonas.
Tinka [platforma: socialiniai tinklai / spausdinimas / pristatymas].
Baigiamosios Mintys
Tą naktį, kai buvo išleistas Nano Banana Pro, patyriau kažką, ko nejaučiau nuo savo ankstyvųjų susidūrimų su AI vaizdų generavimu: tikrą susižavėjimą tuo, kas staiga tapo įmanoma. Kliūtys, kurios apibrėžė mano darbo eigas — teksto atvaizdavimo apribojimai, nuoseklumo problemos, mąstymo trūkumas — išgaravo viena po kitos, kai tyrinėjau.
Bet taip pat išmokau kažką gilesnio per mėnesius intensyvaus naudojimo: įrankis yra mažiau svarbus nei asmuo, kuris juo naudojasi. Nano Banana Pro yra neįtikėtinai galingas, bet ta galia naudinga tik tada, jei suprantate, kaip aiškiai komunikuoti savo viziją, kruopščiai iteruoti ir atpažinti tiek technologijos potencialą, tiek ribas.
Technikos šiame vadove yra pradžios taškai, ne pabaigos taškai. Kūrėjai, kurie atliks tikrai įspūdingą darbą su Nano Banana Pro, yra tie, kurie paims šiuos pagrindus ir pastūmės juos toliau — derindami gebėjimus būdais, apie kuriuos niekas nepagalvojo, spręsdami problemas, kurių niekas nesuprato, kad jos išsprendžiamos, kurdami vizualines patirtis, kurios stebina ir džiugina.
\"Kai AI tampa galingesnis, vienintelis dalykas, ribojantis mus, yra mūsų pačių skurdi vaizduotė.\"
Parašiau tai savo užrašuose 5 valandą ryto naktį, kai startavo Nano Banana Pro, ir tai tapo tarsi vadovaujančiu principu. Technologija toliau tobulės. Atsiras naujų gebėjimų. Bet pagrindinis įgūdis — vertimas vaizdų jūsų galvoje į instrukcijas, kurias mašina gali vykdyti — išliks vertingas nepriklausomai nuo to, koks modelis yra dabartinis.
Tad eksperimentuokite be paliovos. Stumkite ribas. Bandykite promptus, kurie atrodo neįmanomi. Generuokite tūkstančius vaizdų. Mokykitės, kas veikia, ir, lygiai taip pat svarbu, kas ne. Sukurkite savo intuiciją, kaip šios sistemos mąsto.
Vizualinės kūrybos ateitis yra bendradarbiaujanti — žmonės teikia viziją, kryptį ir sprendimą; AI teikia vykdymo greitį ir techninę kompetenciją. Nano Banana Pro yra pats pajėgiausias bendradarbiavimo partneris, kokį iki šiol turėjome. Klausimas nebėra \"ar AI gali tai padaryti?\" bet \"ką mes sukursime kartu?\".
Nekantrauju pamatyti, ką sukursite.
Pasiruošę pradėti? Atidarykite Gemini, įjunkite Thinking (Mąstymo) režimą, ir išbandykite šį promptą: \"Sukurk detalų filmo plakatą filmui, kuris egzistuoja tik mano vaizduotėje — istorija apie [jūsų idėja]. Padaryk pavadinimą vizualiu centru su gražia tipografija.\" Tada iteruokite, tobulinkite ir padarykite tai savo.
Discussion
0 commentsLeave a comment
Be the first to share your thoughts on this article!