Różnica między przeciętnymi obrazami AI a oszałamiającymi kreacjami nie polega na szczęściu czy drogich narzędziach — chodzi o zrozumienie, jak myśli Nano Banana Pro i nauczenie się mówić jego językiem wizualnym.
Wciąż pamiętam dokładnie ten moment, kiedy wszystko się zmieniło. Była 3 rano, kiedy mój telefon zaczął wibrować bez przerwy. Moje społeczności kreatywne płonęły. "Widziałeś to?" "Google właśnie wypuściło coś szalonego." "Zapomnij o wszystkim, co wiedziałeś o obrazach AI." Przetarłem oczy, otworzyłem laptopa, a to, co zobaczyłem, zmieniło wszystko, co myślałem, że wiem o generowaniu obrazów AI.
Nano Banana Pro nadeszło. Nie jako drobna aktualizacja, nie jako stopniowa poprawa, ale jako całkowita zmiana paradygmatu. W ciągu kilku minut testowania generowałem tekst, który był faktycznie czytelny w wielu językach, kolorowałem mangę jednym promptem, tworzyłem plakaty filmowe, które wyglądały, jakby pochodziły ze studia w Hollywood. Grupy, w których byłem, eksplodowały przykładami — każdy bardziej oszałamiający od poprzedniego.
Tej nocy nie spałem. Wygenerowałem setki obrazów, testując każdą technikę, o jakiej pomyślałem, przesuwając granice, o których istnieniu nie wiedziałem. Zanim wzeszło słońce, udokumentowałem osiem całkowicie nowych kreatywnych przepływów pracy, które nie były możliwe zaledwie 24 godziny wcześniej. A w ciągu następnych tygodni odkryłem siedem kolejnych. Oto wszystko, czego się nauczyłem — kompletny przewodnik po opanowaniu Nano Banana Pro, który chciałbym mieć, kiedy zaczynałem moją całonocną podróż w przyszłość generowania obrazów AI.
Noc, Kiedy Wszystko Się Zmieniło
Pozwólcie, że zabiorę was z powrotem do tamtego momentu. Używałem generatorów obrazów AI od ponad roku — DALL-E, Midjourney, Stable Diffusion, oryginalnych modeli obrazów Gemini. Były imponujące, jasne, ale wszystkie dzieliły te same frustrujące ograniczenia. Renderowanie tekstu było katastrofą. Skrypty nielacińskie wyglądały jak obce hieroglify. Utrzymanie spójności postaci na wielu obrazach? Zapomnij o tym.
Ustaliłem sobie przepływ pracy polegający na używaniu AI do wstępnych koncepcji, a następnie spędzaniu godzin w Photoshopie na naprawianiu nieuniknionych problemów. Tekst trzeba było dodawać ręcznie. Twarze wymagały retuszu. Było to przydatne, ale czułem, że technologia jest wiecznie w 80% drogi do celu.
Wtedy pojawiło się Nano Banana Pro.
Pierwszą rzeczą, jaką wypróbowałem, był plakat filmowy ze złożoną typografią — coś, co zawsze było niemożliwe. Wpisałem prompt z prośbą o płynną kaligrafię artystyczną, stylizowany tekst tytułowy i eleganckie rozmieszczenie napisów. To, co pojawiło się na moim ekranie, sprawiło, że głośno westchnąłem. Znaki były idealne. Typografia była piękna. Kompozycja była profesjonalna. Siedziałem i patrzyłem na to przez pełną minutę.
Moment, w którym zdałem sobie sprawę, że Nano Banana Pro jest inne: poprosiłem o wygenerowanie stylizowanej kaligrafii, spodziewając się zwykłego bełkotu, a zamiast tego otrzymałem typografię, która wyglądała, jakby pochodziła z profesjonalnego studia projektowego. Wtedy wiedziałem, że zasady się zmieniły.
W ciągu następnych kilku godzin odkrywałem kolejne możliwości, o których istnieniu nie wiedziałem. Pokolorowałem czarno-białą stronę mangi, jednocześnie tłumacząc tekst. Stworzyłem plany architektoniczne z pojedynczej fotografii. Wygenerowałem interfejsy gier tak realistyczne, że znajomi pytali mnie, z jakiej są gry. Każde odkrycie prowadziło do kolejnego i kolejnego, aż wzeszło słońce i zdałem sobie sprawę, że nie ruszyłem się od biurka od ośmiu godzin.
Poniżej znajduje się wszystko, czego nauczyłem się tej nocy i w tygodniach intensywnych eksperymentów, które nastąpiły później. To nie jest powierzchowny przegląd — to głęboka wiedza, która pochodzi z pchania tych narzędzi do ich absolutnych granic i dokumentowania tego, co działa, co nie, i dlaczego.
Co Wyróżnia Nano Banana Pro
Zanim zagłębimy się w techniki, pozwólcie mi wyjaśnić, czym dokładnie jest Nano Banana Pro i dlaczego stanowi tak znaczący krok naprzód. Nano Banana Pro — oficjalnie nazywane Gemini 2.0 Flash Image — to najbardziej zaawansowany model generowania obrazów Google, zbudowany na fundamencie potężnych możliwości rozumowania Gemini 2.0.
To nie jest tylko marketingowa gadka. Integracja z Gemini 2.0 oznacza, że Nano Banana Pro nie tylko generuje obrazy w oparciu o dopasowywanie wzorców — on faktycznie rozumie, o co prosisz. Posiada wiedzę o świecie. Potrafi rozumować o relacjach przestrzennych, kontekstach kulturowych i specyfikacjach technicznych. Zapytaj go o słynny zabytek, a on zna styl architektoniczny, kontekst historyczny i sposób jego dokładnego przedstawienia.
Rewolucyjne Renderowanie Tekstu
Najnowocześniejsze renderowanie tekstu w wielu językach ze znacznie poprawioną dokładnością pisowni. Typografia, która faktycznie wygląda profesjonalnie w skryptach łacińskich, CJK i innych. To samo zmienia to, co jest możliwe dzięki generowaniu obrazów AI.
Głęboka Wiedza o Świecie
Zbudowany na możliwościach rozumowania Gemini 2.0 Flash, rozumie kontekst, kulturę i złożoność. Zna odniesienia historyczne, style architektoniczne, koncepcje naukowe i niuanse kulturowe — i potrafi je wizualnie przedstawić.
Precyzyjna Kontrola
Studyjnej jakości kontrola nad oświetleniem, kątami kamery, głębią ostrości i kompozycją. Profesjonalni fotografowie i projektanci mogą wreszcie uzyskać wyniki zgodne z ich wizją bez niekończącego się regenerowania.
Kompozycja Wielu Obrazów
Połącz do 14 obrazów referencyjnych w jedną kompozycję. Utrzymuj spójność postaci, mieszaj style, przenoś elementy między obrazami — wszystko to przy zachowaniu cech, które chcesz zatrzymać.
Elastyczne Dane Wyjściowe
Natywna rozdzielczość 2K z opcjonalnym wyjściem 4K. Obsługa wielu proporcji obrazu. Generuj wszystko, od pionowych tapet na telefon po kinowe kompozycje panoramiczne 21:9.
Inteligentna Edycja
Modyfikuj istniejące obrazy za pomocą poleceń tekstowych, zachowując elementy, które chcesz zatrzymać. Zmieniaj pory roku, zamieniaj obiekty, dostosuj oświetlenie — wszystko to bez problemów z dryfowaniem, które nękały wcześniejsze modele.
Gdzie Uzyskać Dostęp do Nano Banana Pro
Obecnie Nano Banana Pro jest dostępny za pośrednictwem kilku kanałów, z których każdy ma inne możliwości:
- Aplikacja Gemini: Najbardziej dostępna opcja. W Gemini włącz tryb "Myślenie" (Thinking) i poproś o wygenerowanie obrazu, aby aktywować Nano Banana Pro. Daje to pełne możliwości modelu z interfejsem opartym na konwersacji.
- Google AI Studio: Dla deweloperów i zaawansowanych użytkowników, którzy chcą większej kontroli. Dostęp do zaawansowanych parametrów i integracja z niestandardowymi przepływami pracy.
- Vertex AI: Dostęp klasy korporacyjnej z pełnymi możliwościami API dla aplikacji produkcyjnych.
- Platformy Innych Firm: Usługi takie jak Lovart.ai często oferują wczesny dostęp do nowych modeli z bezpłatnymi okresami próbnymi.
Wskazówka pro: W aplikacji Gemini wygenerowanie drugiego obrazu z tym samym promptem często daje lepsze wyniki niż pierwsza próba. Model wydaje się używać pierwszej generacji jako niejawnego kontekstu do udoskonalenia. Uczyniłem to częścią mojego standardowego przepływu pracy.
Trzy Przełomy, Które Mają Znaczenie
Podczas gdy Nano Banana Pro zawiera dziesiątki ulepszeń, trzy konkretne przełomy fundamentalnie zmieniają to, co jest możliwe dzięki generowaniu obrazów AI. Zrozumienie ich pomoże ci wykorzystać prawdziwą moc modelu.
Wcześniejsze modele albo nie mogły generować obrazów o wysokiej rozdzielczości, albo wymagały skalowania (upscaling), które często wprowadzało artefakty. Nano Banana Pro generuje natywne obrazy 4K bezpośrednio, z detalami i klarownością wbudowanymi od samego początku. Nie chodzi tylko o liczbę pikseli — chodzi o autentyczne detale na poziomie poszczególnych rzęs, wzorów splotu tkaniny i subtelnych zmian tekstury. Dla fotografii produktowej i pracy komercyjnej zmienia to wszystko.
Potrzebujesz pionowego plakatu 9:16? Kinowej klatki 21:9? Idealnego kwadratu na Instagram? Nano Banana Pro obsługuje dowolne proporcje obrazu bez problemów z kompozycją, które nękały wcześniejsze modele. AI rozumie, jak poprawnie komponować obrazy niezależnie od formatu — tematy nie są niezręcznie przycinane, tekst nie przelewa się, a równowaga wizualna pozostaje profesjonalna.
To jest ta duża rzecz. Ponieważ Nano Banana Pro jest zbudowane na silniku rozumowania Gemini 2.0, nie tylko dopasowuje wzorce — myśli o tym, o co prosisz. Poproś o schemat architektoniczny budynku, a on rozumuje o inżynierii strukturalnej. Poproś o ilustrację naukową, a on czerpie z rzeczywistej wiedzy naukowej. Poproś o odniesienie kulturowe, a on rozumie kontekst. Ta zdolność rozumowania jest tym, co umożliwia większość zaawansowanych technik w tym przewodniku.
Rewolucja w Renderowaniu Tekstu
Muszę poświęcić chwilę na renderowanie tekstu, ponieważ była to umiejętność, która najbardziej mnie zszokowała. Przez lata generatory obrazów AI były w zasadzie bezużyteczne do jakiejkolwiek poważnej pracy obejmującej tekst poza prostymi angielskimi słowami. Złożona typografia, stylizowane czcionki i skrypty nielacińskie wychodziły zniekształcone, powtórzone, brakowało im elementów lub były po prostu błędne. Mogłeś wygenerować piękny obraz, a następnie musiałbyś całkowicie przerobić wszelkie elementy tekstowe w Photoshopie.
Nano Banana Pro zmienia to całkowicie. Generowałem plakaty filmowe ze złożoną kaligrafią, opakowania produktów ze szczegółowymi specyfikacjami, infografiki z gęstym tekstem akapitowym — wszystko poprawnie wyrenderowane. Typografia jest nie tylko czytelna; jest w rzeczywistości piękna. Style czcionek są respektowane. Odstępy między znakami są naturalne. Ta jedna umiejętność otwiera całe kategorie prac, które wcześniej były niemożliwe.
I to nie tylko stylizowany tekst. Standardowe renderowanie tekstu angielskiego również uległo dramatycznej poprawie. Mały tekst pozostaje czytelny. Dokładność pisowni jest niezwykła. Możesz zawrzeć akapity tekstu na obrazie i faktycznie użyć wyniku profesjonalnie.
Struktura Promptu, Która Zmienia Wszystko
Po wygenerowaniu tysięcy obrazów za pomocą Nano Banana Pro opracowałem ustrukturyzowane podejście do promptów, które konsekwentnie daje wyjątkowe rezultaty. Zapomnij o starych technikach upychania słów kluczowych z wcześniejszych modeli AI — "masterpiece, ultra-detailed, trending on ArtStation" tutaj nie pomaga. Nano Banana Pro reaguje na jasność, strukturę i specyficzność.
Nazywam to Strukturą ICS: Image type (Typ obrazu), Content (Treść) i Style (Styl). Każdy skuteczny prompt, jaki teraz piszę, podąża za tą strukturą.
IMAGE TYPE:
- [What kind of image: photograph, illustration, diagram, poster, UI mockup, etc.]
(Jaki rodzaj obrazu: fotografia, ilustracja, diagram, plakat, makieta UI, itp.)
- [Intended use and audience context]
(Zamierzone użycie i kontekst odbiorców)
CONTENT:
- [Main subject with specific details]
(Główny temat ze szczegółami)
- [Background/environment description]
(Opis tła/otoczenia)
- [Action or relationship between elements]
(Akcja lub relacja między elementami)
- [Any text that should appear, in quotes]
(Dowolny tekst, który powinien się pojawić, w cudzysłowie)
STYLE:
- [Medium: photography, watercolor, 3D render, vector, etc.]
(Medium: fotografia, akwarela, render 3D, wektor, itp.)
- [Reference: "Apple product photography", "vintage travel poster", etc.]
(Referencja: "fotografia produktowa Apple", "plakat podróżniczy vintage", itp.)
- [Technical details: camera lens, lighting, color palette]
(Szczegóły techniczne: obiektyw kamery, oświetlenie, paleta kolorów)
- [Quality and resolution requirements]
(Wymagania dotyczące jakości i rozdzielczości)
Ta struktura daje modelowi jasny kontekst dla każdej decyzji wizualnej, którą musi podjąć.
Zasada Hierarchii
Oto coś, czego większość przewodników ci nie powie: kolejność informacji w twoim prompcie ma znaczenie. Elementy wymienione wcześniej mają większy wpływ na ostateczny wynik. Konstruuję moje prompty z najważniejszymi elementami na początku:
Co jest głównym punktem skupienia obrazu? Zdefiniuj to jasno i wcześnie. "Ceramiczny kubek do kawy" jest lepszy niż "obraz przedstawiający kubek".
Co się dzieje? Jak elementy odnoszą się do siebie? "Kubek stoi na zwietrzałym drewnianym stole, para unosi się z gorącej kawy wewnątrz."
Gdzie to się dzieje? Co otacza temat? "Poranne światło wpada przez okno kawiarni, tworząc miękkie cienie."
Jak powinno to zostać wyrenderowane? Jaka kamera, oświetlenie lub styl artystyczny? "Zrobione aparatem Canon 5D Mark IV, obiektyw 85mm, f/2.8, naturalna gradacja kolorów."
Siedem Zasad Skutecznego Promptingu
Poza strukturą, te zasady rządzą tym, jak piszę każdy prompt. Są różnicą między obrazami, które prawie działają, a obrazami, które idealnie oddają twoją wizję.
Struktura Ponad Słowami Kluczowymi
Używaj spójnej kolejności: tło → temat → szczegóły → ograniczenia. W przypadku złożonych żądań używaj oznaczonych sekcji lub podziałów linii. Długie akapity dezorientują model; zorganizowana struktura kieruje go ku twojej intencji.
Konkretność Ponad Superlatywami
Zamiast "wysoka jakość" lub "ultra-szczegółowy", opisz rzeczywiste właściwości wizualne. Materiały, tekstury, kształty, media. "Widoczne pory skóry i subtelne piegi" za każdym razem wygrywa z "wysoce szczegółową twarzą".
Jawna Kontrola Kompozycji
Nazwij swoje kadrowanie (zbliżenie, szeroki plan, lot ptaka), perspektywę (poziom oczu, niski kąt, kąt holenderski) i nastrój oświetlenia (miękkie rozproszone, złota godzina, kontrastowe światło konturowe). Nie zostawiaj tego przypadkowi.
Kontrakt Zmień vs Zachowaj
Do edycji, wyraźnie określ, co powinno się zmienić, A co powinno pozostać nienaruszone. Używaj "change only X (zmień tylko X)" i "preserve exactly Y (zachowaj dokładnie Y)". Powtarzaj tę listę zachowania przy każdej iteracji, aby zapobiec dryfowaniu.
Tekst Wymaga Precyzji
Umieść wymagany tekst w "cudzysłowie" lub WIELKIMI LITERAMI. Określ styl czcionki, rozmiar, kolor i pozycję. W przypadku trudnych słów lub nazw marek, przeliteruj je litera po literze. Zawsze dodawaj "render exactly once, no duplicates (wyrenderuj dokładnie raz, bez duplikatów)".
Klarowność Referencji Wielu Obrazów
Pracując z wieloma obrazami wejściowymi, odnoś się do każdego przez indeks i opis: "Image 1: the product shot, Image 2: the style reference (Obraz 1: zdjęcie produktu, Obraz 2: referencja stylu)". Wyraźnie określ, jak powinny współdziałać.
Iteruj Zamiast Przeciążać
Zacznij od czystego promptu bazowego, a następnie udoskonalaj małymi, pojedynczymi zmianami. "Make the lighting warmer (Spraw, by oświetlenie było cieplejsze)." "Remove the background tree (Usuń drzewo w tle)." Małe kroki sumują się w precyzyjne wyniki.
Praktyczne Przykłady Promptów
Pozwól, że pokażę ci, jak ta struktura przekłada się na prawdziwe prompty w różnych przypadkach użycia:
A photorealistic close-up portrait of an elderly Japanese ceramicist
inspecting a tea bowl. Golden hour light streams through a window,
creating warm highlights on weathered hands. Shot on Canon 5D Mark IV
with 85mm lens at f/2.8. Shallow depth of field with bokeh background.
Natural color grading, visible skin texture and pores. 16:9 format.
A kawaii-style sticker of a red panda wearing a bamboo hat.
Bold black outlines, cel-shading style, pastel color palette
with soft pinks and greens. Cute expression with sparkly eyes.
White background for easy cutout. Simple, clean design suitable
for merchandise printing.
Art poster for a film noir mystery. Central imagery shows
a detective silhouette against rain-streaked windows.
Main title in bold Art Deco typography "SHADOWS OF DOUBT",
with elegant thin serif subtitle "Some secrets should stay buried" below.
Small production credits text at bottom for authenticity.
All text must be clear and legible. Cinematic quality, moody atmosphere.
High contrast lighting with deep shadows and dramatic highlights.
Kluczowa różnica w promptingu Nano Banana Pro: opisz to, co chcesz zobaczyć, a nie to, jak chcesz się czuć. "Oszałamiający piękny niesamowity obraz" nic nie mówi AI. "Podświetlenie złotej godziny tworzące długie cienie na brukowanych ulicach" mówi mu dokładnie, co wyrenderować.
Magia Kolorowania Mangi i Tłumaczenia
Ta technika była moim pierwszym oszałamiającym odkryciem z Nano Banana Pro i pozostaje jedną z najbardziej imponujących możliwości, jakie widziałem. Zdolność do wzięcia czarno-białej strony mangi, pokolorowania jej i przetłumaczenia tekstu — wszystko w jednym prompcie — fundamentalnie zmienia przepływy pracy dla fanów mangi, wydawców i twórców treści.
Oto jak to odkryłem. Zawsze miałem trudności z czytaniem czarno-białej mangi. Jest coś w gęstej informacji wizualnej bez wskazówek kolorystycznych, co utrudnia mi śledzenie akcji. Próbowałem różnych narzędzi do kolorowania, ale wszystkie wymagały znacznej pracy ręcznej i nie radziły sobie z tekstem.
Tej pierwszej nocy z Nano Banana Pro załadowałem stronę z Demon Slayer i wpisałem prosty prompt: "Zmień ten obraz na kolorowy, przetłumacz na angielski i umieść tekst w odpowiednich dymkach, zachowaj wszystko inne bez zmian, a następnie daj mi obraz."
To, co wróciło, było oszałamiające. Kolory były żywe i odpowiednie dla postaci — zielona szachownica Tanjiro wyrenderowana idealnie. Japoński tekst w dymkach został zastąpiony dokładnymi angielskimi tłumaczeniami. Kreska została zachowana. Wyglądało to jak oficjalne wydanie w kolorze.
Transform this black-and-white manga panel:
1. Colorize with vibrant, anime-appropriate colors
2. Translate all Japanese text to English
3. Place translated text in the appropriate speech bubbles
4. Preserve all original character expressions and composition
5. Return as a complete, print-ready image
Zaawansowane Techniki Mangi
Ale prawdziwa magia polega na tym, że możesz pójść dalej. Znacznie dalej. Możesz przekształcić tę samą stronę mangi w zupełnie inne style:
// 3D Plush Style (Styl Pluszowy 3D)
Transform this manga into 3D plush/fuzzy texture style.
Keep the characters recognizable but render them as if they
were soft plush toys. Maintain speech bubbles and text.
// Medieval Mosaic Style (Styl Średniowiecznej Mozaiki)
Transform this manga into medieval stone mosaic style,
like religious artwork from ancient churches. Give it a
sacred, reverent feeling while preserving the story panels.
// Bronze Relief Style (Styl Płaskorzeźby z Brązu)
Convert this manga page into bronze relief sculpture style.
Render characters and scenes as if they were embossed in
aged bronze metal, with appropriate patina and lighting.
Spędziłem godziny tej pierwszej nocy, tworząc tę samą scenę mangi w dziesiątkach stylów — miedzioryty, akwarele, pixel art, plastelina. Każda transformacja zachowywała strukturę historii, jednocześnie całkowicie zmieniając podejście wizualne. Otwiera to możliwości dla fan artu, materiałów edukacyjnych i projektów kreatywnych, które wcześniej po prostu nie były wykonalne.
Wskazówka pro dla kolorowania mangi: Nano Banana Pro rozumie konwencje postaci anime. Nie musisz określać kolorów włosów dla znanych postaci — wie, że Tanjiro ma czarne włosy z bordowymi końcówkami i haori w zieloną kratkę. Ta wbudowana wiedza sprawia, że kolorowanie jest szybsze i dokładniejsze.
Profesjonalne Projektowanie Plakatów i Wizualizacji
Projektowanie plakatów było miejscem, w którym naprawdę zacząłem rozumieć moc renderowania tekstu Nano Banana Pro. Wcześniejsze modele AI mogły generować piękne obrazy, ale w momencie, gdy potrzebowałeś tekstu — tytułów, napisów końcowych, sloganów — wracałeś do ręcznej pracy w Photoshopie. Nano Banana Pro zmienia to równanie całkowicie.
Pozwólcie, że przeprowadzę was przez kilka konkretnych przykładów, które demonstrują, co jest teraz możliwe:
Kinowe Plakaty Filmowe
Create a movie poster for 'Robot Dreams' in retro mid-century animation style.
Scene: Anthropomorphic dog and boxy blue-grey robot walking hand-in-hand on a
sandy beach at sunset, facing a dilapidated amusement park pier with a large
ferris wheel and roller coaster. Deep orange sky.
Style: Flat illustration, bold outlines, warm retro color palette.
Typography: Title "ROBOT DREAMS" in huge bold letters at top center, deep orange
color. Small festival logos at top edge. White review quotes scattered around
characters.
Mood: Nostalgic, melancholic, heartwarming.
Wynik wygląda nie do odróżnienia od prawdziwych plakatów filmowych vintage. Tekst jest ostry i odpowiednio sformatowany (kerning). Styl ilustracji jest spójny w całości. Nawet subtelne detale, takie jak laury festiwalowe i cytaty z recenzji, renderują się poprawnie.
Plakaty z Dużą Ilością Typografii
Tutaj rzeczy stają się naprawdę imponujące. Złożona typografia z wieloma czcionkami, rozmiarami i stylami, której wcześniejsze modele AI po prostu nie potrafiły uchwycić:
Art poster for the film "Dead Poets Society".
Classic artistic style with a scene depicting the iconic
standing-on-desks moment. Main title in flowing artistic
hand-brushed calligraphy style with elegant, thin brushstrokes.
English subtitle "Carpe Diem" below in refined sans-serif.
Tagline "Seize the day" as small text element.
Additional small production credits text for authenticity.
All text must be clear and legible. Premium quality, cinematic
atmosphere conveying wonder and inspiration.
Plakat wygenerowany z tego promptu mógłby łatwo uchodzić za profesjonalną pracę studyjną. Kaligrafia ma odpowiednią zmienność grubości pociągnięć. Kompozycja podąża za klasycznymi zasadami projektowania. Widzowie nigdy by nie zgadli, że został wygenerowany przez AI.
Projektowanie Wizualne Cyberpunk
W przypadku złożonych projektów z dużą ilością tekstu, Nano Banana Pro radzi sobie z wyzwaniem niezwykle dobrze:
Cyberpunk key visual poster with dense text elements.
Neon-lit urban environment with holographic displays showing
various text and data readouts. Main subject: a cybernetic character
with glowing implants. Multiple floating text panels with technical
specifications and warning labels.
Style: high contrast, neon colors against dark backgrounds.
Include both large display text and small detail text.
All characters must be properly formed and legible.
16:9 cinematic format.
Wskazówka projektowa: Pracując z plakatami o dużej ilości tekstu, zawsze określaj "all text must be clear and legible (cały tekst musi być jasny i czytelny)" gdzieś w swoim prompcie. Wydaje się to aktywować dodatkowe kontrole jakości w modelu, które poprawiają dokładność renderowania tekstu.
Wizualizacja Wiedzy i Diagramy
Ponieważ Nano Banana Pro jest zbudowane na możliwościach rozumowania Gemini 2.0, może generować edukacyjne diagramy i wizualizacje wiedzy, które faktycznie mają sens. Nie chodzi tylko o renderowanie ładnych obrazków — chodzi o dokładne przedstawianie złożonych informacji.
Przetestowałem to, prosząc o stworzenie diagramu strukturalnego słynnych historycznych budowli. Bez dostarczania żadnych obrazów referencyjnych, po prostu zapytałem:
Generate a detailed structural diagram of a Gothic cathedral
with comprehensive explanatory text. Show the flying buttress system,
the nave and transept layout, and the multi-story elevation.
Include detailed annotations explaining the construction techniques
that have allowed these medieval structures to survive for centuries.
All text must be clear and legible.
Wynik był oszałamiający. Diagram dokładnie pokazał cuda inżynierii strukturalnej architektury gotyckiej. Proporcje pasowały do rzeczywistych budynków. A adnotacje dostarczyły dokładnych informacji historycznych i inżynieryjnych. To jest zdolność rozumowania w działaniu — model faktycznie wie o historii architektury i potrafi przedstawić tę wiedzę wizualnie.
Dokumentacja Rzemiosła Tradycyjnego
Kolejnym potężnym zastosowaniem jest dokumentowanie tradycyjnego rzemiosła i technik:
Create a detailed visual guide to traditional Japanese sashiko
embroidery techniques. Show the different stitch patterns with
close-up examples. Include the traditional indigo and white color palette.
Demonstrate needle angles and thread tensions for achieving different
effects. Add comprehensive explanatory text covering the history and
regional variations of this craft. Educational infographic style
with clear layout.
Diagramy Koncepcji Technicznych
Dla science fiction i pracy koncepcyjnej, Nano Banana Pro może tworzyć imponującą dokumentację techniczną:
Detailed technical exploded view diagram of a cyberpunk prosthetic eye.
Show all internal components: optical sensors, neural interface
connections, power supply, processing unit, adjustment mechanisms.
Label each component with technical specifications. Include cross-section
view showing how it interfaces with the optic nerve. Photorealistic
rendering with technical drawing annotations. Futuristic but
scientifically plausible design.
Poziom szczegółowości w tych diagramach technicznych rywalizuje z tym, co wyprodukowałby profesjonalny artysta koncepcyjny, ale generuje się w kilka sekund. Dla projektantów gier, pisarzy science fiction i artystów koncepcyjnych jest to niesamowite narzędzie do szybkiego prototypowania.
Oszałamiająca Zdolność Rozwiązywania Zadań Matematycznych
To mnie szczerze zszokowało. Nano Banana Pro nie tylko generuje obrazy — potrafi rozwiązywać problemy matematyczne i renderować proces rozwiązania jako odręcznie zapisaną stronę roboczą. Silnik rozumowania stojący za generowaniem obrazu faktycznie przepracowuje logikę matematyczną.
Przetestowałem to na problemie geometrycznym obejmującym trójkąty i obliczenia kątów. Załadowałem zrzut ekranu problemu i poprosiłem:
Draw a sheet of scratch paper showing the complete solution
to this math problem. Show all work including diagrams,
equations, and step-by-step calculations. Make it look like
authentic student handwriting with natural variations.
Include geometric sketches where relevant.
To, co wróciło, było realistycznie wyglądającą stroną odręcznej matematyki, kompletną z:
- Diagramami geometrycznymi z oznaczonymi kątami i bokami
- Manipulacją algebraiczną krok po kroku
- Poprawnie zastosowanymi twierdzeniami i wzorami
- Zakreśloną odpowiedzią końcową
- Naturalnymi niedoskonałościami pisma ręcznego, które sprawiały, że wyglądało autentycznie
I tu jest rzecz — matematyka była faktycznie poprawna. Model nie stworzył tylko czegoś, co wyglądało jak rozwiązanie; przepracował rzeczywiste rozumowanie matematyczne i doszedł do właściwej odpowiedzi. Dla twórców treści edukacyjnych, usług korepetycji lub każdego, kto musi pokazać pracę matematyczną, jest to niezwykłe.
Ważne Zastrzeżenie
Chociaż Nano Banana Pro radzi sobie z matematyką przez większość czasu, zawsze powinieneś weryfikować rozwiązania dla czegokolwiek ważnego. Rozumowanie jest imponujące, ale nie nieomylne. Widziałem okazjonalne błędy w złożonych problemach wieloetapowych.
Transformacje z Papieru na Tablicę
Jednym z najbardziej praktycznych zastosowań, jakie znalazłem, jest przekształcanie długich treści — prac badawczych, artykułów, dokumentacji technicznej — w wizualne podsumowania na tablicy. Ta technika została wyróżniona przez badaczy na X (dawniej Twitter) i stała się jednym z moich ulubionych przepływów pracy.
Podstawowe podejście jest proste: dostarcz dokument tekstowy (jako przesłany PDF, wklejony tekst lub przez zrzut ekranu) i poproś o wizualne podsumowanie w stylu tablicy:
Transform this research paper/article into a detailed whiteboard
photo showing the key concepts, relationships, and findings.
Use a natural handwritten style with:
- Boxes and containers for main concepts
- Arrows showing relationships and flow
- Bullet points for key details
- Simple diagrams where helpful
- Color coding for different themes
Make it look like an actual photographed whiteboard with
realistic lighting and perspective. Include all important
information in a scannable, hierarchical layout.
Przetestowałem to z długim artykułem technicznym o architekturze LLaMA 3. Nano Banana Pro wygenerowało podsumowanie na tablicy, które uchwyciło kluczowe innowacje, decyzje architektoniczne, podejście do treningu i wyniki benchmarków — wszystko w formacie, który można było zrozumieć na pierwszy rzut oka.
Zastosowania są ogromne:
- Studenci: Przekształcaj notatki z wykładów lub rozdziały podręczników w wizualne pomoce naukowe
- Badacze: Twórz szybkie wizualne podsumowania artykułów do prezentacji
- Nauczyciele: Generuj wyjaśnienia w stylu tablicy bez faktycznego pisania na tablicy
- Twórcy treści: Przekształcaj treści pisane w angażujące formaty wizualne
Jak zauważył jeden z badaczy, ta zdolność mogłaby zasadniczo zastąpić potrzebę ręcznego wypisywania wyjaśnień na tablicach przez nauczycieli — chociaż twierdziłbym, że lepiej używać jej jako uzupełnienia, a nie zamiennika.
Generowanie Interfejsów Gier
Nano Banana Pro najwyraźniej zostało przeszkolone na ogromnym korpusie nagrań z gier i zrzutów ekranu, ponieważ jego zdolność do generowania przekonujących interfejsów gier jest niezwykła. To wykracza poza proste makiety — rozumie konwencje UI gier, elementy specyficzne dla gatunku, a nawet regionalne różnice w projektowaniu gier.
Gra Eksploracji Głębin Morskich
Generate a screenshot from a deep-sea exploration game similar to Dave the Diver.
Scene: Diver encountering a massive unknown creature in the abyss.
UI elements:
- Depth indicator showing 850m
- Oxygen gauge at 40%
- Inventory slots in bottom left
- Mini-map in top right corner
- "WARNING: Unknown lifeform detected" alert
Style: Pixel art with modern lighting effects, atmospheric fog, bioluminescent creatures.
Zrzut Ekranu Gry FPS
Generate a screenshot from a Call of Duty style first-person shooter,
but the enemy is a Shiba Inu dog (Cheems meme). Full FPS interface
with crosshairs, ammo counter, minimap, health bar, and killstreak
indicators. The Cheems should be in tactical gear. Photorealistic
graphics style with cinematic lighting. Include hit markers and
slight motion blur for action feel.
To połączenie poważnej mechaniki gry z absurdalnym humorem generuje zabawne wyniki, które wyglądają całkowicie autentycznie. Elementy UI są idealnie rozmieszczone i odpowiednio wystylizowane dla gatunku.
Interfejsy Gier MOBA
Tam, gdzie robi się naprawdę interesująco, jest zrozumienie przez Nano Banana Pro specyficznej kultury gier. Gdy poproszono go o wygenerowanie interfejsów League of Legends lub podobnych MOBA pokazujących graczy wchodzących w interakcje na czacie, generuje on kontekstowo odpowiedni dialog:
Generate a League of Legends in-game screenshot showing an intense
team fight in progress. In the chat area (bottom left), show players
having a heated argument about game strategy. Include typical MOBA UI
elements: ability bar, minimap, scoreboard, item slots. The chat should
look like authentic player behavior during a competitive match.
Model rozumie kontekst kulturowy różnych społeczności graczy i reprezentuje je dokładnie — czasami aż za bardzo. Dla projektantów gier, twórców treści i każdego w przestrzeni gier jest to niesamowicie przydatna umiejętność.
Renderowanie i Fotografia Produktowa
Fotografia produktowa to miejsce, w którym połączenie renderowania tekstu, kontroli oświetlenia i inteligencji kompozycyjnej Nano Banana Pro naprawdę błyszczy. Zdolność do umieszczania produktów w dowolnym środowisku przy zachowaniu spójności marki otwiera przepływy pracy, które byłyby kosztowne lub niemożliwe przy tradycyjnej fotografii.
Przykład Okładki Albumu
Pozwólcie mi przejść przez szczegółowy przykład demonstrujący pełną zdolność. Zacząłem od prostego pomysłu: fikcyjnej okładki albumu. Najpierw wygenerowałem CD i pudełko:
Generate a CD album product shot. Album title
"MIDNIGHT ECHOES" in stylized modern typography. Album art shows
surreal, dreamlike imagery blending electronic and organic elements.
Include both the CD and jewel case. Studio lighting,
clean white background, product photography style.
Teraz tutaj robi się ciekawie. Z tym ustalonym produktem mogłem umieścić go w dowolnym środowisku, zachowując idealną spójność:
// 90s Record Store (Sklep Muzyczny z Lat 90.)
Place this CD product on a wooden shelf in a 1990s record
store. Surrounded by vinyl records and old cassette tapes. Warm
tungsten lighting, neon sign reflections in the background,
dust particles floating in the air. Nostalgic atmosphere.
// Surreal Floating (Surrealistyczne Unoszenie)
The CD is floating in mid-air surrounded by shattered glass
fragments and floating clock gears. Concept: "dreams" and
"time travel". Cinematic lighting, dramatic composition.
// CD Player Scene (Scena z Odtwarzaczem CD)
The CD is being placed into a portable CD player. CD case
stands nearby. Late afternoon sunset light through curtains.
Wooden table surface. Cozy, contemplative mood.
// Concert Scene (Scena Koncertowa)
Place this product in a stadium concert environment.
Crowd energy, stage lighting, massive screens in background.
The CD appears impossibly large, like a concert prop.
W każdym środowisku tekst na płycie CD pozostawał ostry i czytelny. Produkt zachował swoją tożsamość wizualną, jednocześnie naturalnie dostosowując się do każdych nowych warunków oświetleniowych i kontekstu. Dla e-commerce, kampanii marketingowych czy wizualizacji marki, to rewolucja.
Techniczne Zdjęcia Produktowe
W przypadku bardziej technicznej fotografii produktowej, Nano Banana Pro dba o szczegóły, które mają znaczenie:
iPhone 17 Pro, Cosmic Orange, rear 45-degree angle emphasizing back design
and camera module.
Background: Soft gradient tech-aesthetic abstract pattern with natural flowing
movement and modern art atmosphere. Avoid pure black. Emphasize light-shadow
interplay and subtle color transitions.
Floating text elements around device: "A19 Pro Chip", "8x Optical Zoom",
"48MP Rear Camera" — modern floating layout, transparent text boxes, clean
and tech-forward aesthetic.
Overall: Dynamic, futuristic, professional product photography quality.
Odkrycie Koralików do Prasowania
To był kompletny przypadek. Eksperymentowałem z różnymi stylami rękodzieła, kiedy natknąłem się na niezwykłą zdolność Nano Banana Pro do generowania sztuki z koralików do prasowania (znanych również jako fuse beads lub hama beads). Wyniki są tak spójne i urocze, że stał się to jeden z moich ulubionych stylów estetycznych.
3D perler bead art: a display box containing an exquisite figurine.
Style: Photorealistic rendering showing individual bead textures, glossy
finish, professional product photography lighting.
Include: Visible bead grid pattern, subtle shadows between beads, slight
imperfections for authenticity.
Model rozumie, że koraliki do prasowania mają określone cechy — cylindryczny kształt, niewielką przerwę między koralikami, sposób, w jaki łączą się w punktach styku. Renderuje te szczegóły dokładnie, zachowując jednocześnie uroczy wygląd, który sprawia, że ten styl rękodzieła jest tak atrakcyjny.
Wariacje, które działają pięknie:
- Psy z koralików: Różne rasy przedstawione w estetyce pixel-art-spotyka-rękodzieło
- Koty z koralików z kartami kolorów: Pokaż postać obok użytych kolorów koralików
- Dioramy z koralików: Pełne sceny zbudowane z estetyki fuse bead
- Breloczki z koralików: Mniejsze projekty odpowiednie dla makiet towarów
Dla projektantów wzorów rękodzieła, twórców towarów lub każdego, kto kocha tę uroczą estetykę, Nano Banana Pro to kopalnia złota.
Miejskie Plakaty Promocyjne
Wiedza Nano Banana Pro o świecie rozciąga się na geografię i zabytki. Zna kultowe budynki głównych miast i potrafi je skomponować w spójne materiały promocyjne. Jest to szczególnie imponujące w przypadku miast o złożonym dziedzictwie architektonicznym.
Generate a New York City promotional poster. Background features
iconic landmarks: Empire State Building, Statue of Liberty, Brooklyn
Bridge, One World Trade Center, Times Square. Landmarks should have
visual hierarchy with clear primary and secondary emphasis.
Clean line-art illustration style with a bold color scheme.
Central large typography: "NEW YORK" with smaller text "The City
That Never Sleeps" nearby. Tagline below: "Where Dreams Take Flight".
Include modern elements like yellow taxis and subway entrances to
show contemporary New York.
Clean, flowing composition with natural element arrangement.
Emphasize the blend of historic landmarks and modern energy.
Dynamic, metropolitan atmosphere.
Model poprawnie identyfikuje i renderuje charakterystyczne cechy każdego zabytku — iglicę Art Deco Empire State Building, miedzianą patynę Statuy Wolności, gotyckie wieże Mostu Brooklińskiego. Rozumie również język wizualny marketingu turystycznego i stosuje odpowiednią stylistykę.
Storyboardy Komiksowe i Sztuka Sekwencyjna
Dla twórców pracujących nad komiksami, mangą lub storyboardami, zdolność Nano Banana Pro do generowania sekwencji wielopanelowych to znaczna oszczędność czasu. Rozumie przepływ narracyjny, kompozycję paneli i jak wizualizować emocjonalne momenty.
Generate a 5-panel manga sequence depicting an epic battle:
Panel 1: Hero stands on a mountain peak. Villain emerges from shadows.
Tense atmosphere.
Panel 2: Their eyes meet. Battle is imminent. Close-up split composition.
Panel 3: Intense combat. Lightning flashes. Hero charges with glowing
weapon, Villain counters with dark energy.
Panel 4: Mid-air collision. Energy waves explode outward. Dynamic action pose.
Panel 5: Both warriors face each other. Hero's eyes show determination,
Villain's show complex emotion.
Style: Shonen manga action style. High contrast. Speed lines. Dramatic shadows.
Model rozumie słownictwo wizualne mangi — linie prędkości, klatki uderzenia, emocjonalne zbliżenia, dynamiczne kąty. Utrzymuje spójność postaci w panelach i tworzy autentyczny przepływ narracyjny, a nie tylko pięć niepowiązanych obrazów.
Testowałem to z różnymi scenariuszami:
- Emocjonalne sceny pożegnania — melancholijny, wzruszający ton
- Momenty relacji mistrz-uczeń — kontemplacyjne, złożone
- Oryginalne postacie w scenariuszach okruchów życia
- Sekwencje akcji w stylach nie-anime
Główne ograniczenie, jakie zauważyłem: czasami panele 1 i 2 lub 4 i 5 mogą być zbyt podobne, jeśli prompt nie określa wystarczającego zróżnicowania. Dodanie odrębnych elementów wizualnych lub kątów kamery do opisu każdego panelu pomaga tego uniknąć.
Jakość 4K i Praca nad Detalami
Zdolność natywnego wyjścia 4K Nano Banana Pro nie dotyczy tylko liczb rozdzielczości — chodzi o poziom szczegółowości, który staje się możliwy. Dla fotografii zbliżeniowej, zdjęć produktów i każdej aplikacji, w której liczą się drobne detale, zmienia to wykonalność.
Generate a 4K ultra-detailed macro photograph of a Monarch
butterfly resting on a yellow flower. Focus precisely on the
wing scales and texture, showing the individual scales that
create the pattern. Capture petal texture at equal detail level.
Soft diffused lighting, shallow depth of field with creamy
bokeh background. Natural color palette with slight warmth.
Scientific accuracy in butterfly anatomy. The kind of shot that
would win a nature photography competition.
Kiedy powiększysz wynikowy obraz, możesz zobaczyć poszczególne łuski skrzydeł, ziarna pyłku i strukturę komórkową płatków kwiatów. Ten poziom szczegółowości był wcześniej osiągalny tylko za pomocą specjalistycznego sprzętu do makrofotografii i znacznej obróbki końcowej.
Kiedy Używać 4K
Standardowa Jakość
Szybkie generowanie (3-5 sekund) z doskonałą jakością dla większości przypadków użycia:
- Eksploracja koncepcji i burza mózgów
- Treści do mediów społecznościowych
- Wstępne szkice przed ostatecznym dopracowaniem
- Potrzeby generowania o dużej objętości
- Proste kompozycje bez drobnego tekstu
Wysoka Jakość / 4K
Wydłużony czas generowania (8-15 sekund) dla maksymalnej wierności:
- Ostateczne obrazy produkcyjne
- Praca z gęstym tekstem i typografią
- Złożone infografiki z drobnymi szczegółami
- Fotorealistyczne portrety
- Materiały gotowe do druku
Do burzy mózgów i iteracji trzymaj się domyślnej rozdzielczości, aby utrzymać szybkie pętle informacji zwrotnej.
Spójność Postaci na Obrazach
Jednym z historycznie najtrudniejszych problemów w generowaniu obrazów AI było utrzymanie spójności postaci na wielu obrazach. Generowałeś postać, którą pokochałeś, a następnie próbowałeś umieścić ją w innej pozie lub środowisku i nagle wyglądała jak zupełnie inna osoba.
Nano Banana Pro robi znaczne postępy w tym problemie dzięki możliwości wprowadzania wielu obrazów. Możesz dostarczyć obrazy referencyjne, a model zachowa tożsamość w nowych generacjach.
Step 1: Establish Characters (Ustal Postacie)
"Generate a character reference sheet for Person 1: a 30-year-old Asian
woman with shoulder-length black hair, warm brown eyes, and a friendly
smile. Show front view, side profile, and three-quarter angle."
Step 2: Create Scenes (Stwórz Sceny)
"Person 1 is sitting at a café table, reading a book. Morning light
through the window. Casual clothing."
Step 3: Change Context (Zmień Kontekst)
"Person 1 is now at a business meeting, wearing professional attire.
Same character, different setting."
Step 4: Multiple Characters (Wiele Postaci)
"Person 1 and Person 2 (establish Person 2 first) are walking together
in a park. Autumn afternoon lighting."
Ten przepływ pracy jest przełomowy dla:
- E-commerce modowy: Pokazywanie tej samej modelki w wielu strojach bez drogich sesji zdjęciowych
- Projektowanie postaci: Eksplorowanie wariacji przy zachowaniu tożsamości
- Tworzenie komiksów/mangi: Utrzymywanie spójności protagonistów w scenach
- Treści wirtualnych influencerów: Generowanie spójnej postaci w postach
- Tworzenie zasobów do gier: Postacie w wielu pozach i ekspresjach
Wskazówka pro dla spójności postaci: Dostarczając obrazy referencyjne, dołącz co najmniej jedno dobrze oświetlone zdjęcie twarzy z przodu. Model używa tego do zakotwiczenia tożsamości. Dodatkowe kąty pomagają, ale nie są tak krytyczne jak ta główna referencja.
Oficjalne Szablony Scen Google
Google udostępniło oficjalne szablony promptów dla typowych przypadków użycia. Przetestowałem je obszernie i chcę podzielić się moimi ulepszonymi wersjami opartymi na rzeczywistych wynikach. Każdy szablon podąża za spójną strukturą, na którą model reaguje niezawodnie.
Szablon Fotografii Fotorealistycznej
Struktura: Typ Ujęcia + Temat + Akcja/Wyraz + Środowisko + Oświetlenie + Parametry Kamery + Proporcje
A photorealistic [shot type] of [subject], [action or expression],
set in [environment]. The scene is illuminated by [lighting description],
creating a [mood] atmosphere. Captured with a [camera/lens details],
emphasizing [key textures and details]. The image should be in a
[aspect ratio] format.
A photorealistic close-up portrait of an elderly Japanese ceramicist
inspecting a tea bowl, golden hour light streaming through a window
to the left, creating a contemplative atmosphere. Captured with an
85mm lens at f/2.8, emphasizing skin texture, weathered hands, and
the ceramic's glaze. 16:9 format.
Szablon Ilustracji i Naklejki
Struktura: Styl + Temat + Kluczowe Cechy + Paleta Kolorów + Styl Linii + Tło
A [style] sticker of a [subject], featuring [key characteristics]
and a [color palette]. The design should have [line style] and
[shading style]. The background must be [background requirement].
Szablon Projektu Marki
Struktura: Typ Obrazu + Marka/Koncepcja + Treść Tekstowa + Typografia + Styl Projektu + Schemat Kolorów
Create a [image type] for [brand/concept] with the text "[exact text]"
in a [font style]. The design should be [style description], with a
[color scheme]. Include [additional design elements]. The overall feel
should communicate [brand values/message].
Szablon Fotografii Produktowej
Struktura: Opis Produktu + Tło + Ustawienie Oświetlenia + Kąt Kamery + Kluczowe Szczegóły + Proporcje
A high-resolution, studio-lit product photograph of a [product description]
on a [background surface]. The lighting is a [lighting setup] to
[lighting purpose]. Camera angle is a [angle type] to showcase
[specific feature]. Ultra-realistic, with sharp focus on [key detail].
[Aspect ratio].
Szablon Minimalistycznej Przestrzeni Negatywnej
Struktura: Pozycja Tematu + Pusta Przestrzeń Tła + Oświetlenie + Proporcje
A minimalist composition featuring a single [subject] positioned
in the [position: bottom-right/top-left/etc.] of the frame.
The background is a vast, empty [color] canvas, creating significant
negative space. Soft, subtle lighting from [direction]. [Aspect ratio].
Szablon Panelu Komiksowego
Struktura: Styl Artystyczny + Postać/Akcja na Pierwszym Planie + Ustawienie Tła + Dialog/Podpis + Nastrój
A single comic book panel in a [art style] style. In the foreground,
[character description and action]. In the background, [setting details].
The panel has a [dialogue/caption box] with the text "[exact text]".
The lighting creates a [mood] mood. [Aspect ratio].
Zaawansowane Techniki Edycji Obrazu
Poza generowaniem tekstu na obraz, Nano Banana Pro doskonale radzi sobie z modyfikowaniem istniejących obrazów. Kluczem jest zrozumienie, jak jasno opisać swoje edycje, jednocześnie określając, co powinno pozostać niezmienione.
Kontrakt Zmień vs Zachowaj
Podczas edycji obrazów używam specyficznej struktury skoncentrowanej na jasności co do tego, co powinno, a co nie powinno się zmienić:
KEEP: [Elements that must remain unchanged] (ZACHOWAJ: Elementy, które muszą pozostać niezmienione)
- "Preserve the person's exact facial features and expression"
- "Maintain the original lighting direction and intensity"
CHANGE: [Specific modifications required] (ZMIEŃ: Wymagane konkretne modyfikacje)
- "Replace the background with a sunset beach scene"
- "Change the shirt color from blue to red"
HOW: [Style and quality direction] (JAK: Kierunek stylu i jakości)
- "Ensure natural lighting integration"
- "Match the original image's color grading"
CONSTRAINTS: [What to avoid] (OGRANICZENIA: Czego unikać)
- "Do not alter any facial features"
- "Avoid changing the shadow directions"
Dodawanie i Usuwanie Elementów
Using the provided image of [subject], please add [element]
to the scene. Position it [location description]. Ensure the addition
[integration description: matches lighting, fits perspective, etc.].
Keep all other elements exactly as they appear in the original.
Using this image of my cat, add a small knitted wizard hat
on its head. The hat should sit naturally, matching the soft
lighting of the photo. Keep the cat's expression, pose, and
all background elements unchanged.
Transfer Stylu
Transform the provided photograph of [subject] into the artistic
style of [artist/art movement]. Preserve the original composition
but render all elements with [description of stylistic elements].
Example: Transform this photograph of a modern city street at night
into Vincent van Gogh's "Starry Night" style. Preserve the composition
of buildings and cars but render everything with swirling, impasto
brushstrokes and a dramatic palette of deep blues and bright yellows.
Kompozycja Wielu Obrazów
Create a new image combining elements from the provided images.
Take [element from Image 1] and place it with/on [element from Image 2].
The final image should be [description of desired result].
Example: Combine these images - take the rocket ship from Image 1
and place it launching from the tropical island beach in Image 2.
Final image should show a peaceful beach scene with a rocket
dramatically launching in the background, sunset lighting.
Zachowanie Tożsamości o Wysokiej Wierności
W przypadku edycji, w których zachowanie tożsamości twarzy jest krytyczne:
Using the provided images, place [element from Image 2] onto
[subject in Image 1]. Ensure the features of [subject] remain
completely unchanged — same facial structure, expression, and
proportions. The added element should integrate naturally with
[description of integration requirements].
Example: Take the woman with brown hair and blue eyes from Image 1.
Add the logo from Image 2 onto her black t-shirt. Keep her face
and features exactly unchanged. The logo should look naturally
printed on the fabric, following the folds of the shirt.
Od Szkicu do Rzeczywistości
Transform this rough [medium: pencil/marker/digital] sketch of
[subject] into a [style description] finished image. Keep the
[specific features to preserve] from the sketch but add
[new details/materials/finishes].
Example: Transform this rough pencil sketch of a futuristic car
into a polished showroom photo of the finished concept car.
Keep the sleek lines and low profile from the sketch but add
metallic blue paint and neon rim lighting.
Błędy, Które Zabijały Moje Wyniki
Nauczenie się, czego NIE robić, jest równie ważne, jak nauczenie się, co robić. Oto błędy, które konsekwentnie dawały słabe wyniki, dopóki ich nie zidentyfikowałem i nie wyeliminowałem.
Błąd 1: Upchanie Słów Kluczowych
Co robiłem: Dodawanie słów kluczowych jakości, takich jak "masterpiece, ultra-detailed, 8K, trending on ArtStation, unreal engine" do każdego promptu.
Dlaczego to zawiodło: Nano Banana Pro jest trenowane inaczej niż starsze modele. Te słowa kluczowe albo nie mają efektu, albo mogą faktycznie zmylić model co do twojej rzeczywistej intencji.
Lepsze podejście: Skup się na opisowej specyficzności zamiast na słowach kluczowych jakości. Opisz dokładnie to, co chcesz zobaczyć.
Błąd 2: Negatywne Promptowanie
Co robiłem: Pisanie "no blur, no artifacts, no deformed hands, no extra fingers (bez rozmycia, bez artefaktów, bez zdeformowanych rąk, bez dodatkowych palców)".
Dlaczego to zawiodło: Nano Banana Pro nie obsługuje negatywnego promptowania w taki sam sposób jak modele dyfuzyjne. Mówienie mu, czego nie robić, może faktycznie wprowadzić te elementy.
Lepsze podejście: Opisz to, co chcesz, pozytywnie. Zamiast "bez rozmycia", powiedz "ostra ostrość".
Błąd 3: Niejasne Referencje Stylu
Co robiłem: Pisanie "beautiful image, stunning, amazing, gorgeous (piękny obraz, oszałamiający, niesamowity, wspaniały)".
Dlaczego to zawiodło: Te słowa nie dostarczają użytecznych informacji. To, co czyni coś "pięknym", jest subiektywne.
Lepsze podejście: Opisz konkretne cechy wizualne. "Ciepła paleta kolorów ze złotymi refleksami" mówi modelowi dokładnie, co wyrenderować.
Błąd 4: Ignorowanie Proporcji Obrazu
Co robiłem: Nie określanie proporcji obrazu, a następnie próba przycięcia wyników, aby pasowały do moich potrzeb.
Dlaczego to zawiodło: Model komponuje obrazy inaczej w zależności od proporcji. Kwadratowa kompozycja ma inną równowagę niż kinowe szerokie ujęcie.
Lepsze podejście: Zawsze określaj docelowe proporcje z góry. "16:9 poziomo," "9:16 pionowo," "1:1 kwadrat."
Błąd 5: Nadmierne Komplikowanie Promptów
Co robiłem: Próba określenia każdego możliwego szczegółu w jednym ogromnym prompcie.
Dlaczego to zawiodło: Powyżej pewnej złożoności elementy zaczynają się gubić lub wchodzić ze sobą w konflikt.
Lepsze podejście: Zacznij od kluczowych elementów, wygeneruj, a następnie udoskonalaj poprzez ukierunkowane działania następcze.
Błąd 6: Zapominanie o Trybie Myślenia
Co robiłem: Używanie trybu standardowego do złożonych kompozycji.
Dlaczego to zawiodło: Tryb standardowy nie angażuje pełnych możliwości rozumowania w przypadku skomplikowanych żądań.
Lepsze podejście: W przypadku złożonych kompozycji aktywuj tryb myślenia. Pozwala to modelowi na głęboką analizę relacji przestrzennych przed generowaniem.
Meta-lekcja: Nano Banana Pro to partner w rozmowie, a nie automat do gry. Traktuj go jak reżyserowanie bardzo zdolnego artysty — daj jasny kierunek, przejrzyj wyniki, udoskonalaj wspólnie. Podejście iteracyjne wygrywa z próbą osiągnięcia perfekcji w jednym prompcie.
Integracja API dla Deweloperów
Dla deweloperów, którzy chcą zintegrować Nano Banana Pro z aplikacjami, API jest dostępne za pośrednictwem Google AI Studio i Vertex AI. Oto kluczowe szczegóły techniczne:
Podstawowe Żądanie Generowania
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_images(
model='imagen-3.0-generate-002', # Nano Banana Pro
prompt='A photorealistic portrait of a robot barista...',
config=types.GenerateImagesConfig(
number_of_images=1,
aspect_ratio='16:9',
output_mime_type='image/jpeg'
)
)
# Access the generated image
image_data = response.generated_images[0].image.image_bytes
Żądanie Edycji Obrazu
response = client.models.edit_image(
model='imagen-3.0-capability-001',
prompt='Change the background to a sunset beach...',
reference_images=[open('original.png', 'rb')],
config=types.EditImageConfig(
edit_mode='INPAINT',
number_of_images=1,
input_fidelity='high', # Critical for identity preservation (Kluczowe dla zachowania tożsamości)
output_mime_type='image/png'
)
)
Ustawienie input_fidelity='high' dramatycznie poprawia zachowanie tożsamości podczas wprowadzania zmian w obrazach z twarzami lub ważnymi szczegółami.
Kluczowe Parametry
aspect_ratio: "1:1", "16:9", "9:16", "4:3", "3:4", "21:9"number_of_images: 1-4 obrazy na żądanieoutput_mime_type: "image/jpeg" lub "image/png"input_fidelity: "low" (szybciej) lub "high" (lepsze zachowanie tożsamości)safety_filter_level: Kontroluje surowość filtrowania treści
Limity Stawek i Kwoty
Bądź świadomy limitów użytkowania:
- Limity kwot Gemini 2.0 Flash mają zastosowanie do generowania obrazów
- Jeśli osiągniesz swój dzienny limit, przełącz się na tryb "Szybki" (Fast), aby kontynuować standardowe generowanie
- Konta korporacyjne Vertex AI mają wyższe limity
- Rozważ wdrożenie kolejkowania żądań dla aplikacji o dużej objętości
Ostateczna Biblioteka Promptów
Zorganizowałem moje najbardziej udane prompty w kategorie dla łatwego odniesienia. Wszystkie są przetestowane i udoskonalone w wielu iteracjach.
Fotografia Portretowa
Environmental portrait of a [profession] in their workspace.
Natural window light from the left creates soft shadows.
Subject positioned at one-third mark, looking slightly off-camera.
Background shows authentic tools of their trade, slightly out of focus.
Shot at 50mm f/2.0 equivalent. Warm color temperature.
Authentic, documentary photography style.
Zdjęcia Produktowe
Hero product shot of [product] floating against a gradient
background transitioning from [color 1] to [color 2].
Three-point lighting creating dramatic shadows and highlights.
Product at slight angle showing dimensional form.
Reflection on glossy surface below.
Key features labeled with minimal floating text callouts.
4K resolution, premium brand photography aesthetic.
Style Ilustracji
Vintage travel poster for [destination] in 1930s Art Deco style.
Bold geometric shapes, limited color palette of [3-4 colors].
Iconic landmark as central focus with stylized sun rays behind.
Large sans-serif title "[DESTINATION NAME]" at top.
Small tagline "[inviting phrase]" at bottom.
Slightly distressed texture for authenticity.
Vertical format for poster printing.
Makiety UI/UX
Mobile app UI design for a [app type] application.
Modern iOS-style interface with [color scheme] accent colors.
[Screen type: home feed / profile / settings / etc.]
Include realistic content: [specific elements].
Clean typography with SF Pro or similar.
Subtle shadows and depth.
Device frame optional.
Focus on usability and visual hierarchy.
Concept Art
Concept art for a [genre: sci-fi/fantasy/etc.] [location type].
[Time of day] lighting creating [mood] atmosphere.
Key features: [list 3-5 distinctive elements].
Human figures for scale in [locations].
Painterly style with visible brushwork in backgrounds,
detailed linework for architectural elements.
Cinematic composition with strong foreground-midground-background separation.
16:9 format for game/film presentation.
Infografiki
Infographic explaining [process/concept] in [number] steps.
Clean, modern design with [color scheme].
Each step numbered with icon and brief explanation text.
Visual flow from [direction: top to bottom / left to right].
Connecting arrows or lines between steps.
Title: "[Topic Title]" at top in bold.
All text must be crisp and legible.
White or light gray background.
Suitable for [platform: social media / print / presentation].
Końcowe Przemyślenia
Tej nocy, kiedy wystartowało Nano Banana Pro, doświadczyłem czegoś, czego nie czułem od moich pierwszych spotkań z generowaniem obrazów AI: autentycznego zachwytu nad tym, co nagle stało się możliwe. Bariery, które definiowały moje przepływy pracy — ograniczenia renderowania tekstu, problemy ze spójnością, brak rozumowania — wyparowywały jedna po drugiej, gdy eksplorowałem.
Ale nauczyłem się też czegoś głębszego przez miesiące intensywnego użytkowania: narzędzie ma mniejsze znaczenie niż osoba, która nim włada. Nano Banana Pro jest niesamowicie potężne, ale ta moc jest użyteczna tylko wtedy, gdy rozumiesz, jak jasno komunikować swoją wizję, przemyślanie iterować i rozpoznawać zarówno możliwości, jak i ograniczenia technologii.
Techniki w tym przewodniku to punkty wyjścia, a nie punkty końcowe. Twórcy, którzy wykonają naprawdę niezwykłą pracę z Nano Banana Pro, to ci, którzy wezmą te fundamenty i popchną je dalej — łącząc możliwości w sposób, o którym nikt nie pomyślał, rozwiązując problemy, których nikt nie uważał za rozwiązywalne, tworząc wizualne doświadczenia, które zaskakują i zachwycają.
"Kiedy AI staje się potężniejsza, jedyną rzeczą, która nas ogranicza, jest nasza własna zubożała wyobraźnia."
Napisałem to w moich notatkach o 5 rano w noc premiery Nano Banana Pro i stało się to czymś w rodzaju zasady przewodniej. Technologia będzie się rozwijać. Pojawią się nowe możliwości. Ale fundamentalna umiejętność — tłumaczenie obrazów w twoim umyśle na instrukcje, które maszyna może wykonać — pozostanie cenna niezależnie od tego, który model jest aktualny.
Więc eksperymentuj bezlitośnie. Przesuwaj granice. Próbuj promptów, które wydają się niemożliwe. Generuj tysiące obrazów. Ucz się, co działa, i co równie ważne, co nie działa. Buduj własną intuicję co do tego, jak te systemy myślą.
Przyszłość wizualnej kreacji to współpraca — ludzie dostarczający wizję, kierunek i osąd; AI dostarczająca szybkość wykonania i możliwości techniczne. Nano Banana Pro to najzdolniejszy partner do współpracy, jakiego do tej pory mieliśmy. Pytanie nie brzmi już "czy AI może to zrobić?", ale "co powinniśmy razem stworzyć?"
Nie mogę się doczekać, aby zobaczyć, co stworzysz.
Gotowy, aby zacząć? Otwórz Gemini, włącz tryb Myślenia i wypróbuj ten prompt: "Generate a detailed movie poster for a film that exists only in my imagination — a story about [your idea]. Make the title the visual centerpiece with beautiful typography. (Wygeneruj szczegółowy plakat filmowy dla filmu, który istnieje tylko w mojej wyobraźni — historię o [twoim pomyśle]. Uczyń tytuł wizualnym centrum z piękną typografią.)" Następnie iteruj, udoskonalaj i uczyń go swoim.
Dyskusja
0 komentarzyZostaw komentarz
Bądź pierwszym, który podzieli się swoimi przemyśleniami!