ฉันอยู่ทั้งคืนเพื่อทดสอบ Nano Banana Pro และค้นพบ 15 เทคนิคสร้างสรรค์ที่น่าเหลือเชื่อ

อินเทอร์เฟซสร้างสรรค์ Nano Banana Pro แสดงงานศิลปะและการออกแบบที่สร้างโดย AI
Nano Banana Pro — ที่ซึ่งจินตนาการมาบรรจบกับการปฏิบัติงานระดับมืออาชีพ
ความลับที่ฉันค้นพบ

ความแตกต่างระหว่างภาพ AI ธรรมดาและผลงานสร้างสรรค์ที่ทำให้คุณอ้าปากค้างไม่ใช่เรื่องของโชคหรือเครื่องมือราคาแพง — มันเกี่ยวกับการทำความเข้าใจว่า Nano Banana Pro คิดอย่างไรและเรียนรู้ที่จะพูดภาษาภาพของมัน

ฉันยังจำช่วงเวลาที่แม่นยำเมื่อทุกอย่างเปลี่ยนไป มันคือเวลาตี 3 เมื่อโทรศัพท์ของฉันเริ่มสั่นไม่หยุด ชุมชนสร้างสรรค์ของฉันกำลังลุกเป็นไฟ "คุณเห็นสิ่งนี้ไหม?" "Google เพิ่งปล่อยสิ่งที่บ้าคลั่งออกมา" "ลืมทุกสิ่งที่คุณรู้เกี่ยวกับภาพ AI ไปได้เลย" ฉันขยี้ตา เปิดแล็ปท็อป และสิ่งที่ฉันเห็นได้เปลี่ยนทุกสิ่งที่ฉันคิดว่าฉันรู้เกี่ยวกับการสร้างภาพด้วย AI

Nano Banana Pro มาถึงแล้ว ไม่ใช่การอัปเดตเล็กน้อย ไม่ใช่การปรับปรุงทีละน้อย แต่เป็นการเปลี่ยนกระบวนทัศน์อย่างสมบูรณ์ ภายในไม่กี่นาทีของการทดสอบ ฉันได้สร้างข้อความที่อ่านได้จริงในหลายภาษา ลงสีมังงะด้วย prompt เดียว สร้างโปสเตอร์ภาพยนตร์ที่ดูเหมือนมาจากสตูดิโอฮอลลีวูด กลุ่มที่ฉันอยู่ระเบิดไปด้วยตัวอย่าง — แต่ละอันน่าประทับใจกว่าอันก่อนหน้า

คืนนั้นฉันไม่ได้นอน ฉันสร้างภาพหลายร้อยภาพ ทดสอบทุกเทคนิคที่ฉันนึกออก ผลักดันขีดจำกัดที่ฉันไม่รู้ว่ามีอยู่ เมื่อดวงอาทิตย์ขึ้น ฉันได้บันทึกขั้นตอนการทำงานสร้างสรรค์ใหม่ทั้งหมดแปดอย่างที่เป็นไปไม่ได้เพียง 24 ชั่วโมงก่อนหน้านั้น และในสัปดาห์ต่อมา ฉันค้นพบอีกเจ็ดอย่าง นี่คือทุกสิ่งที่ฉันได้เรียนรู้ — คู่มือฉบับสมบูรณ์สำหรับการเรียนรู้ Nano Banana Pro ที่ฉันหวังว่าจะมีอยู่เมื่อฉันเริ่มการเดินทางข้ามคืนสู่อนาคตของการสร้างภาพ AI

คืนที่ทุกอย่างเปลี่ยนไป

ให้ฉันพาคุณย้อนกลับไปในช่วงเวลานั้น ฉันใช้เครื่องมือสร้างภาพ AI มานานกว่าหนึ่งปี — DALL-E, Midjourney, Stable Diffusion, โมเดลภาพ Gemini รุ่นแรกๆ พวกมันน่าประทับใจแน่นอน แต่ทั้งหมดมีข้อจำกัดที่น่าผิดหวังเหมือนกัน การเรนเดอร์ข้อความเป็นหายนะ สคริปต์ที่ไม่ใช่ละตินออกมาเหมือนอักษรอียิปต์โบราณของมนุษย์ต่างดาว การรักษาความสม่ำเสมอของตัวละครในหลายภาพ? ลืมไปได้เลย

ฉันยอมจำนนกับขั้นตอนการทำงานของการใช้ AI สำหรับไอเดียเริ่มต้น จากนั้นใช้เวลาหลายชั่วโมงใน Photoshop เพื่อแก้ไขปัญหาที่หลีกเลี่ยงไม่ได้ ต้องเพิ่มข้อความด้วยตนเอง ใบหน้าต้องการการรีทัช มันมีประโยชน์ แต่ฉันรู้สึกเหมือนเทคโนโลยีติดอยู่ที่ 80% อย่างถาวร

จากนั้น Nano Banana Pro ก็เปิดตัว

สิ่งแรกที่ฉันลองคือโปสเตอร์ภาพยนตร์ที่มีการจัดวางตัวอักษรที่ซับซ้อน — สิ่งที่เป็นไปไม่ได้เสมอมา ฉันพิมพ์ prompt ขอการประดิษฐ์ตัวอักษรศิลปะที่ลื่นไหล ข้อความชื่อเรื่องที่มีสไตล์ และการวางตำแหน่งคำบรรยายที่หรูหรา สิ่งที่ปรากฏบนหน้าจอของฉันทำให้ฉันอุทานออกมา ตัวอักษรสมบูรณ์แบบ การจัดวางตัวอักษรสวยงาม องค์ประกอบเป็นมืออาชีพ ฉันนั่งจ้องมองมันเต็มๆ หนึ่งนาที

💡

ช่วงเวลาที่ฉันตระหนักว่า Nano Banana Pro แตกต่าง: ฉันขอให้มันสร้างการประดิษฐ์ตัวอักษรที่มีสไตล์ โดยคาดหวังความยุ่งเหยิงที่สับสนตามปกติ และได้รับตัวอักษรที่ดูเหมือนมาจากสตูดิโอออกแบบมืออาชีพแทน นั่นคือตอนที่ฉันรู้ว่ากฎได้เปลี่ยนไปแล้ว

ในชั่วโมงต่อมา ฉันค้นพบความสามารถทีละอย่างที่ฉันไม่รู้ว่าเป็นไปได้ ฉันลงสีหน้ามังงะขาวดำในขณะที่แปลข้อความพร้อมกัน ฉันสร้างพิมพ์เขียวสถาปัตยกรรมจากภาพถ่ายเดียว ฉันทำอินเทอร์เฟซเกมที่สมจริงจนเพื่อนถามว่ามาจากเกมอะไร การค้นพบแต่ละครั้งนำไปสู่อีกอย่าง และอีกอย่าง จนกระทั่งดวงอาทิตย์ขึ้นและฉันรู้ตัวว่าฉันไม่ได้ขยับจากโต๊ะทำงานมาแปดชั่วโมงแล้ว

สิ่งต่อไปนี้คือทุกสิ่งที่ฉันได้เรียนรู้ในคืนนั้นและสัปดาห์แห่งการทดลองอย่างเข้มข้นที่ตามมา นี่ไม่ใช่ภาพรวมผิวเผิน — มันคือความรู้เชิงลึกที่มาจากการผลักดันเครื่องมือเหล่านี้ไปสู่ขีดจำกัดสูงสุดและบันทึกสิ่งที่ได้ผล สิ่งที่ไม่ได้ผล และทำไม

สิ่งที่ทำให้ Nano Banana Pro แตกต่าง

ก่อนที่เราจะดำดิ่งสู่เทคนิค ให้ฉันอธิบายอย่างชัดเจนว่า Nano Banana Pro คืออะไรและทำไมมันถึงแสดงถึงการก้าวกระโดดที่สำคัญ Nano Banana Pro — มีชื่อเรียกอย่างเป็นทางการว่า Gemini 2.0 Flash Image — เป็นโมเดลสร้างภาพที่ก้าวหน้าที่สุดของ Google สร้างขึ้นบนพื้นฐานของความสามารถในการให้เหตุผลอันทรงพลังของ Gemini 2.0

นี่ไม่ใช่แค่คำพูดทางการตลาด การรวมเข้ากับ Gemini 2.0 หมายความว่า Nano Banana Pro ไม่ได้แค่ผลิตภาพตามการจับคู่รูปแบบ — มันเข้าใจสิ่งที่คุณขอจริงๆ มันมีความรู้เกี่ยวกับโลก มันสามารถคิดเกี่ยวกับความสัมพันธ์เชิงพื้นที่ บริบททางวัฒนธรรม และข้อกำหนดทางเทคนิค ถามเกี่ยวกับสถานที่สำคัญที่มีชื่อเสียงและมันรู้สไตล์สถาปัตยกรรม บริบททางประวัติศาสตร์ และวิธีการนำเสนออย่างถูกต้อง

การเรนเดอร์ข้อความที่ปฏิวัติวงการ

การเรนเดอร์ข้อความล้ำสมัยในหลายภาษาด้วยความแม่นยำในการสะกดคำที่ดีขึ้นอย่างมาก การจัดวางตัวอักษรที่ดูเป็นมืออาชีพจริงๆ ในละติน CJK และสคริปต์อื่นๆ สิ่งนี้เพียงอย่างเดียวเปลี่ยนสิ่งที่เป็นไปได้ด้วยการสร้างภาพ AI

ความรู้โลกเชิงลึก

สร้างขึ้นบนความสามารถในการให้เหตุผลของ Gemini 2.0 Flash มันเข้าใจบริบท วัฒนธรรม และความแตกต่าง มันรู้การอ้างอิงทางประวัติศาสตร์ สไตล์สถาปัตยกรรม แนวคิดทางวิทยาศาสตร์ และความแตกต่างทางวัฒนธรรม — และสามารถนำเสนอด้วยภาพได้

การควบคุมที่แม่นยำ

การควบคุมระดับสตูดิโอเหนือแสง มุมกล้อง ความชัดลึก และองค์ประกอบ ช่างภาพและนักออกแบบมืออาชีพสามารถได้รับผลลัพธ์ที่ตรงกับวิสัยทัศน์ของพวกเขาในที่สุดโดยไม่ต้องสร้างใหม่ไม่รู้จบ

การจัดองค์ประกอบหลายภาพ

รวมภาพอ้างอิงได้สูงสุด 14 ภาพเป็นองค์ประกอบเดียว รักษาความสม่ำเสมอของตัวละคร ผสมผสานสไตล์ ถ่ายโอนองค์ประกอบระหว่างภาพ — ทั้งหมดในขณะที่รักษาคุณภาพที่คุณต้องการเก็บไว้

เอาต์พุตที่ยืดหยุ่น

ความละเอียดดั้งเดิม 2K พร้อมเอาต์พุต 4K ที่เป็นตัวเลือก รองรับหลายอัตราส่วนภาพ สร้างทุกอย่างตั้งแต่วอลเปเปอร์โทรศัพท์แนวตั้งไปจนถึงองค์ประกอบภาพยนตร์จอกว้างพิเศษ 21:9

การแก้ไขอัจฉริยะ

แก้ไขภาพที่มีอยู่ด้วยคำสั่งข้อความในขณะที่รักษาองค์ประกอบที่คุณต้องการเก็บไว้ เปลี่ยนฤดูกาล สลับวัตถุ ปรับแสง — ทั้งหมดโดยไม่มีปัญหาการเลื่อนลอยที่รบกวนโมเดลก่อนหน้า

สถานที่เข้าถึง Nano Banana Pro

ปัจจุบัน Nano Banana Pro มีให้บริการผ่านหลายช่องทาง แต่ละช่องทางมีความสามารถที่แตกต่างกัน:

  • แอป Gemini: ตัวเลือกที่เข้าถึงได้ง่ายที่สุด ใน Gemini เปิดใช้งานโหมด "Thinking" (การคิด) และขอสร้างภาพเพื่อเปิดใช้งาน Nano Banana Pro สิ่งนี้ให้ความสามารถเต็มรูปแบบของโมเดลด้วยอินเทอร์เฟซแบบสนทนา
  • Google AI Studio: สำหรับนักพัฒนาและผู้ใช้ที่ต้องการการควบคุมเพิ่มเติม การเข้าถึงพารามิเตอร์ขั้นสูงและการรวมเข้ากับขั้นตอนการทำงานที่กำหนดเอง
  • Vertex AI: การเข้าถึงระดับองค์กรด้วยความสามารถ API เต็มรูปแบบสำหรับแอปพลิเคชันการผลิต
  • แพลตฟอร์มบุคคลที่สาม: บริการเช่น Lovart.ai มักจะเสนอการเข้าถึงโมเดลใหม่ก่อนใครด้วยช่วงทดลองใช้ฟรี
💡

เคล็ดลับมืออาชีพ: ในแอป Gemini การสร้างภาพที่สองด้วย prompt เดียวกันมักจะให้ผลลัพธ์ที่ดีกว่าความพยายามครั้งแรก โมเดลดูเหมือนจะใช้การสร้างครั้งแรกเป็นบริบทโดยนัยสำหรับการปรับแต่ง ฉันได้ทำให้สิ่งนี้เป็นส่วนหนึ่งของขั้นตอนการทำงานมาตรฐานของฉัน

สามความก้าวหน้าที่มีความสำคัญ

ในขณะที่ Nano Banana Pro รวมการปรับปรุงหลายสิบรายการ ความก้าวหน้าเฉพาะสามอย่างเปลี่ยนแปลงสิ่งที่เป็นไปได้ด้วยการสร้างภาพ AI โดยพื้นฐาน การทำความเข้าใจสิ่งเหล่านี้จะช่วยให้คุณใช้พลังที่แท้จริงของโมเดล

1
ความละเอียดดั้งเดิม 4K พร้อมเอาต์พุตโดยตรง

โมเดลก่อนหน้านี้ไม่สามารถสร้างภาพความละเอียดสูงได้หรือต้องการการขยายขนาดซึ่งมักจะทำให้เกิดสิ่งแปลกปลอม Nano Banana Pro สร้างภาพ 4K ดั้งเดิมโดยตรง ด้วยรายละเอียดและความชัดเจนที่สร้างขึ้นตั้งแต่เริ่มต้น นี่ไม่ใช่แค่เรื่องจำนวนพิกเซล — มันเกี่ยวกับรายละเอียดที่แท้จริงในระดับขนตาแต่ละเส้น รูปแบบการทอผ้า และความแปรผันของพื้นผิวที่ละเอียดอ่อน สำหรับการถ่ายภาพสินค้าและงานเชิงพาณิชย์ สิ่งนี้เปลี่ยนทุกอย่าง

2
อัตราส่วนภาพที่กำหนดเองโดยไม่มีการประนีประนอม

ต้องการโปสเตอร์แนวตั้ง 9:16? เฟรมภาพยนตร์ 21:9? สี่เหลี่ยมจัตุรัสที่สมบูรณ์แบบสำหรับ Instagram? Nano Banana Pro จัดการกับอัตราส่วนภาพใดๆ โดยไม่มีปัญหาองค์ประกอบที่รบกวนโมเดลก่อนหน้า AI เข้าใจวิธีการจัดองค์ประกอบภาพอย่างถูกต้องโดยไม่คำนึงถึงรูปแบบ — ตัวแบบไม่ถูกตัดออกอย่างน่าอึดอัด ข้อความไม่ล้น และความสมดุลทางสายตายังคงเป็นมืออาชีพ

3
การสร้างที่ผสานรวมการให้เหตุผล

นี่คือเรื่องใหญ่ เนื่องจาก Nano Banana Pro สร้างขึ้นบนเอนจินการให้เหตุผลของ Gemini 2.0 มันจึงไม่เพียงแค่จับคู่รูปแบบ — มันคิดเกี่ยวกับสิ่งที่คุณขอ ขอแผนผังสถาปัตยกรรมของอาคาร และมันคิดเกี่ยวกับวิศวกรรมโครงสร้าง ขอภาพประกอบทางวิทยาศาสตร์ และมันดึงมาจากความรู้ทางวิทยาศาสตร์จริง ขอการอ้างอิงทางวัฒนธรรม และมันเข้าใจบริบท ความสามารถในการให้เหตุผลนี้คือสิ่งที่ทำให้เทคนิคขั้นสูงส่วนใหญ่ในคู่มือนี้เป็นไปได้

การปฏิวัติในการเรนเดอร์ข้อความ

ฉันต้องใช้เวลาสักครู่กับการเรนเดอร์ข้อความเพราะนี่คือความสามารถที่ทำให้ฉันตกใจที่สุด เป็นเวลาหลายปีที่เครื่องมือสร้างภาพ AI นั้นไร้ประโยชน์โดยพื้นฐานสำหรับงานจริงจังใดๆ ที่เกี่ยวข้องกับข้อความนอกเหนือจากคำภาษาอังกฤษง่ายๆ การจัดวางตัวอักษรที่ซับซ้อน ฟอนต์ที่มีสไตล์ และสคริปต์ที่ไม่ใช่ละตินออกมาสับสน ซ้ำซ้อน ขาดองค์ประกอบ หรือผิดไปเลย คุณสามารถสร้างภาพที่สวยงามและจากนั้นต้องทำองค์ประกอบข้อความใหม่ทั้งหมดใน Photoshop

Nano Banana Pro เปลี่ยนสิ่งนี้อย่างสิ้นเชิง ฉันได้สร้างโปสเตอร์ภาพยนตร์ที่มีการประดิษฐ์ตัวอักษรที่ซับซ้อน บรรจุภัณฑ์สินค้าที่มีข้อมูลจำเพาะโดยละเอียด อินโฟกราฟิกที่มีข้อความหนาแน่น — ทั้งหมดเรนเดอร์อย่างถูกต้อง การจัดวางตัวอักษรไม่เพียงแค่อ่านได้; มันสวยงามจริงๆ สไตล์ฟอนต์ได้รับการเคารพ ระยะห่างตัวอักษรเป็นธรรมชาติ ความสามารถเดียวนี้เปิดหมวดหมู่ของงานทั้งหมดที่เป็นไปไม่ได้ก่อนหน้านี้

และไม่ใช่แค่ข้อความที่มีสไตล์ การเรนเดอร์ข้อความภาษาอังกฤษมาตรฐานก็ได้รับการปรับปรุงอย่างมากเช่นกัน ข้อความขนาดเล็กยังคงอ่านได้ ความแม่นยำในการสะกดคำนั้นน่าทึ่ง คุณสามารถรวมย่อหน้าของข้อความไว้ในภาพและใช้ผลลัพธ์ได้อย่างมืออาชีพจริงๆ

กรอบงาน Prompt ที่เปลี่ยนทุกอย่าง

หลังจากสร้างภาพหลายพันภาพด้วย Nano Banana Pro ฉันได้พัฒนาแนวทางที่มีโครงสร้างสำหรับ prompt ที่ให้ผลลัพธ์ที่ยอดเยี่ยมอย่างสม่ำเสมอ ลืมเทคนิคการยัดเยียดคำหลักเก่าๆ จากโมเดล AI รุ่นก่อนๆ — "masterpiece, ultra-detailed, trending on ArtStation" ไม่ช่วยอะไรที่นี่ Nano Banana Pro ตอบสนองต่อความชัดเจน โครงสร้าง และความเฉพาะเจาะจง

ฉันเรียกมันว่า กรอบงาน ICS: Image type (ประเภทภาพ), Content (เนื้อหา), และ Style (สไตล์). ทุก prompt ที่มีประสิทธิภาพที่ฉันเขียนตอนนี้เป็นไปตามโครงสร้างนี้

กรอบงาน Prompt ICS
IMAGE TYPE (ประเภทภาพ):
- [ภาพชนิดใด: ภาพถ่าย, ภาพประกอบ, แผนภาพ, โปสเตอร์, UI mockup, ฯลฯ]
- [การใช้งานที่ตั้งใจไว้และบริบทของผู้ชม]

CONTENT (เนื้อหา):
- [ตัวแบบหลักพร้อมรายละเอียดเฉพาะ]
- [คำอธิบายพื้นหลัง/สภาพแวดล้อม]
- [การกระทำหรือความสัมพันธ์ระหว่างองค์ประกอบ]
- [ข้อความใดๆ ที่ต้องปรากฏ, ในเครื่องหมายคำพูด]

STYLE (สไตล์):
- [สื่อ: ภาพถ่าย, สีน้ำ, 3D render, เวกเตอร์, ฯลฯ]
- [อ้างอิง: \"การถ่ายภาพสินค้า Apple\", \"โปสเตอร์ท่องเที่ยววินเทจ\", ฯลฯ]
- [รายละเอียดทางเทคนิค: เลนส์กล้อง, แสง, จานสี]
- [ข้อกำหนดด้านคุณภาพและความละเอียด]

กรอบงานนี้ให้บริบทที่ชัดเจนแก่โมเดลสำหรับการตัดสินใจทางภาพทุกอย่างที่ต้องทำ

หลักการของลำดับชั้น

นี่คือสิ่งที่คู่มือส่วนใหญ่จะไม่บอกคุณ: ลำดับของข้อมูลใน prompt ของคุณมีความสำคัญ องค์ประกอบที่กล่าวถึงก่อนหน้านี้มีอิทธิพลมากกว่าต่อผลลัพธ์สุดท้าย ฉันจัดโครงสร้าง prompt ของฉันโดยมีองค์ประกอบที่สำคัญที่สุดก่อน:

1
ตัวแบบก่อน

อะไรคือจุดโฟกัสหลักของภาพ? กำหนดให้ชัดเจนและรวดเร็ว "ถ้วยกาแฟเซรามิก" ดีกว่า "ภาพที่แสดงถ้วย"

2
การกระทำและความสัมพันธ์

เกิดอะไรขึ้น? องค์ประกอบสัมพันธ์กันอย่างไร? "ถ้วยตั้งอยู่บนโต๊ะไม้เก่า ไอน้ำลอยขึ้นจากกาแฟร้อน"

3
สถานที่และสภาพแวดล้อม

สิ่งนี้เกิดขึ้นที่ไหน? อะไรล้อมรอบตัวแบบ? "แสงยามเช้าส่องผ่านหน้าต่างร้านกาแฟ สร้างเงาที่นุ่มนวล"

4
สไตล์และรายละเอียดทางเทคนิค

ควรเรนเดอร์อย่างไร? กล้อง แสง หรือสไตล์ศิลปะใด? "ถ่ายด้วย Canon 5D Mark IV, เลนส์ 85mm, f/2.8, การไล่ระดับสีธรรมชาติ"

เจ็ดหลักการของการ Prompt ที่มีประสิทธิภาพ

นอกเหนือจากโครงสร้างแล้ว หลักการเหล่านี้ยังควบคุมวิธีการเขียน prompt แต่ละอันของฉัน มันคือความแตกต่างระหว่างภาพที่เกือบจะได้ผลและภาพที่ตรงกับวิสัยทัศน์ของคุณอย่างแม่นยำ

01

โครงสร้างเหนือคำหลัก

ใช้ลำดับที่สม่ำเสมอ: พื้นหลัง → ตัวแบบ → รายละเอียด → ข้อจำกัด สำหรับคำขอที่ซับซ้อน ให้ใช้ส่วนที่มีป้ายกำกับหรือการขึ้นบรรทัดใหม่ ย่อหน้าที่ยาวทำให้โมเดลสับสน; โครงสร้างที่เป็นระเบียบจะนำทางไปยังความตั้งใจของคุณ

02

ความเฉพาะเจาะจงเหนือคำบรรยายเลิศลอย

แทนที่จะเป็น "คุณภาพสูง" หรือ "รายละเอียดสูงมาก" ให้อธิบายคุณสมบัติทางภาพจริง วัสดุ พื้นผิว รูปทรง สื่อ "รูขุมขนที่มองเห็นได้และกระที่ละเอียดอ่อน" ชนะ "ใบหน้าที่มีรายละเอียดมาก" ทุกครั้ง

03

การควบคุมองค์ประกอบที่ชัดเจน

ระบุการจัดเฟรมของคุณ (ระยะใกล้, มุมกว้าง, พาโนรามา), มุมมอง (ระดับสายตา, มุมต่ำ, มุม Dutch) และอารมณ์ของแสง (กระจายแสงนุ่มนวล, ชั่วโมงทอง, แสงริมขอบที่มีความเปรียบต่างสูง) อย่าปล่อยให้เป็นเรื่องของโชค

04

สัญญาการเปลี่ยนแปลง vs การคงสภาพ

สำหรับการแก้ไข ให้ระบุอย่างชัดเจนว่าอะไรต้องเปลี่ยน และอะไรต้องคงสภาพเดิมอย่างแน่นอน ใช้ "เปลี่ยนเฉพาะ X" และ "คงสภาพ Y ไว้อย่างแม่นยำ" ทำซ้ำรายการคงสภาพนี้ในการทำซ้ำแต่ละครั้งเพื่อป้องกันการเปลี่ยนแปลงที่ไม่พึงประสงค์

05

ข้อความต้องการความแม่นยำ

ใส่ข้อความที่ต้องการใน "เครื่องหมายคำพูด" หรือ ตัวพิมพ์ใหญ่ ระบุสไตล์ฟอนต์ ขนาด สี และตำแหน่ง สำหรับคำยากหรือชื่อแบรนด์ ให้สะกดทีละตัวอักษร เติม "เรนเดอร์เพียงครั้งเดียว ไม่มีสำเนา" เสมอ

06

ความชัดเจนในการอ้างอิงหลายภาพ

เมื่อทำงานกับภาพอินพุตหลายภาพ ให้อ้างถึงแต่ละภาพด้วยดัชนีและคำอธิบาย: "ภาพ 1: ภาพสินค้า, ภาพ 2: อ้างอิงสไตล์" ระบุอย่างชัดเจนว่าควรโต้ตอบกันอย่างไร

07

การทำซ้ำเหนือการโอเวอร์โหลด

เริ่มต้นด้วย prompt พื้นฐานที่สะอาด จากนั้นปรับแต่งด้วยการเปลี่ยนแปลงเล็กน้อยทีละรายการ "ทำให้แสงอุ่นขึ้น" "ลบต้นไม้ในพื้นหลัง" ขั้นตอนเล็กๆ รวมกันเป็นผลลัพธ์ที่แม่นยำ

ตัวอย่าง Prompt ในทางปฏิบัติ

ให้ฉันแสดงให้คุณเห็นว่ากรอบงานนี้แปลเป็น prompt จริงในกรณีการใช้งานต่างๆ อย่างไร:

ภาพพอร์ตเทรตเสมือนจริง
ภาพพอร์ตเทรตระยะใกล้เสมือนจริงของช่างปั้นหม้อชาวญี่ปุ่นสูงอายุ
กำลังตรวจสอบถ้วยชา แสงชั่วโมงทองส่องผ่านหน้าต่าง
สร้างไฮไลท์ที่อบอุ่นบนมือที่ผ่านการใช้งานมาอย่างหนัก ถ่ายด้วย Canon 5D Mark IV
ด้วยเลนส์ 85mm ที่ f/2.8 ความชัดลึกตื้นพร้อมพื้นหลังโบเก้
การไล่ระดับสีธรรมชาติ พื้นผิวผิวหนังและรูขุมขนที่มองเห็นได้ รูปแบบ 16:9
การออกแบบสติ๊กเกอร์ Kawaii
สติ๊กเกอร์สไตล์ kawaii ของแพนด้าแดงสวมหมวกไม้ไผ่
เส้นขอบสีดำหนา สไตล์ cel-shading จานสีพาสเทล
ด้วยสีชมพูอ่อนและสีเขียว การแสดงออกที่น่ารักด้วยดวงตาที่เป็นประกาย
พื้นหลังสีขาวเพื่อให้ตัดออกได้ง่าย การออกแบบที่เรียบง่ายและสะอาดเหมาะ
สำหรับการพิมพ์สินค้า
โปสเตอร์ภาพยนตร์พร้อมข้อความที่มีสไตล์
โปสเตอร์ศิลปะสำหรับภาพยนตร์นัวร์ลึกลับ ภาพกลางแสดง
เงาของนักสืบตัดกับหน้าต่างฝนตก
ชื่อเรื่องหลักด้วยตัวอักษร Art Deco หนา \"SHADOWS OF DOUBT\"
พร้อมคำบรรยาย serif บางที่หรูหรา \"Some secrets should stay buried\" ด้านล่าง
ข้อความเครดิตการผลิตขนาดเล็กที่ด้านล่างเพื่อความสมจริง
ข้อความทั้งหมดต้องสะอาดและอ่านง่าย คุณภาพภาพยนตร์ บรรยากาศตามอารมณ์
แสงคอนทราสต์สูงพร้อมเงาลึกและไฮไลท์ที่น่าทึ่ง
💡

ความแตกต่างที่สำคัญกับการ prompt ของ Nano Banana Pro: อธิบายสิ่งที่คุณต้องการเห็น ไม่ใช่วิธีที่คุณต้องการรู้สึก "ภาพที่สวยงามน่าทึ่ง" ไม่ได้บอกอะไรกับ AI เลย "แสงย้อนชั่วโมงทองสร้างเงายาวบนถนนที่ปูด้วยหิน" บอกมันอย่างชัดเจนว่าจะเรนเดอร์อะไร

การลงสีมังงะและเวทมนตร์การแปล

เทคนิคนี้เป็นการค้นพบครั้งแรกของฉันที่ทำให้ฉันตกตะลึงกับ Nano Banana Pro และยังคงเป็นหนึ่งในความสามารถที่น่าประทับใจที่สุดที่ฉันเคยเห็น ความสามารถในการนำหน้ามังงะขาวดำ ลงสี และแปลข้อความ — ทั้งหมดนี้ด้วย prompt เดียว — เปลี่ยนแปลงขั้นตอนการทำงานสำหรับแฟนมังงะ ผู้จัดพิมพ์ และผู้สร้างเนื้อหาโดยพื้นฐาน

นี่คือวิธีที่ฉันค้นพบ ฉันมักจะมีปัญหาในการอ่านมังงะขาวดำ มีบางอย่างเกี่ยวกับข้อมูลภาพที่หนาแน่นโดยไม่มีสัญญาณสีที่ทำให้ฉันติดตามการกระทำได้ยาก ฉันได้ลองใช้เครื่องมือลงสีต่างๆ แต่ทั้งหมดต้องการการทำงานด้วยตนเองอย่างมากและไม่สามารถจัดการกับข้อความได้

คืนแรกนั้นกับ Nano Banana Pro ฉันอัปโหลดหน้าจาก Demon Slayer และพิมพ์ prompt ง่ายๆ: "ทำให้ภาพนี้เป็นสี แปลเป็นภาษาอังกฤษและวางข้อความในบอลลูนคำพูดที่เกี่ยวข้อง ให้ทุกอย่างเหมือนเดิม จากนั้นให้ภาพกับฉัน"

สิ่งที่ส่งกลับมานั้นน่าทึ่งมาก สีสันสดใสและถูกต้องตามตัวละคร — ลายตารางสีเขียวของ Tanjiro ถูกเรนเดอร์อย่างสมบูรณ์แบบ ข้อความภาษาญี่ปุ่นในบอลลูนคำพูดถูกแทนที่ด้วยคำแปลภาษาอังกฤษที่ถูกต้อง ลายเส้นได้รับการรักษาไว้ มันดูเหมือนการเปิดตัวสีอย่างเป็นทางการ

Prompt ลงสีมังงะ + แปลภาษา
เปลี่ยนแผงมังงะขาวดำนี้:
1. ลงสีด้วยสีที่สดใส เหมาะสมกับอนิเมะ
2. แปลข้อความภาษาญี่ปุ่นทั้งหมดเป็นภาษาอังกฤษ
3. วางข้อความที่แปลไว้ในบอลลูนคำพูดที่ถูกต้อง
4. รักษาการแสดงออกของตัวละครและองค์ประกอบเดิมทั้งหมด
5. ส่งคืนเป็นภาพที่เสร็จสมบูรณ์ พร้อมพิมพ์

เทคนิคมังงะขั้นสูง

แต่เวทมนตร์ที่แท้จริงคือคุณสามารถไปได้ไกลกว่านั้น ไกลกว่ามาก คุณสามารถเปลี่ยนหน้ามังงะเดียวกันเป็นสไตล์ที่แตกต่างกันอย่างสิ้นเชิง:

Prompt เปลี่ยนสไตล์
// สไตล์ตุ๊กตา 3D
เปลี่ยนมังงะนี้เป็นสไตล์พื้นผิวตุ๊กตา 3D/ขนฟู
รักษาตัวละครให้จดจำได้ แต่เรนเดอร์พวกมันราวกับว่าพวกมัน
เป็นของเล่นตุ๊กตานุ่ม รักษาบอลลูนคำพูดและข้อความไว้

// สไตล์โมเสกยุคกลาง
เปลี่ยนมังงะนี้เป็นสไตล์โมเสกหินยุคกลาง
เหมือนงานศิลปะทางศาสนาจากโบสถ์โบราณ ให้ความรู้สึก
ศักดิ์สิทธิ์และเคารพในขณะที่ยังคงแผงเรื่องราวไว้

// สไตล์นูนต่ำบรอนซ์
เปลี่ยนหน้ามังงะนี้เป็นสไตล์ประติมากรรมนูนต่ำบรอนซ์
เรนเดอร์ตัวละครและฉากราวกับว่าพวกมันถูกยกขึ้นใน
โลหะบรอนซ์เก่า พร้อมคราบและแสงที่เหมาะสม

ฉันใช้เวลาหลายชั่วโมงในคืนแรกนั้นสร้างฉากมังงะเดียวกันในหลายสิบสไตล์ — ภาพพิมพ์ไม้ สีน้ำ ศิลปะพิกเซล ดินน้ำมัน การแปลงแต่ละครั้งรักษาโครงสร้างเรื่องราวในขณะที่จินตนาการถึงแนวทางภาพใหม่ทั้งหมด สิ่งนี้เปิดโอกาสสำหรับแฟนอาร์ต สื่อการศึกษา และโครงการสร้างสรรค์ที่ไม่สามารถทำได้มาก่อน

💡

เคล็ดลับมืออาชีพสำหรับการลงสีมังงะ: Nano Banana Pro เข้าใจธรรมเนียมตัวละครอนิเมะ คุณไม่จำเป็นต้องระบุสีผมสำหรับตัวละครที่มีชื่อเสียง — มันรู้ว่า Tanjiro มีผมสีดำที่มีปลายสีแดงเบอร์กันดีและฮาโอริลายตารางสีเขียว ความรู้ในตัวนี้ทำให้การลงสีเร็วขึ้นและแม่นยำยิ่งขึ้น

การออกแบบโปสเตอร์และภาพระดับมืออาชีพ

การออกแบบโปสเตอร์เป็นที่ที่ฉันเริ่มเข้าใจพลังของการเรนเดอร์ข้อความของ Nano Banana Pro อย่างแท้จริง โมเดล AI ก่อนหน้านี้สามารถสร้างภาพที่สวยงามได้ แต่ทันทีที่คุณต้องการข้อความ — ชื่อเรื่อง เครดิต สโลแกน — คุณก็กลับไปทำงานด้วยตนเองใน Photoshop Nano Banana Pro เปลี่ยนสมการนั้นอย่างสิ้นเชิง

ให้ฉันแนะนำคุณผ่านตัวอย่างเฉพาะบางอย่างที่แสดงให้เห็นว่าตอนนี้เป็นไปได้อย่างไร:

โปสเตอร์ภาพยนตร์

โปสเตอร์ภาพยนตร์แอนิเมชั่นย้อนยุค
สร้างโปสเตอร์ภาพยนตร์สำหรับ 'Robot Dreams' ในสไตล์แอนิเมชั่นย้อนยุคกลางศตวรรษ

ฉาก: สุนัขเหมือนมนุษย์และหุ่นยนต์สี่เหลี่ยมสีฟ้าเทาเดินจับมือกันบน
หาดทรายยามพระอาทิตย์ตก มองไปทางท่าเรือสวนสนุกที่ทรุดโทรมพร้อมชิงช้า
สวรรค์และรถไฟเหาะ ท้องฟ้าสีส้มเข้ม

สไตล์: ภาพประกอบแบน เส้นขอบหนา จานสีแบบย้อนยุคที่อบอุ่น

การจัดวางตัวอักษร: ชื่อเรื่อง \"ROBOT DREAMS\" เป็นตัวอักษรหนาขนาดใหญ่ที่กึ่งกลางด้านบน สีส้ม
เข้ม โลโก้เทศกาลขนาดเล็กที่ด้านบน คำวิจารณ์สีขาวกระจายอยู่รอบๆ
ตัวละคร

อารมณ์: คิดถึง อาลัยอาวรณ์ อบอุ่นหัวใจ

ผลลัพธ์ดูเหมือนโปสเตอร์ภาพยนตร์วินเทจจริงๆ ข้อความสะอาดและเว้นระยะห่างถูกต้อง สไตล์ภาพประกอบสม่ำเสมอตลอด แม้แต่รายละเอียดเล็กๆ น้อยๆ เช่น ช่อลอเรลเทศกาลและคำวิจารณ์ก็ถูกเรนเดอร์อย่างถูกต้อง

โปสเตอร์ที่เน้นการจัดวางตัวอักษร

นี่คือที่ที่สิ่งต่างๆ น่าประทับใจจริงๆ การจัดวางตัวอักษรที่ซับซ้อนด้วยหลายฟอนต์ ขนาด และสไตล์ที่โมเดล AI ก่อนหน้านี้ไม่สามารถเข้าใจได้:

โปสเตอร์ภาพยนตร์คลาสสิก
โปสเตอร์ศิลปะสำหรับภาพยนตร์ \"Dead Poets Society\"
สไตล์ศิลปะคลาสสิกพร้อมฉากที่แสดงถึงช่วงเวลาที่เป็นสัญลักษณ์
ของการยืนบนโต๊ะ ชื่อเรื่องหลักในการประดิษฐ์ตัวอักษร
เขียนด้วยมือที่ลื่นไหลด้วยเส้นที่สง่างามและบาง
คำบรรยายภาษาอังกฤษ \"Carpe Diem\" ด้านล่างในแบบ sans-serif ที่ซับซ้อน
สโลแกน \"Seize the day\" เป็นองค์ประกอบข้อความขนาดเล็ก
ข้อความเครดิตการผลิตขนาดเล็กเพิ่มเติมที่ด้านล่างเพื่อความสมจริง
ข้อความทั้งหมดต้องสะอาดและอ่านง่าย คุณภาพระดับพรีเมียม บรรยากาศ
ภาพยนตร์ที่สื่อถึงความเกรงขามและแรงบันดาลใจ

โปสเตอร์ที่สร้างขึ้นจาก prompt นี้สามารถผ่านเป็นงานสตูดิโอมืออาชีพได้อย่างง่ายดาย การประดิษฐ์ตัวอักษรมีความหลากหลายของน้ำหนักเส้นที่ถูกต้อง องค์ประกอบเป็นไปตามหลักการออกแบบคลาสสิก ผู้ดูจะไม่มีทางเดาได้ว่ามันถูกสร้างขึ้นโดย AI

การออกแบบภาพ Cyberpunk

สำหรับการออกแบบที่ซับซ้อนและมีข้อความจำนวนมาก Nano Banana Pro จัดการกับความท้าทายได้อย่างยอดเยี่ยม:

การออกแบบ Cyberpunk ที่เน้นข้อความ
โปสเตอร์ภาพหลัก Cyberpunk ที่มีองค์ประกอบข้อความหนาแน่น
สภาพแวดล้อมในเมืองที่มีแสงนีออนพร้อมจอแสดงผลโฮโลแกรมที่แสดง
ข้อความและการอ่านข้อมูลต่างๆ ตัวแบบหลัก: ตัวละครไซเบอร์เนติก
ที่มีการปลูกถ่ายเรืองแสง แผงข้อความลอยหลายแผ่นพร้อมข้อมูลจำเพาะ
ทางเทคนิคและป้ายเตือน

สไตล์: คอนทราสต์สูง สีสีนีออนตัดกับพื้นหลังสีเข้ม
รวมทั้งข้อความแสดงผลขนาดใหญ่และข้อความรายละเอียดขนาดเล็ก
ตัวอักษรทั้งหมดต้องมีรูปร่างถูกต้องและอ่านง่าย
รูปแบบภาพยนตร์ 16:9
💡

เคล็ดลับการออกแบบ: เมื่อทำงานกับโปสเตอร์ที่มีข้อความจำนวนมาก ให้ระบุเสมอว่า "ข้อความทั้งหมดต้องสะอาดและอ่านง่าย" ที่ใดที่หนึ่งใน prompt ของคุณ ดูเหมือนว่าจะกระตุ้นการตรวจสอบคุณภาพเพิ่มเติมในโมเดลที่ปรับปรุงความแม่นยำในการเรนเดอร์ข้อความ

การแสดงภาพความรู้และแผนภาพ

เนื่องจาก Nano Banana Pro สร้างขึ้นบนความสามารถในการให้เหตุผลของ Gemini 2.0 มันจึงสามารถสร้างแผนภาพการศึกษาและการแสดงภาพความรู้ที่สมเหตุสมผลจริงๆ นี่ไม่ใช่แค่การเรนเดอร์ภาพสวยๆ — มันเกี่ยวกับการนำเสนอข้อมูลที่ซับซ้อนอย่างถูกต้องแม่นยำ

ฉันทดสอบโดยขอให้มันสร้างแผนภาพโครงสร้างของอาคารประวัติศาสตร์ที่มีชื่อเสียง โดยไม่ต้องให้ภาพอ้างอิง ฉันเพียงแค่ถามว่า:

แผนภาพความรู้สถาปัตยกรรม
สร้างแผนภาพโครงสร้างโดยละเอียดของมหาวิหารกอธิค
พร้อมข้อความอธิบายที่ครอบคลุม แสดงระบบค้ำยันแบบลอย
การจัดวางของทางเดินกลางและปีกขวาง และความสูงหลายชั้น
รวมคำอธิบายประกอบโดยละเอียดที่อธิบายเทคนิคการก่อสร้าง
ที่ทำให้โครงสร้างยุคกลางเหล่านี้อยู่รอดมาได้หลายศตวรรษ
ข้อความทั้งหมดต้องสะอาดและอ่านง่าย

ผลลัพธ์นั้นน่าทึ่ง แผนภาพแสดงความมหัศจรรย์ทางวิศวกรรมโครงสร้างของสถาปัตยกรรมกอธิคอย่างถูกต้อง สัดส่วนตรงกับอาคารจริง และคำอธิบายประกอบให้ข้อมูลทางประวัติศาสตร์และวิศวกรรมที่ถูกต้อง นี่คือความสามารถในการให้เหตุผลในการปฏิบัติงาน — โมเดลรู้เกี่ยวกับประวัติศาสตร์สถาปัตยกรรมจริงๆ และสามารถนำเสนอความรู้นั้นด้วยภาพได้

เอกสารงานฝีมือดั้งเดิม

แอปพลิเคชันที่ทรงพลังอีกอย่างคือการจัดทำเอกสารงานฝีมือและเทคนิคดั้งเดิม:

อินโฟกราฟิกงานฝีมือดั้งเดิม
สร้างคู่มือภาพโดยละเอียดสำหรับเทคนิคการปักซาชิโกะแบบดั้งเดิมของญี่ปุ่น
แสดงรูปแบบการเย็บที่แตกต่างกันด้วย
ตัวอย่างระยะใกล้ รวมจานสีครามและสีขาวแบบดั้งเดิม
สาธิตมุมเข็มและความตึงของด้ายเพื่อให้ได้ผลลัพธ์
ที่แตกต่างกัน เพิ่มข้อความอธิบายที่ครอบคลุมครอบคลุมประวัติศาสตร์และ
รูปแบบภูมิภาคของงานฝีมือนี้ สไตล์อินโฟกราฟิกการศึกษา
ด้วยการจัดวางที่สะอาดตา

แผนภาพแนวคิดทางเทคนิค

สำหรับงานไซไฟและแนวคิด Nano Banana Pro สามารถสร้างเอกสารทางเทคนิคที่น่าประทับใจ:

แผนภาพแนวคิดทางเทคนิค
แผนภาพทางเทคนิคแบบแยกส่วนโดยละเอียดของดวงตาเทียม cyberpunk
แสดงส่วนประกอบภายในทั้งหมด: เซ็นเซอร์ออปติคัล การเชื่อมต่ออินเทอร์เฟซประสาท
แหล่งจ่ายไฟ หน่วยประมวลผล กลไกการปรับ
ติดป้ายกำกับแต่ละส่วนประกอบด้วยข้อมูลจำเพาะทางเทคนิค รวมมุมมองตัดขวาง
ที่แสดงวิธีเชื่อมต่อกับเส้นประสาทตา การเรนเดอร์สมจริง
พร้อมคำอธิบายประกอบแบบวิศวกรรม การออกแบบล้ำยุคแต่
น่าเชื่อถือทางวิทยาศาสตร์

ระดับรายละเอียดในแผนภาพทางเทคนิคเหล่านี้เทียบได้กับสิ่งที่ศิลปินแนวคิดมืออาชีพจะผลิต แต่สร้างขึ้นในไม่กี่วินาที สำหรับนักออกแบบเกม นักเขียนไซไฟ และศิลปินแนวคิด นี่คือเครื่องมือสร้างต้นแบบที่รวดเร็วอย่างไม่น่าเชื่อ

ความสามารถในการแก้โจทย์คณิตศาสตร์ที่น่าทึ่ง

สิ่งนี้ทำให้ฉันตกใจจริงๆ Nano Banana Pro ไม่เพียงแค่สร้างภาพ — มันสามารถแก้ปัญหาทางคณิตศาสตร์และเรนเดอร์กระบวนการแก้ปัญหาเป็นแผ่นงานเขียนด้วยลายมือ เอนจินการให้เหตุผลเบื้องหลังการสร้างภาพทำงานผ่านตรรกะทางคณิตศาสตร์จริงๆ

ฉันทดสอบด้วยปัญหาเรขาคณิตที่เกี่ยวข้องกับสามเหลี่ยมและการคำนวณมุม ฉันอัปโหลดภาพหน้าจอของปัญหาและให้ prompt:

Prompt แก้โจทย์คณิตศาสตร์
ร่างแผ่นกระดาษทดที่แสดงวิธีแก้ปัญหาที่สมบูรณ์
สำหรับปัญหาคณิตศาสตร์นี้ แสดงงานทั้งหมดรวมถึงไดอะแกรม
สมการ และการคำนวณทีละขั้นตอน ทำให้ดู
เหมือนลายมือของนักเรียนที่แท้จริงที่มีความแปรปรวนตามธรรมชาติ
รวมภาพร่างเรขาคณิตที่เกี่ยวข้อง

สิ่งที่ส่งกลับมาคือหน้าคณิตศาสตร์เขียนด้วยลายมือที่สมจริง พร้อมด้วย:

  • ไดอะแกรมเรขาคณิตที่มีมุมและด้านที่ระบุ
  • การจัดการทางพีชคณิตทีละขั้นตอน
  • ทฤษฎีบทและสูตรที่ใช้อย่างถูกต้อง
  • คำตอบสุดท้ายที่วงกลมไว้
  • ความไม่สมบูรณ์ของการเขียนตามธรรมชาติที่ทำให้ดูเหมือนจริง

และนี่คือสิ่งที่สำคัญ — คณิตศาสตร์นั้นถูกต้องจริงๆ โมเดลไม่ได้แค่สร้างสิ่งที่ดูเหมือนวิธีแก้ปัญหา; มันทำงานผ่านการให้เหตุผลทางคณิตศาสตร์จริงและได้คำตอบที่ถูกต้อง สำหรับผู้สร้างเนื้อหาการศึกษา บริการสอนพิเศษ หรือใครก็ตามที่ต้องการแสดงงานทางคณิตศาสตร์ นี่เป็นสิ่งที่น่าทึ่ง

คำเตือนที่สำคัญ

ในขณะที่ Nano Banana Pro ทำคณิตศาสตร์ได้ถูกต้องเกือบตลอดเวลา คุณควรตรวจสอบวิธีแก้ปัญหาสำหรับสิ่งที่สำคัญเสมอ การให้เหตุผลนั้นน่าประทับใจแต่ไม่ผิดพลาด ฉันเคยเห็นข้อผิดพลาดเป็นครั้งคราวในปัญหาหลายขั้นตอนที่ซับซ้อน

การแปลงจากกระดาษเป็นกระดานไวท์บอร์ด

หนึ่งในแอปพลิเคชันที่ใช้งานได้จริงที่สุดที่ฉันพบคือการแปลงเนื้อหาแบบยาว — งานวิจัย บทความ เอกสารทางเทคนิค — ให้เป็นสรุปภาพบนกระดานไวท์บอร์ด เทคนิคนี้ถูกเน้นโดยนักวิจัยบน X (เดิมคือ Twitter) และได้กลายเป็นหนึ่งในขั้นตอนการทำงานที่ฉันชอบ

วิธีการพื้นฐานนั้นง่าย: ให้เอกสารข้อความ (ไม่ว่าจะเป็น PDF ที่อัปโหลด ข้อความที่วาง หรือผ่านภาพหน้าจอ) และขอสรุปภาพสไตล์กระดานไวท์บอร์ด:

Prompt กระดาษเป็นกระดานไวท์บอร์ด
เปลี่ยนงานวิจัย/บทความนี้ให้เป็นภาพถ่ายกระดานไวท์บอร์ดที่มีรายละเอียด
ที่แสดงแนวคิดหลัก ความสัมพันธ์ และข้อค้นพบ
ใช้สไตล์การเขียนด้วยลายมือตามธรรมชาติด้วย:
- กล่องและภาชนะสำหรับแนวคิดหลัก
- ลูกศรแสดงความสัมพันธ์และการไหล
- จุดหัวข้อสำหรับรายละเอียดสำคัญ
- แผนภาพง่ายๆ ที่ช่วยอธิบาย
- การรหัสสีสำหรับหัวข้อต่างๆ

ทำให้ดูเหมือนกระดานไวท์บอร์ดที่ถ่ายภาพจริง
ด้วยแสงและมุมมองที่สมจริง รวมข้อมูลสำคัญ
ทั้งหมดในรูปแบบลำดับชั้นที่อ่านง่าย

ฉันลองใช้กับเอกสารทางเทคนิคยาวเกี่ยวกับสถาปัตยกรรม LLaMA 3 Nano Banana Pro สร้างสรุปบนกระดานไวท์บอร์ดที่จับนวัตกรรมหลัก การตัดสินใจทางสถาปัตยกรรม แนวทางการฝึกอบรม และผลการเปรียบเทียบ — ทั้งหมดในรูปแบบที่เข้าใจได้ในพริบตา

แอปพลิเคชันมีมากมาย:

  • นักเรียน: แปลงบันทึกการบรรยายหรือบทในหนังสือเรียนเป็นเครื่องช่วยการศึกษาแบบภาพ
  • นักวิจัย: สร้างบทคัดย่อภาพอย่างรวดเร็วของงานวิจัยสำหรับการนำเสนอ
  • ครู: สร้างคำอธิบายสไตล์กระดานโดยไม่ต้องเขียนบนกระดานจริงๆ
  • ผู้สร้างเนื้อหา: แปลงเนื้อหาที่เป็นลายลักษณ์อักษรเป็นรูปแบบภาพที่น่าสนใจ

ตามที่นักวิจัยคนหนึ่งตั้งข้อสังเกต ความสามารถนี้อาจแทนที่ความจำเป็นที่ครูจะต้องเขียนคำอธิบายบนกระดานไวท์บอร์ดด้วยตนเอง — แม้ว่าฉันจะโต้แย้งว่ามันถูกใช้เป็นส่วนเสริมได้ดีที่สุดมากกว่าการทดแทน

การสร้างอินเทอร์เฟซเกม

Nano Banana Pro ได้รับการฝึกฝนอย่างชัดเจนบนคลังภาพการเล่นเกมและภาพหน้าจอจำนวนมาก เพราะความสามารถในการสร้างอินเทอร์เฟซเกมที่น่าเชื่อถือนั้นน่าทึ่ง สิ่งนี้ไปไกลกว่าแบบจำลองง่ายๆ — มันเข้าใจแบบแผน UI ของเกม องค์ประกอบเฉพาะประเภท และแม้แต่ความแตกต่างระดับภูมิภาคในการออกแบบเกม

เกมสำรวจทะเลลึก

อินเทอร์เฟซเกมอินดี้
สร้างภาพหน้าจอในเกมจากเกมสำรวจทะเลลึกคล้ายกับ Dave the Diver

ฉาก: นักดำน้ำเผชิญหน้ากับสิ่งมีชีวิตขนาดใหญ่ที่ไม่รู้จักในเหว

องค์ประกอบ UI:
- มาตรวัดความลึกแสดง 850m
- มิเตอร์ออกซิเจนที่ 40%
- ช่องเก็บของด้านล่างซ้าย
- แผนที่ขนาดเล็กที่มุมขวาบน
- คำเตือน \"WARNING: Unknown lifeform detected\"

สไตล์: Pixel art พร้อมเอฟเฟกต์แสงสมัยใหม่ หมอกในบรรยากาศ สิ่งมีชีวิตเรืองแสง

ภาพหน้าจอเกม FPS

อินเทอร์เฟซสไตล์ Call of Duty
สร้างภาพหน้าจอจากเกมยิงมุมมองบุคคลที่หนึ่งสไตล์ Call of Duty
แต่ศัตรูคือสุนัข Shiba Inu (Cheems meme) อินเทอร์เฟซ FPS เต็มรูปแบบ
พร้อมเป้าเล็ง ตัวนับกระสุน แผนที่ขนาดเล็ก แถบสุขภาพ และตัวบ่งชี้
killstreak Cheems ควรอยู่ในอุปกรณ์ยุทธวิธี สไตล์กราฟิก
สมจริงพร้อมแสงแบบภาพยนตร์ รวมเครื่องหมายการโจมตีและ
ภาพเบลอจากการเคลื่อนไหวเล็กน้อยเพื่อความรู้สึกของการกระทำ

การผสมผสานระหว่างกลไกเกมที่จริงจังกับอารมณ์ขันที่ไร้สาระนี้สร้างผลลัพธ์ที่เฮฮาซึ่งดูเหมือนจริงอย่างสมบูรณ์ องค์ประกอบ UI วางตำแหน่งได้อย่างสมบูรณ์แบบและมีสไตล์ที่เหมาะสมกับประเภท

อินเทอร์เฟซเกม MOBA

สิ่งที่น่าสนใจจริงๆ คือความเข้าใจของ Nano Banana Pro เกี่ยวกับวัฒนธรรมเฉพาะของเกม เมื่อถูกขอให้สร้างอินเทอร์เฟซ League of Legends หรือ MOBA ที่คล้ายกันซึ่งแสดงผู้เล่นโต้ตอบในการแชท มันจะสร้างบทสนทนาที่เหมาะสมกับบริบท:

อินเทอร์เฟซแชท MOBA
สร้างภาพหน้าจอในเกม League of Legends ที่แสดงการต่อสู้
ของทีมที่เข้มข้นกำลังดำเนินอยู่ ในพื้นที่แชท (ด้านล่างซ้าย) แสดงผู้เล่น
มีการโต้เถียงที่รุนแรงเกี่ยวกับกลยุทธ์ของเกม รวมองค์ประกอบ UI MOBA ทั่วไป:
แถบความสามารถ แผนที่ขนาดเล็ก กระดานคะแนน ช่องรายการ แชทควร
ดูเหมือนพฤติกรรมของผู้เล่นจริงในระหว่างการแข่งขัน

โมเดลเข้าใจบริบททางวัฒนธรรมของชุมชนเกมต่างๆ และนำเสนออย่างถูกต้อง — บางครั้งก็น่าเจ็บปวด สำหรับนักออกแบบเกม ผู้สร้างเนื้อหา และใครก็ตามในพื้นที่เกม นี่เป็นความสามารถที่มีประโยชน์อย่างเหลือเชื่อ

การเรนเดอร์สินค้าและการถ่ายภาพ

การถ่ายภาพสินค้าเป็นที่ที่การผสมผสานระหว่างการเรนเดอร์ข้อความ การควบคุมแสง และความฉลาดในการจัดองค์ประกอบของ Nano Banana Pro เปล่งประกายอย่างแท้จริง ความสามารถในการวางสินค้าในสภาพแวดล้อมใดๆ ในขณะที่รักษาความสม่ำเสมอของแบรนด์เปิดโอกาสให้ขั้นตอนการทำงานที่อาจมีราคาแพงหรือเป็นไปไม่ได้ด้วยการถ่ายภาพแบบดั้งเดิม

ตัวอย่างปกอัลบั้ม

ให้ฉันแนะนำคุณผ่านตัวอย่างโดยละเอียดที่แสดงความสามารถเต็มรูปแบบ ฉันเริ่มต้นด้วยแนวคิดง่ายๆ: ปกอัลบั้มสมมติ ก่อนอื่น ฉันสร้าง CD และกล่อง:

การสร้างสินค้าเบื้องต้น
สร้างภาพสินค้าอัลบั้ม CD ชื่ออัลบั้ม
\"MIDNIGHT ECHOES\" ในการจัดวางตัวอักษรสมัยใหม่ที่มีสไตล์ ปกอัลบั้มแสดง
ภาพสัญลักษณ์เหนือจริงและชวนฝันที่รวมองค์ประกอบไซเบอร์และอินทรีย์
รวมทั้ง CD และกล่อง jewel แสงสตูดิโอ
พื้นหลังสีขาวสะอาด สไตล์การถ่ายภาพสินค้า

นี่คือจุดที่น่าสนใจ เมื่อสินค้านี้ถูกสร้างขึ้น ฉันสามารถวางมันในสภาพแวดล้อมใดๆ ในขณะที่รักษาความสม่ำเสมอที่สมบูรณ์แบบ:

รูปแบบการวางสภาพแวดล้อม
// ร้านขายแผ่นเสียงยุค 90
วางสินค้า CD นี้บนชั้นไม้ในร้านขายแผ่นเสียง
จากทศวรรษ 1990 ล้อมรอบด้วยแผ่นเสียงไวนิลและเทปเก่า แสง
ทังสเตนอบอุ่น การสะท้อนของป้ายนีออนในพื้นหลัง
อนุภาคฝุ่นลอยอยู่ในอากาศ บรรยากาศแห่งความหลัง

// การลอยตัวเหนือจริง
CD ลอยอยู่ในอากาศล้อมรอบด้วยเศษแก้วที่แตกละเอียด
และเฟืองนาฬิกาที่ลอยอยู่ แนวคิด: \"ความฝัน\" และ
\"การเดินทางข้ามเวลา\" แสงแบบภาพยนตร์ องค์ประกอบที่น่าทึ่ง

// ฉากเครื่องเล่น CD
CD กำลังถูกใส่ลงในเครื่องเล่น CD แบบพกพา กล่อง CD
ตั้งอยู่ใกล้ๆ แสงแดดยามบ่ายส่องผ่านผ้าม่าน
พื้นผิวโต๊ะไม้ อารมณ์อบอุ่นและครุ่นคิด

// ฉากคอนเสิร์ต
วางสินค้านี้ในสภาพแวดล้อมคอนเสิร์ตในสนามกีฬา
พลังงานของฝูงชน แสงเวที หน้าจอขนาดใหญ่ในพื้นหลัง
CD ดูใหญ่โตอย่างเป็นไปไม่ได้ เหมือนอุปกรณ์ประกอบฉากบนเวที

ในแต่ละสภาพแวดล้อม ข้อความบน CD ยังคงคมชัดและอ่านง่าย สินค้ารักษาเอกลักษณ์ทางภาพในขณะที่ปรับตัวอย่างเป็นธรรมชาติกับสถานการณ์แสงและบริบทใหม่แต่ละอย่าง สำหรับอีคอมเมิร์ซ แคมเปญการตลาด หรือการแสดงภาพแบรนด์ นี่คือการปฏิวัติ

ภาพถ่ายสินค้าทางเทคนิค

สำหรับการถ่ายภาพสินค้าทางเทคนิคมากขึ้น Nano Banana Pro จัดการกับรายละเอียดที่สำคัญ:

การถ่ายภาพสินค้าอีคอมเมิร์ซ
iPhone 17 Pro, Cosmic Orange, มุมด้านหลัง 45 องศาเน้นการออกแบบด้านหลัง
และโมดูลกล้อง

พื้นหลัง: รูปแบบนามธรรมเทคโนโลยีสุนทรียศาสตร์ไล่ระดับสีอ่อนพร้อมการเคลื่อนไหว
ที่ไหลลื่นตามธรรมชาติและกลิ่นอายศิลปะสมัยใหม่ หลีกเลี่ยงสีดำสนิท เน้นการโต้ตอบของแสงและเงา
และการเปลี่ยนสีที่ละเอียดอ่อน

องค์ประกอบข้อความลอยรอบอุปกรณ์: \"A19 Pro Chip\", \"8x Optical Zoom\",
\"48MP Rear Camera\" — เค้าโครงลอยตัวที่ทันสมัย กล่องข้อความโปร่งใส สะอาด
และสุนทรียศาสตร์ขั้นสูงทางเทคโนโลยี

โดยรวม: ไดนามิก, ล้ำยุค, คุณภาพการถ่ายภาพสินค้ามืออาชีพ

การค้นพบลูกปัด Perler

นี่เป็นเหตุการณ์บังเอิญโดยสิ้นเชิง ฉันกำลังทดลองกับสไตล์งานฝีมือต่างๆ เมื่อฉันสะดุดกับความสามารถที่น่าทึ่งของ Nano Banana Pro ในการสร้างศิลปะลูกปัด perler (หรือที่เรียกว่า fuse beads หรือ hama beads) ผลลัพธ์มีความสม่ำเสมอและน่ารักมากจนกลายเป็นหนึ่งในสไตล์ความงามที่ฉันชอบ

ตัวละครลูกปัด Perler
ศิลปะลูกปัด perler 3D: กล่องแสดงผลที่มีหุ่นจำลองที่สวยงาม

สไตล์: การเรนเดอร์สมจริงแสดงพื้นผิวลูกปัดแต่ละเม็ด พื้นผิว
มันวาว แสงการถ่ายภาพสินค้ามืออาชีพ

รวมถึง: รูปแบบตารางลูกปัดที่มองเห็นได้ เงาละเอียดอ่อนระหว่างลูกปัด ความไม่สมบูรณ์
เล็กน้อยเพื่อความสมจริง

โมเดลเข้าใจว่าลูกปัด perler มีลักษณะเฉพาะ — รูปทรงกระบอก ช่องว่างเล็กๆ ระหว่างลูกปัด วิธีที่พวกมันหลอมรวมกันที่จุดเชื่อมต่อ มันเรนเดอร์รายละเอียดเหล่านี้อย่างแม่นยำในขณะที่รักษาความงามที่น่ารักซึ่งทำให้สไตล์งานฝีมือนี้ดึงดูดใจ

รูปแบบที่ทำงานได้อย่างสวยงาม:

  • สุนัขลูกปัด Perler: สายพันธุ์ต่างๆ ที่แสดงในความงามแบบพิกเซลอาร์ตพบกับงานฝีมือ
  • แมวลูกปัด Perler พร้อมแผนภูมิสี: แสดงตัวละครถัดจากสีลูกปัดที่ใช้
  • ไดโอรามาลูกปัด Perler: ฉากเต็มรูปแบบที่สร้างจากความงามแบบ fuse bead
  • พวงกุญแจลูกปัด Perler: การออกแบบขนาดเล็กเหมาะสำหรับม็อกอัพสินค้า

สำหรับนักออกแบบรูปแบบงานฝีมือ ผู้สร้างสินค้า หรือใครก็ตามที่รักความงามที่น่ารักนี้ Nano Banana Pro คือขุมทอง

การสร้างอินเทอร์เฟซโซเชียลมีเดีย

ความสามารถนี้ทั้งน่าประทับใจและต้องการการใช้งานอย่างรับผิดชอบ Nano Banana Pro สามารถสร้างอินเทอร์เฟซโซเชียลมีเดียใหม่ได้อย่างแม่นยำระดับพิกเซล — iMessage, Instagram, Twitter และอื่นๆ แอปพลิเคชันมีตั้งแต่ถูกกฎหมาย (การสร้างเนื้อหา, การศึกษา, ม็อกอัพ) ไปจนถึงอาจเป็นปัญหา (แชทปลอม) ดังนั้นโปรดใช้อย่างรับผิดชอบ

อินเทอร์เฟซแชท iMessage
สร้างภาพหน้าจออินเทอร์เฟซแชท iMessage ตามการออกแบบ
และเค้าโครง iOS ที่แน่นอน แชทมีป้ายกำกับว่า \"Boss\"
ที่ด้านบน:

1. Boss: \"Why do you always look half asleep when you come to work?\"
2. Employee: \"If I were fully awake before coming to work, I'd be late\"
3. Boss: \"Why do you always leave exactly at closing time?\"
4. Employee: \"Leaving before closing time would be leaving early\"
5. Boss: \"You're late again!\"
6. Employee: \"Even justice can be late. Why not me?\"

สไตล์ iOS ที่แน่นอนพร้อมบอลลูนข้อความที่ถูกต้อง การประทับเวลา
และองค์ประกอบอินเทอร์เฟซ

ระดับความแม่นยำของ UI นั้นน่าทึ่ง — สไตล์บอลลูนข้อความ การวางตำแหน่งอวาตาร์ การจัดรูปแบบการประทับเวลา แม้แต่การไล่ระดับสีและเงาที่ละเอียดอ่อนที่แยกความแตกต่างระหว่างแพลตฟอร์ม

คำเตือนด้านจริยธรรม

ภาพหน้าจอแชทปลอมสามารถใช้เพื่อบิดเบือนข้อมูลหรือหลอกลวง ใช้ความสามารถนี้สำหรับเนื้อหาที่เป็นนิยายหรือการศึกษาที่ชัดเจนเท่านั้น ห้ามสร้างแชทปลอมที่อาจเข้าใจผิดว่าเป็นจริงหรือใช้เพื่อหลอกลวงผู้อื่น

โปสเตอร์โปรโมตเมือง

ความรู้โลกของ Nano Banana Pro ครอบคลุมภูมิศาสตร์และสถานที่สำคัญ มันรู้อาคารที่เป็นสัญลักษณ์ของเมืองใหญ่และสามารถจัดองค์ประกอบให้เป็นสื่อส่งเสริมการขายที่สอดคล้องกัน สิ่งนี้ก็น่าประทับใจเป็นพิเศษสำหรับเมืองที่มีมรดกทางสถาปัตยกรรมที่ซับซ้อน

โปสเตอร์การท่องเที่ยวเมือง
สร้างโปสเตอร์โปรโมตสำหรับเมืองนิวยอร์ก พื้นหลังมี
สถานที่สำคัญที่เป็นสัญลักษณ์: ตึกเอ็มไพร์สเตต, เทพีเสรีภาพ, สะพานบรูคลิน,
วันเวิลด์เทรดเซ็นเตอร์, ไทม์สแควร์ สถานที่สำคัญควรมี
ลำดับชั้นทางสายตาพร้อมการเน้นหลักและรองที่ชัดเจน
สไตล์ภาพประกอบลายเส้นสะอาดพร้อมโทนสีที่โดดเด่น

การจัดวางตัวอักษรขนาดใหญ่ตรงกลาง: \"NEW YORK\" พร้อมข้อความขนาดเล็ก \"The City
That Never Sleeps\" ใกล้ๆ สโลแกนด้านล่าง: \"Where Dreams Take Flight\"
รวมองค์ประกอบสมัยใหม่เช่นแท็กซี่สีเหลืองและทางเข้าสถานีรถไฟใต้ดินเพื่อ
แสดง NYC ร่วมสมัย

องค์ประกอบที่สะอาดและลื่นไหลพร้อมการจัดเรียงองค์ประกอบตามธรรมชาติ
เน้นการผสมผสานระหว่างสถานที่สำคัญทางประวัติศาสตร์และพลังงานสมัยใหม่
บรรยากาศเมืองใหญ่ที่มีชีวิตชีวา

โมเดลจดจำและเรนเดอร์คุณลักษณะเด่นของแต่ละสถานที่สำคัญได้อย่างถูกต้อง — ยอดแหลม Art Deco ของตึกเอ็มไพร์สเตต คราบทองแดงของเทพีเสรีภาพ หอคอยกอธิคของสะพานบรูคลิน นอกจากนี้ยังเข้าใจภาษาภาพของการตลาดการท่องเที่ยวและใช้สไตล์ที่เหมาะสม

สตอรี่บอร์ดคอมมิคและศิลปะลำดับ

สำหรับผู้สร้างที่ทำงานเกี่ยวกับการ์ตูน มังงะ หรือสตอรี่บอร์ด ความสามารถของ Nano Banana Pro ในการสร้างลำดับหลายแผงช่วยประหยัดเวลาได้อย่างมาก มันเข้าใจการไหลของการเล่าเรื่อง องค์ประกอบของแผง และวิธีการแสดงภาพจังหวะอารมณ์

สตอรี่บอร์ดคอมมิคแอ็คชั่น
สร้างลำดับมังงะ 5 แผงที่แสดงการต่อสู้ครั้งยิ่งใหญ่:

แผง 1: ฮีโร่ยืนอยู่บนยอดเขา วายร้ายโผล่ออกมาจากเงามืด
บรรยากาศตึงเครียด

แผง 2: ดวงตาของพวกเขาพบกัน การต่อสู้ใกล้เข้ามา องค์ประกอบหน้าจอแยกแบบใกล้ชิด

แผง 3: การต่อสู้ที่รุนแรง ฟ้าแลบ ฮีโร่โจมตีด้วยอาวุธ
เรืองแสง วายร้ายปัดป้องด้วยพลังมืด

แผง 4: การปะทะกันกลางอากาศ คลื่นพลังงานระเบิดออกไปด้านนอก ท่าทางแอ็คชั่นแบบไดนามิก

แผง 5: นักรบทั้งสองยืนเผชิญหน้ากัน ดวงตาของฮีโร่แสดงความมุ่งมั่น
ของวายร้ายแสดงอารมณ์ที่ซับซ้อน

สไตล์: สไตล์แอ็คชั่นมังงะ Shonen คอนทราสต์สูง เส้นความเร็ว เงาที่น่าทึ่ง

โมเดลเข้าใจคำศัพท์ทางภาพของมังงะ — เส้นความเร็ว เฟรมปะทะ ภาพระยะใกล้ทางอารมณ์ มุมไดนามิก มันรักษาความสม่ำเสมอของตัวละครทั่วทั้งแผงและสร้างการไหลของการเล่าเรื่องที่แท้จริงแทนที่จะเป็นห้าภาพที่ไม่เกี่ยวข้องกัน

ฉันได้ทดสอบกับสถานการณ์ต่างๆ:

  • ฉากอำลาทางอารมณ์ — โทนเศร้าโศกและฉุนเฉียว
  • ช่วงเวลาความผูกพันระหว่างครูกับนักเรียน — ไตร่ตรอง ซับซ้อน
  • ตัวละครดั้งเดิมในสถานการณ์ชีวิตประจำวัน
  • ลำดับแอ็คชั่นในสไตล์ที่ไม่ใช่อนิเมะ

ข้อจำกัดหลักที่ฉันสังเกตเห็น: บางครั้งแผง 1 และ 2 หรือ 4 และ 5 อาจคล้ายกันเกินไปหาก prompt ไม่ได้ระบุความแตกต่างที่เพียงพอ การเพิ่มองค์ประกอบภาพหรือมุมกล้องที่แตกต่างกันให้กับคำอธิบายแต่ละแผงช่วยป้องกันสิ่งนี้

คุณภาพ 4K และงานละเอียด

ความสามารถในการส่งออก 4K ดั้งเดิมของ Nano Banana Pro ไม่ใช่แค่เรื่องตัวเลขความละเอียด — มันเกี่ยวกับระดับของรายละเอียดที่ทำได้ สำหรับการถ่ายภาพระยะใกล้ ภาพถ่ายสินค้า และแอปพลิเคชันใดๆ ที่รายละเอียดเล็กๆ น้อยๆ มีความสำคัญ สิ่งนี้เปลี่ยนสิ่งที่ทำได้

รายละเอียดการถ่ายภาพมาโคร
สร้างภาพถ่ายมาโคร 4K ที่มีรายละเอียดสูงของผีเสื้อ
Monarch ที่เกาะอยู่บนดอกไม้สีเหลือง โฟกัสอย่างแม่นยำที่
เกล็ดปีกและพื้นผิว แสดงเกล็ดแต่ละอันที่
สร้างรูปแบบ จับภาพพื้นผิวกลีบดอกไม้ในระดับรายละเอียดที่เท่ากัน

แสงกระจายที่นุ่มนวล ความชัดลึกตื้นพร้อมโบเก้
พื้นหลังครีม จานสีธรรมชาติที่มีความอบอุ่นเล็กน้อย
ความแม่นยำทางวิทยาศาสตร์ในกายวิภาคของผีเสื้อ ประเภทของภาพที่
จะชนะการประกวดถ่ายภาพธรรมชาติ

เมื่อคุณซูมเข้าไปในภาพที่ได้ คุณสามารถเห็นเกล็ดปีกแต่ละอัน เม็ดละอองเรณู และโครงสร้างเซลล์ของกลีบดอกไม้ รายละเอียดระดับนี้ก่อนหน้านี้ทำได้ด้วยอุปกรณ์ถ่ายภาพมาโครเฉพาะทางและการประมวลผลภายหลังอย่างมากเท่านั้น

เมื่อไหร่ควรใช้ 4K

คุณภาพมาตรฐาน

การสร้างที่รวดเร็ว (3-5 วินาที) ด้วยคุณภาพที่ยอดเยี่ยมสำหรับกรณีการใช้งานส่วนใหญ่:

  • การสำรวจแนวคิดและการระดมสมอง
  • เนื้อหาโซเชียลมีเดีย
  • ร่างเริ่มต้นก่อนการปรับแต่งขั้นสุดท้าย
  • ความต้องการในการสร้างปริมาณมาก
  • องค์ประกอบง่ายๆ ที่ไม่มีข้อความละเอียด

คุณภาพสูง / 4K

เวลาในการสร้างที่ขยายออกไป (8-15 วินาที) เพื่อความเที่ยงตรงสูงสุด:

  • ภาพการผลิตขั้นสุดท้าย
  • ข้อความที่หนาแน่นและงานการพิมพ์
  • อินโฟกราฟิกที่ซับซ้อนพร้อมรายละเอียดเล็กๆ
  • ภาพพอร์ตเทรตเสมือนจริง
  • วัสดุที่พร้อมพิมพ์

สำหรับการระดมสมองและการทำซ้ำ ให้ยึดติดกับความละเอียดเริ่มต้นเพื่อรักษารอบการตอบรับที่รวดเร็ว

ความสม่ำเสมอของตัวละครในหลายภาพ

หนึ่งในปัญหาที่ยากที่สุดในอดีตในการสร้างภาพ AI คือการรักษาความสม่ำเสมอของตัวละครในหลายภาพ คุณจะสร้างตัวละครที่คุณรัก จากนั้นพยายามวางพวกเขาในท่าทางหรือสภาพแวดล้อมที่แตกต่างกัน และทันใดนั้นพวกเขาก็ดูเหมือนคนละคนกันอย่างสิ้นเชิง

Nano Banana Pro มีความก้าวหน้าอย่างมากในปัญหานี้ผ่านความสามารถในการป้อนข้อมูลหลายภาพ คุณสามารถให้ภาพอ้างอิงและโมเดลจะรักษาเอกลักษณ์ในการสร้างใหม่

ขั้นตอนการทำงานความสม่ำเสมอของตัวละคร
ขั้นตอนที่ 1: สร้างตัวละคร
\"สร้างแผ่นอ้างอิงตัวละครสำหรับ Person 1: ผู้หญิงเอเชีย
อายุ 30 ปีที่มีผมสีดำยาวประบ่า ดวงตาสีน้ำตาลอบอุ่นและรอยยิ้ม
ที่เป็นมิตร แสดงมุมมองด้านหน้า ด้านข้าง และมุมสามในสี่\"

ขั้นตอนที่ 2: สร้างฉาก
\"Person 1 นั่งที่โต๊ะกาแฟ อ่านหนังสือ แสงเช้า
ผ่านหน้าต่าง เสื้อผ้าลำลอง\"

ขั้นตอนที่ 3: เปลี่ยนบริบท
\"Person 1 ตอนนี้อยู่ในการประชุมทางธุรกิจ สวมชุดทำงาน
ตัวละครเดิม สภาพแวดล้อมต่างกัน\"

ขั้นตอนที่ 4: หลายตัวละคร
\"Person 1 และ Person 2 (สร้าง Person 2 ก่อน) เดินด้วยกัน
ในสวนสาธารณะ แสงแดดยามบ่ายฤดูใบไม้ร่วง\"

ขั้นตอนการทำงานนี้เปลี่ยนแปลงสำหรับ:

  • อีคอมเมิร์ซแฟชั่น: แสดงนางแบบคนเดิมในชุดต่างๆ โดยไม่ต้องถ่ายทำราคาแพง
  • การออกแบบตัวละคร: สำรวจรูปแบบต่างๆ ในขณะที่รักษาเอกลักษณ์
  • การสร้างคอมมิค/มังงะ: รักษาตัวเอกให้สม่ำเสมอข้ามฉาก
  • เนื้อหาอินฟลูเอนเซอร์เสมือน: สร้างบุคลิกที่สม่ำเสมอข้ามโพสต์
  • การสร้างสินทรัพย์เกม: ตัวละครในหลายท่าทางและหลายอารมณ์
💡

เคล็ดลับมืออาชีพสำหรับความสม่ำเสมอของตัวละคร: เมื่อให้ภาพอ้างอิง ให้รวมภาพถ่ายใบหน้าด้านหน้าที่สว่างดีอย่างน้อยหนึ่งภาพ โมเดลใช้สิ่งนี้เพื่อยึดเอกลักษณ์ มุมเพิ่มเติมช่วยได้แต่ไม่สำคัญเท่าการอ้างอิงหลักนี้

เทมเพลตฉากอย่างเป็นทางการของ Google

Google ได้จัดเตรียมเทมเพลต prompt อย่างเป็นทางการสำหรับกรณีการใช้งานทั่วไป ฉันได้ทดสอบอย่างกว้างขวางและต้องการแบ่งปันเวอร์ชันที่ปรับปรุงแล้วของฉันตามผลลัพธ์ในโลกแห่งความเป็นจริง แต่ละเทมเพลตตามโครงสร้างที่สอดคล้องกันซึ่งโมเดลตอบสนองอย่างน่าเชื่อถือ

เทมเพลตการถ่ายภาพเสมือนจริง

โครงสร้าง: ประเภทช็อต + ตัวแบบ + การกระทำ/การแสดงออก + สภาพแวดล้อม + แสง + พารามิเตอร์กล้อง + อัตราส่วนภาพ

เทมเพลต
[ประเภทช็อต] เสมือนจริงของ [ตัวแบบ], [การกระทำหรือการแสดงออก],
ตั้งอยู่ใน [สภาพแวดล้อม] ฉากสว่างด้วย [คำอธิบายแสง],
สร้างบรรยากาศ [อารมณ์] ถ่ายด้วย [รายละเอียดกล้อง/เลนส์],
เน้น [พื้นผิวและรายละเอียดหลัก] ภาพควรอยู่ใน
รูปแบบ [อัตราส่วนภาพ]
ตัวอย่างการใช้งาน
ภาพพอร์ตเทรตระยะใกล้เสมือนจริงของช่างปั้นหม้อชาวญี่ปุ่นสูงอายุ
กำลังตรวจสอบถ้วยชา แสงชั่วโมงทองส่องผ่านหน้าต่าง
ทางซ้าย สร้างบรรยากาศที่ครุ่นคิด ถ่ายด้วยเลนส์
85mm ที่ f/2.8 เน้นพื้นผิวผิวหนัง มือที่ผ่านการใช้งานมาอย่างหนัก และ
เคลือบเซรามิก รูปแบบ 16:9

เทมเพลตภาพประกอบและสติ๊กเกอร์

โครงสร้าง: สไตล์ + ตัวแบบ + คุณสมบัติหลัก + จานสี + สไตล์เส้น + พื้นหลัง

เทมเพลต
สติ๊กเกอร์ [สไตล์] ของ [ตัวแบบ], ที่มี [คุณสมบัติหลัก]
และ [จานสี] การออกแบบควรมี [สไตล์เส้น] และ
[สไตล์การเงา] พื้นหลังควรเป็น [ข้อกำหนดพื้นหลัง]

เทมเพลตการออกแบบแบรนด์

โครงสร้าง: ประเภทภาพ + แบรนด์/แนวคิด + เนื้อหาข้อความ + การจัดวางตัวอักษร + สไตล์การออกแบบ + โทนสี

เทมเพลต
สร้าง [ประเภทภาพ] สำหรับ [แบรนด์/แนวคิด] พร้อมข้อความ \"[ข้อความที่แน่นอน]\"
ใน [สไตล์ฟอนต์] การออกแบบควรเป็น [คำอธิบายสไตล์], ด้วย
[โทนสี] รวม [องค์ประกอบการออกแบบเพิ่มเติม] ความรู้สึกโดยรวม
ควรสื่อสาร [คุณค่าแบรนด์/ข้อความ]

เทมเพลตการถ่ายภาพสินค้า

โครงสร้าง: คำอธิบายสินค้า + พื้นหลัง + การตั้งค่าแสง + มุมกล้อง + รายละเอียดหลัก + อัตราส่วนภาพ

เทมเพลต
ภาพถ่ายสินค้าความละเอียดสูง สว่างแบบสตูดิโอ ของ [คำอธิบายสินค้า]
บน [พื้นผิวพื้นหลัง] แสงคือ [การตั้งค่าแสง] สำหรับ
[วัตถุประสงค์ของแสง] มุมกล้องคือ [ประเภทมุม] เพื่อเน้น
[คุณสมบัติเฉพาะ] สมจริงมาก โฟกัสคมชัดที่ [รายละเอียดหลัก]
[อัตราส่วนภาพ]

เทมเพลตพื้นที่ว่างแบบมินิมอล

โครงสร้าง: ตำแหน่งตัวแบบ + พื้นที่ว่างพื้นหลัง + แสง + อัตราส่วนภาพ

เทมเพลต
องค์ประกอบแบบมินิมอลที่มี [ตัวแบบ] เดียววางอยู่
ที่ [ตำแหน่ง: ล่างขวา/บนซ้าย/ฯลฯ] ของเฟรม
พื้นหลังเป็นผ้าใบ [สี] ที่กว้างใหญ่และว่างเปล่า สร้างพื้นที่
ว่างที่สำคัญ แสงนุ่มนวลและเรียบง่ายจาก [ทิศทาง] [อัตราส่วนภาพ]

เทมเพลตแผงคอมมิค

โครงสร้าง: สไตล์ศิลปะ + ตัวละคร/การกระทำเบื้องหน้า + การตั้งค่าพื้นหลัง + บทสนทนา/คำบรรยาย + อารมณ์

เทมเพลต
แผงคอมมิคเดียวในสไตล์ [สไตล์ศิลปะ] ในเบื้องหน้า,
[คำอธิบายตัวละครและการกระทำ] ในพื้นหลัง, [รายละเอียดการตั้งค่า]
แผงมี [กล่องบทสนทนา/คำบรรยาย] พร้อมข้อความ \"[ข้อความที่แน่นอน]\"
แสงสร้างอารมณ์ [อารมณ์] [อัตราส่วนภาพ]

เทคนิคการแก้ไขภาพขั้นสูง

นอกเหนือจากการสร้างข้อความเป็นภาพแล้ว Nano Banana Pro ยังยอดเยี่ยมในการปรับเปลี่ยนภาพที่มีอยู่ กุญแจสำคัญคือการทำความเข้าใจวิธีการอธิบายการแก้ไขของคุณอย่างชัดเจนในขณะที่ระบุสิ่งที่ต้องคงอยู่เหมือนเดิม

สัญญาการเปลี่ยนแปลง vs การคงสภาพ

เมื่อแก้ไขภาพ ฉันใช้โครงสร้างเฉพาะที่เน้นความชัดเจนเกี่ยวกับสิ่งที่ควรและไม่ควรเปลี่ยนแปลง:

โครงสร้าง Prompt แก้ไขภาพ
KEEP (คงสภาพ): [องค์ประกอบที่ต้องคงอยู่เหมือนเดิม]
- \"รักษาคุณสมบัติใบหน้าและการแสดงออกที่แน่นอนของบุคคล\"
- \"รักษาทิศทางและความเข้มของแสงดั้งเดิม\"

CHANGE (เปลี่ยน): [การปรับเปลี่ยนเฉพาะที่จำเป็น]
- \"แทนที่พื้นหลังด้วยฉากชายหาดตอนพระอาทิตย์ตก\"
- \"เปลี่ยนสีเสื้อจากสีฟ้าเป็นสีแดง\"

HOW (อย่างไร): [ทิศทางสไตล์และคุณภาพ]
- \"ตรวจสอบให้แน่ใจว่ามีการรวมแสงตามธรรมชาติ\"
- \"จับคู่การไล่ระดับสีของภาพต้นฉบับ\"

CONSTRAINTS (ข้อจำกัด): [สิ่งที่ควรหลีกเลี่ยง]
- \"อย่าเปลี่ยนคุณสมบัติใบหน้าใดๆ\"
- \"หลีกเลี่ยงการเปลี่ยนทิศทางเงา\"

การเพิ่มและลบองค์ประกอบ

เทมเพลตการเพิ่มองค์ประกอบ
ใช้ภาพที่ให้มาของ [ตัวแบบ] โปรดเพิ่ม [องค์ประกอบ]
ลงในฉาก วางไว้ [คำอธิบายตำแหน่ง] ตรวจสอบให้แน่ใจว่าส่วนเพิ่มเติม
[คำอธิบายการรวม: จับคู่แสง, จับคู่มุมมอง, ฯลฯ]
รักษาองค์ประกอบอื่นๆ ทั้งหมดให้ตรงกับที่ปรากฏในต้นฉบับ
ตัวอย่างการปฏิบัติ
ใช้ภาพแมวของฉันนี้ เพิ่มหมวกพ่อมดถักขนาดเล็ก
บนหัวของมัน หมวกควรนั่งอย่างเป็นธรรมชาติ จับคู่กับแสง
นุ่มนวลของภาพถ่าย รักษาการแสดงออกของแมว ท่าทาง และ
องค์ประกอบพื้นหลังทั้งหมดไม่เปลี่ยนแปลง

การถ่ายโอนสไตล์

การถ่ายโอนสไตล์ศิลปะ
เปลี่ยนภาพถ่ายที่ให้มาของ [ตัวแบบ] ให้เป็นสไตล์
ศิลปะของ [ศิลปิน/ขบวนการศิลปะ] รักษาองค์ประกอบเดิม
แต่เรนเดอร์องค์ประกอบทั้งหมดด้วย [คำอธิบายองค์ประกอบสไตล์]

ตัวอย่าง: เปลี่ยนภาพถ่ายถนนในเมืองสมัยใหม่ตอนกลางคืนนี้
ให้เป็นสไตล์ \"Starry Night\" ของ Vincent van Gogh รักษาองค์ประกอบ
ของอาคารและรถยนต์แต่เรนเดอร์ทุกอย่างด้วยฝีแปรงหมุนวนและหนา
และจานสีที่น่าทึ่งของสีน้ำเงินเข้มและสีเหลืองสดใส

การจัดองค์ประกอบหลายภาพ

การรวมหลายภาพ
สร้างภาพใหม่โดยรวมองค์ประกอบจากภาพที่ให้มา
นำ [องค์ประกอบจากภาพ 1] และวางไว้กับ/ใน [องค์ประกอบจากภาพ 2]
ภาพสุดท้ายควรเป็น [คำอธิบายผลลัพธ์ที่ต้องการ]

ตัวอย่าง: รวมภาพเหล่านี้ - นำจรวดจากภาพ 1
และวางไว้ในขณะที่กำลังปล่อยตัวจากหาดเกาะเขตร้อนในภาพ 2
ภาพสุดท้ายควรแสดงฉากชายหาดที่เงียบสงบพร้อมจรวด
ที่ปล่อยตัวอย่างน่าทึ่งในพื้นหลัง แสงอาทิตย์ตก

การรักษาเอกลักษณ์ความเที่ยงตรงสูง

สำหรับการแก้ไขที่การรักษาเอกลักษณ์ใบหน้าเป็นสิ่งสำคัญ:

การแก้ไขเพื่อรักษาเอกลักษณ์
ใช้ภาพที่ให้มา วาง [องค์ประกอบจากภาพ 2] บน
[ตัวแบบในภาพ 1] ตรวจสอบให้แน่ใจว่าคุณสมบัติของ [ตัวแบบ] ยังคง
ไม่เปลี่ยนแปลงอย่างสมบูรณ์ — โครงสร้างใบหน้า การแสดงออก และ
สัดส่วนเดียวกัน องค์ประกอบที่เพิ่มเข้ามาควรรวมเข้าด้วยกันอย่างเป็นธรรมชาติกับ
[คำอธิบายข้อกำหนดการรวม]

ตัวอย่าง: นำผู้หญิงที่มีผมสีน้ำตาลและตาสีฟ้าจากภาพ 1
เพิ่มโลโก้จากภาพ 2 บนเสื้อยืดสีดำของเธอ รักษาใบหน้า
และคุณสมบัติของเธอให้ไม่เปลี่ยนแปลงอย่างแน่นอน โลโก้ควรดูเป็นธรรมชาติ
พิมพ์บนผ้า ตามรอยยับของเสื้อ

ร่างเป็นความจริง

การพัฒนาแนวคิด
เปลี่ยนร่างหยาบ [สื่อ: ดินสอ/ปากกามาร์คเกอร์/ดิจิทัล] นี้ของ
[ตัวแบบ] ให้เป็นภาพเสร็จสมบูรณ์ [คำอธิบายสไตล์] รักษา
[คุณสมบัติเฉพาะที่ต้องรักษา] จากร่างแต่เพิ่ม
[รายละเอียด/วัสดุ/การตกแต่งใหม่]

ตัวอย่าง: เปลี่ยนร่างดินสอหยาบของรถยนต์แห่งอนาคตนี้
ให้เป็นภาพถ่ายโชว์รูมที่ขัดเงาของรถต้นแบบสุดท้าย
รักษาเส้นสายที่เพรียวบางและโปรไฟล์ต่ำจากร่างแต่เพิ่ม
สีน้ำเงินเมทัลลิกและแสงขอบนีออน

ข้อผิดพลาดที่ทำลายผลลัพธ์ของฉัน

การเรียนรู้สิ่งที่ไม่ควรทำมีความสำคัญพอๆ กับการเรียนรู้สิ่งที่ควรทำ นี่คือข้อผิดพลาดที่ให้ผลลัพธ์ที่ไม่ดีอย่างสม่ำเสมอจนกระทั่งฉันระบุและกำจัดพวกมัน

ข้อผิดพลาดที่ 1: การยัดเยียดคำหลัก

สิ่งที่ฉันทำ: การเพิ่มคำหลักคุณภาพเช่น "masterpiece, ultra-detailed, 8K, trending on ArtStation, unreal engine" ลงในทุก prompt

ทำไมมันล้มเหลว: Nano Banana Pro ได้รับการฝึกฝนแตกต่างจากรุ่นเก่า คำหลักเหล่านี้อาจไม่มีผลหรืออาจทำให้โมเดลสับสนเกี่ยวกับความตั้งใจจริงของคุณ

แนวทางที่ดีกว่า: มุ่งเน้นไปที่ความเฉพาะเจาะจงเชิงพรรณนาแทนที่จะเป็นคำหลักคุณภาพ อธิบายสิ่งที่คุณต้องการเห็นอย่างแม่นยำ

ข้อผิดพลาดที่ 2: การ Prompt เชิงลบ

สิ่งที่ฉันทำ: เขียน "no blur, no artifacts, no deformed hands, no extra fingers."

ทำไมมันล้มเหลว: Nano Banana Pro ไม่รองรับการ prompt เชิงลบในลักษณะเดียวกับโมเดลการแพร่กระจาย การบอกสิ่งที่ไม่ควรทำอาจนำองค์ประกอบเหล่านั้นเข้ามาจริงๆ

แนวทางที่ดีกว่า: อธิบายสิ่งที่คุณต้องการในเชิงบวก แทนที่จะเป็น "no blur," ให้พูดว่า "sharp focus."

ข้อผิดพลาดที่ 3: การอ้างอิงสไตล์ที่คลุมเครือ

สิ่งที่ฉันทำ: เขียน "beautiful image, stunning, amazing, gorgeous."

ทำไมมันล้มเหลว: คำเหล่านี้ไม่ได้ให้ข้อมูลที่นำไปปฏิบัติได้ สิ่งที่ทำให้บางสิ่ง "สวยงาม" เป็นเรื่องส่วนตัว

แนวทางที่ดีกว่า: อธิบายคุณสมบัติทางภาพที่เฉพาะเจาะจง "Warm color palette with golden highlights" บอกโมเดลอย่างแม่นยำว่าจะเรนเดอร์อะไร

ข้อผิดพลาดที่ 4: การละเลยอัตราส่วนภาพ

สิ่งที่ฉันทำ: ไม่ระบุอัตราส่วนภาพแล้วพยายามตัดผลลัพธ์ให้พอดีกับความต้องการของฉัน

ทำไมมันล้มเหลว: โมเดลจัดองค์ประกอบภาพแตกต่างกันตามอัตราส่วนภาพ องค์ประกอบสี่เหลี่ยมจัตุรัสมีความสมดุลที่แตกต่างจากช็อตกว้างแบบภาพยนตร์

แนวทางที่ดีกว่า: ระบุอัตราส่วนภาพเป้าหมายของคุณล่วงหน้าเสมอ "16:9 horizontal," "9:16 vertical," "1:1 square."

ข้อผิดพลาดที่ 5: Prompt ที่ซับซ้อนเกินไป

สิ่งที่ฉันทำ: พยายามระบุทุกรายละเอียดที่เป็นไปได้ใน prompt ขนาดใหญ่เดียว

ทำไมมันล้มเหลว: เกินความซับซ้อนระดับหนึ่ง องค์ประกอบเริ่มหายไปหรือขัดแย้งกัน

แนวทางที่ดีกว่า: เริ่มต้นด้วยองค์ประกอบหลัก สร้าง จากนั้นปรับแต่งผ่านการสนทนาด้วยการติดตามผลที่เป็นเป้าหมาย

ข้อผิดพลาดที่ 6: ลืมโหมดการคิด

สิ่งที่ฉันทำ: ใช้โหมดมาตรฐานสำหรับองค์ประกอบที่ซับซ้อน

ทำไมมันล้มเหลว: โหมดมาตรฐานไม่ได้ใช้ความสามารถในการให้เหตุผลอย่างเต็มที่สำหรับคำขอที่ซับซ้อน

แนวทางที่ดีกว่า: สำหรับองค์ประกอบที่ซับซ้อน ให้เปิดโหมดการคิด สิ่งนี้ช่วยให้โมเดลวิเคราะห์ความสัมพันธ์เชิงพื้นที่อย่างลึกซึ้งก่อนที่จะสร้าง

💡

บทเรียนเมตา: Nano Banana Pro เป็นคู่สนทนา ไม่ใช่ตู้สล็อต ปฏิบัติต่อมันเหมือนคุณกำลังกำกับศิลปินที่มีความสามารถมาก — ให้ทิศทางที่ชัดเจน ตรวจสอบผลลัพธ์ ปรับแต่งร่วมกัน แนวทางแบบวนซ้ำชนะการพยายามทำให้สมบูรณ์แบบใน prompt เดียว

การรวม API สำหรับนักพัฒนา

สำหรับนักพัฒนาที่ต้องการรวม Nano Banana Pro เข้ากับแอปพลิเคชัน API มีให้บริการผ่าน Google AI Studio และ Vertex AI นี่คือรายละเอียดทางเทคนิคที่สำคัญ:

คำขอสร้างพื้นฐาน

ตัวอย่าง Python API
from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_images(
    model='imagen-3.0-generate-002',  # Nano Banana Pro
    prompt='A photorealistic portrait of a robot barista...',
    config=types.GenerateImagesConfig(
        number_of_images=1,
        aspect_ratio='16:9',
        output_mime_type='image/jpeg'
    )
)

# Access the generated image
image_data = response.generated_images[0].image.image_bytes

คำขอแก้ไขภาพ

การแก้ไขด้วยความเที่ยงตรงสูง
response = client.models.edit_image(
    model='imagen-3.0-capability-001',
    prompt='Change the background to a sunset beach...',
    reference_images=[open('original.png', 'rb')],
    config=types.EditImageConfig(
        edit_mode='INPAINT',
        number_of_images=1,
        input_fidelity='high',  # Critical for identity preservation
        output_mime_type='image/png'
    )
)

การตั้งค่า input_fidelity='high' ปรับปรุงการรักษาเอกลักษณ์อย่างมากเมื่อทำการแก้ไขภาพที่มีใบหน้าหรือรายละเอียดที่สำคัญ

พารามิเตอร์หลัก

  • aspect_ratio: \"1:1\", \"16:9\", \"9:16\", \"4:3\", \"3:4\", \"21:9\"
  • number_of_images: 1-4 ภาพต่อคำขอ
  • output_mime_type: \"image/jpeg\" หรือ \"image/png\"
  • input_fidelity: \"low\" (เร็วกว่า) หรือ \"high\" (รักษาเอกลักษณ์ได้ดีกว่า)
  • safety_filter_level: ควบคุมความเข้มงวดของการกรองเนื้อหา

ขีดจำกัดอัตราและโควต้า

ระวังขีดจำกัดการใช้งาน:

  • ขีดจำกัดโควต้า Gemini 2.0 Flash ใช้กับการสร้างภาพ
  • หากคุณถึงขีดจำกัดรายวัน ให้เปลี่ยนเป็นโหมด \"Fast\" เพื่อดำเนินการสร้างมาตรฐานต่อ
  • บัญชี Enterprise Vertex AI มีขีดจำกัดที่สูงกว่า
  • พิจารณาใช้คิวคำขอสำหรับแอปพลิเคชันที่มีปริมาณมาก

ห้องสมุด Prompt ขั้นสูงสุด

ฉันได้จัดระเบียบ prompt ที่ประสบความสำเร็จที่สุดของฉันเป็นหมวดหมู่เพื่อให้อ้างอิงได้ง่าย ทั้งหมดนี้ได้รับการทดสอบและปรับแต่งผ่านการวนซ้ำหลายครั้ง

การถ่ายภาพพอร์ตเทรต

พอร์ตเทรตในสภาพแวดล้อม
Environmental portrait of a [occupation] in their workspace.
Natural window light from left creating soft shadows.
Subject placed at third mark, looking slightly off-camera.
Background shows authentic tools of their trade, slightly out of focus.
Shot on 50mm equivalent f/2.0. Warm color temperature.
Authentic, documentary photography style.

ภาพถ่ายสินค้า

ภาพสินค้าฮีโร่
Hero product shot of [product] floating against a gradient
background shifting from [color 1] to [color 2].
Three-point lighting creating dramatic shadows and highlights.
Product at a slight angle showing dimensional form.
Reflection on glossy surface below.
Key features highlighted with minimal floating text callouts.
4K resolution, premium brand photography aesthetic.

สไตล์ภาพประกอบ

โปสเตอร์ท่องเที่ยววินเทจ
Vintage travel poster for [destination] in 1930s Art Deco style.
Bold geometric shapes, limited color palette [3-4 colors].
Iconic landmark as central focus with stylized sun rays behind.
Large sans-serif title \"[DESTINATION NAME]\" at top.
Small slogan \"[catchy phrase]\" at bottom.
Slightly weathered texture for authenticity.
Vertical format for poster printing.

UI/UX Mockups

หน้าจอแอปมือถือ
Mobile app UI design for a [app type] application.
Modern iOS style interface with accent colors [color scheme].
[Screen type: home feed / profile / settings / etc.]
Include realistic content: [specific elements].
Clean typography with SF Pro or similar.
Subtle shadows and depth.
Device frame optional.
Focus on usability and visual hierarchy.

ศิลปะแนวคิด

แนวคิดสภาพแวดล้อม
Concept art for a [genre: sci-fi/fantasy/etc.] [location type].
Lighting [time of day] setting [mood] mood.
Key features: [list 3-5 distinct elements].
Human figures for scale in [locations].
Painterly style with visible brushstrokes in backgrounds,
detailed line art for architectural elements.
Cinematic composition with strong foreground-midground-background separation.
16:9 format for game/movie pitch.

อินโฟกราฟิก

อินโฟกราฟิกกระบวนการ
Infographic explaining [process/concept] in [number] steps.
Clean, modern design with [color scheme].
Each step numbered with icon and brief explanatory text.
Visual flow from [direction: top to bottom / left to right].
Connecting arrows or lines between steps.
Title: \"[Topic Title]\" at top in bold.
All text must be crisp and legible.
White or light grey background.
Suitable for [platform: social media / print / presentation].

ความคิดเห็นสุดท้าย

คืนนั้นที่ Nano Banana Pro เปิดตัว ฉันได้สัมผัสกับบางสิ่งที่ฉันไม่ได้รู้สึกตั้งแต่การพบกันครั้งแรกกับการสร้างภาพ AI: ความเกรงขามอย่างแท้จริงต่อสิ่งที่จู่ๆ ก็เป็นไปได้ อุปสรรคที่กำหนดขั้นตอนการทำงานของฉัน — ข้อจำกัดในการเรนเดอร์ข้อความ ปัญหาความสม่ำเสมอ การขาดการให้เหตุผล — ระเหยไปทีละอย่างในขณะที่ฉันสำรวจ

แต่ฉันก็ได้เรียนรู้บางสิ่งที่ลึกซึ้งยิ่งขึ้นผ่านการใช้งานอย่างเข้มข้นหลายเดือน: เครื่องมือมีความสำคัญน้อยกว่าผู้ที่ใช้มัน Nano Banana Pro มีพลังอย่างไม่น่าเชื่อ แต่พลังนั้นจะมีประโยชน์ก็ต่อเมื่อคุณเข้าใจวิธีการสื่อสารวิสัยทัศน์ของคุณอย่างชัดเจน ทำซ้ำอย่างระมัดระวัง และตระหนักถึงทั้งศักยภาพและขีดจำกัดของเทคโนโลยี

เทคนิคในคู่มือนี้เป็นจุดเริ่มต้น ไม่ใช่จุดสิ้นสุด ผู้สร้างที่จะทำงานที่น่าทึ่งอย่างแท้จริงด้วย Nano Banana Pro คือผู้ที่จะนำพื้นฐานเหล่านี้ไปผลักดันให้ไกลกว่าเดิม — ผสมผสานความสามารถในวิธีที่ไม่มีใครคิด แก้ปัญหาที่ไม่มีใครรู้ว่าแก้ไขได้ สร้างประสบการณ์ทางภาพที่น่าประหลาดใจและน่ายินดี

\"เมื่อ AI มีพลังมากขึ้น สิ่งเดียวที่จำกัดเราคือจินตนาการที่ยากจนของเราเอง\"

ฉันเขียนสิ่งนั้นลงในบันทึกของฉันตอนตี 5 ในคืนที่ Nano Banana Pro เปิดตัว และมันได้กลายเป็นหลักการชี้นำ เทคโนโลยีจะก้าวหน้าต่อไป ความสามารถใหม่ๆ จะปรากฏขึ้น แต่ทักษะพื้นฐาน — การแปลภาพในใจของคุณเป็นคำสั่งที่เครื่องจักรสามารถดำเนินการได้ — จะยังคงมีค่าไม่ว่าโมเดลใดจะเป็นปัจจุบัน

ดังนั้นทดลองอย่างไม่หยุดยั้ง ผลักดันขอบเขต ลอง prompt ที่ดูเหมือนเป็นไปไม่ได้ สร้างภาพหลายพันภาพ เรียนรู้สิ่งที่ได้ผล และที่สำคัญพอๆ กัน สิ่งที่ไม่ได้ผล สร้างสัญชาตญาณของคุณเองว่าระบบเหล่านี้คิดอย่างไร

อนาคตของการสร้างสรรค์ภาพคือการทำงานร่วมกัน — มนุษย์ให้วิสัยทัศน์ ทิศทาง และการตัดสิน; AI ให้ความเร็วในการดำเนินการและความสามารถทางเทคนิค Nano Banana Pro เป็นพันธมิตรที่ทำงานร่วมกันที่มีความสามารถมากที่สุดที่เราเคยมีมา คำถามไม่ใช่ \"AI ทำสิ่งนี้ได้ไหม?\" อีกต่อไป แต่เป็น \"เราจะสร้างอะไรด้วยกัน?\"

ฉันแทบรอไม่ไหวที่จะเห็นสิ่งที่คุณสร้าง

💡

พร้อมที่จะเริ่มหรือยัง? เปิด Gemini, เปิดใช้งานโหมด Thinking (การคิด), และลอง prompt นี้: \"สร้างโปสเตอร์ภาพยนตร์ที่มีรายละเอียดสำหรับภาพยนตร์ที่มีอยู่เฉพาะในจินตนาการของฉัน — เรื่องราวเกี่ยวกับ [ไอเดียของคุณ] ทำให้ชื่อเรื่องเป็นจุดโฟกัสทางสายตาด้วยการจัดวางตัวอักษรที่สวยงาม\" จากนั้นทำซ้ำ ปรับแต่ง และทำให้เป็นของคุณเอง

การสนทนา

0 ความคิดเห็น

แสดงความคิดเห็น

เป็นคนแรกที่แบ่งปันความคิดของคุณ!