Tôi Đã Thức Suốt Đêm Thử Nghiệm Nano Banana Pro Và Khám Phá 15 Kỹ Thuật Sáng Tạo Đáng Kinh Ngạc

Giao diện sáng tạo Nano Banana Pro hiển thị các tác phẩm nghệ thuật và thiết kế do AI tạo ra
Nano Banana Pro — nơi trí tưởng tượng gặp gỡ sự thực thi chuyên nghiệp
Bí Mật Mà Tôi Đã Khám Phá

Sự khác biệt giữa những hình ảnh AI tầm thường và những sáng tạo khiến bạn há hốc mồm không phải là do may mắn hay công cụ đắt tiền — đó là về việc hiểu cách Nano Banana Pro suy nghĩ và học cách nói ngôn ngữ hình ảnh của nó.

Tôi vẫn nhớ chính xác khoảnh khắc mọi thứ thay đổi. Lúc đó là 3 giờ sáng khi điện thoại của tôi bắt đầu rung liên tục. Các cộng đồng sáng tạo của tôi đang bùng nổ. "Bạn đã thấy cái này chưa?" "Google vừa phát hành một thứ gì đó điên rồ." "Hãy quên mọi thứ bạn biết về hình ảnh AI." Tôi dụi mắt, mở máy tính xách tay và những gì tôi thấy đã thay đổi mọi thứ tôi nghĩ tôi biết về việc tạo hình ảnh AI.

Nano Banana Pro đã đến. Không phải là một bản cập nhật nhỏ, không phải là một sự cải tiến dần dần, mà là một sự thay đổi mô hình hoàn toàn. Trong vòng vài phút thử nghiệm, tôi đã tạo ra văn bản thực sự có thể đọc được bằng nhiều ngôn ngữ, tô màu manga chỉ với một prompt duy nhất, tạo ra các poster phim trông giống như chúng đến từ một studio Hollywood. Các nhóm tôi tham gia bùng nổ với các ví dụ — mỗi cái ấn tượng hơn cái trước.

Đêm đó, tôi không ngủ. Tôi đã tạo ra hàng trăm hình ảnh, thử nghiệm mọi kỹ thuật tôi có thể nghĩ ra, đẩy các giới hạn mà tôi không biết là có tồn tại. Khi mặt trời mọc, tôi đã ghi lại tám quy trình làm việc sáng tạo hoàn toàn mới mà chỉ 24 giờ trước đó là không thể. Và trong những tuần tiếp theo, tôi đã khám phá thêm bảy cái nữa. Đây là tất cả những gì tôi đã học được — hướng dẫn đầy đủ để làm chủ Nano Banana Pro mà tôi ước gì đã tồn tại khi tôi bắt đầu hành trình xuyên đêm của mình vào tương lai của việc tạo hình ảnh AI.

Đêm Mọi Thứ Thay Đổi

Hãy để tôi đưa bạn trở lại khoảnh khắc đó. Tôi đã sử dụng các trình tạo hình ảnh AI trong hơn một năm — DALL-E, Midjourney, Stable Diffusion, các mô hình hình ảnh Gemini đời đầu. Chúng rất ấn tượng, chắc chắn rồi, nhưng tất cả đều chia sẻ những hạn chế khó chịu giống nhau. Kết xuất văn bản là một thảm họa. Các chữ viết không phải Latinh xuất hiện như những chữ tượng hình ngoài hành tinh. Duy trì tính nhất quán của nhân vật qua nhiều hình ảnh? Quên đi.

Tôi đã chấp nhận quy trình làm việc sử dụng AI cho các ý tưởng ban đầu, sau đó dành hàng giờ trong Photoshop để sửa chữa các vấn đề không thể tránh khỏi. Văn bản phải được thêm thủ công. Khuôn mặt cần chỉnh sửa. Nó hữu ích, nhưng tôi cảm thấy như công nghệ vĩnh viễn bị mắc kẹt ở mức 80%.

Sau đó Nano Banana Pro ra mắt.

Điều đầu tiên tôi thử là một poster phim với kiểu chữ phức tạp — một điều luôn là không thể. Tôi đã nhập một prompt yêu cầu thư pháp nghệ thuật trôi chảy, văn bản tiêu đề cách điệu và vị trí phụ đề thanh lịch. Những gì xuất hiện trên màn hình của tôi khiến tôi phải thốt lên. Các chữ cái thật hoàn hảo. Kiểu chữ thật đẹp. Bố cục thật chuyên nghiệp. Tôi ngồi đó nhìn chằm chằm vào nó trong trọn một phút.

💡

Khoảnh khắc tôi nhận ra Nano Banana Pro khác biệt: Tôi yêu cầu nó tạo ra thư pháp cách điệu, mong đợi mớ hỗn độn lộn xộn thông thường, và thay vào đó nhận được kiểu chữ trông giống như đến từ một studio thiết kế chuyên nghiệp. Đó là lúc tôi biết các quy tắc đã thay đổi.

Trong những giờ tiếp theo, tôi đã khám phá hết khả năng này đến khả năng khác mà tôi không biết là có thể. Tôi đã tô màu một trang manga đen trắng trong khi đồng thời dịch văn bản. Tôi đã tạo ra các bản thiết kế kiến trúc từ một bức ảnh duy nhất. Tôi đã tạo ra các giao diện trò chơi thực tế đến mức bạn bè hỏi nó thuộc trò chơi nào. Mỗi khám phá dẫn đến một khám phá khác, và một khám phá khác, cho đến khi mặt trời mọc và tôi nhận ra mình đã không rời khỏi bàn làm việc trong tám giờ.

Những gì tiếp theo là tất cả những gì tôi đã học được vào đêm đó và những tuần thử nghiệm chuyên sâu sau đó. Đây không phải là một cái nhìn tổng quan hời hợt — đó là kiến thức sâu sắc đến từ việc đẩy các công cụ này đến giới hạn tuyệt đối của chúng và ghi lại những gì hoạt động, những gì không, và tại sao.

Điều Gì Làm Cho Nano Banana Pro Khác Biệt

Trước khi chúng ta đi sâu vào các kỹ thuật, hãy để tôi giải thích chính xác Nano Banana Pro là gì và tại sao nó đại diện cho một bước nhảy vọt quan trọng như vậy. Nano Banana Pro — tên chính thức là Gemini 2.0 Flash Image — là mô hình tạo hình ảnh tiên tiến nhất của Google, được xây dựng trên nền tảng của khả năng suy luận mạnh mẽ của Gemini 2.0.

Đây không chỉ là lời nói tiếp thị. Việc tích hợp với Gemini 2.0 có nghĩa là Nano Banana Pro không chỉ tạo ra hình ảnh dựa trên việc khớp mẫu — nó thực sự hiểu những gì bạn đang yêu cầu. Nó có kiến thức về thế giới. Nó có thể suy nghĩ về các mối quan hệ không gian, bối cảnh văn hóa và thông số kỹ thuật. Hỏi về một địa danh nổi tiếng và nó biết phong cách kiến trúc, bối cảnh lịch sử và cách thể hiện nó một cách chính xác.

Kết Xuất Văn Bản Mang Tính Cách Mạng

Kết xuất văn bản hiện đại bằng nhiều ngôn ngữ với độ chính xác chính tả được cải thiện đáng kể. Kiểu chữ trông thực sự chuyên nghiệp bằng tiếng Latinh, CJK và các chữ viết khác. Điều này một mình đã thay đổi những gì có thể với việc tạo hình ảnh AI.

Kiến Thức Thế Giới Sâu Sắc

Được xây dựng trên khả năng suy luận của Gemini 2.0 Flash, nó hiểu bối cảnh, văn hóa và sắc thái. Nó biết các tài liệu tham khảo lịch sử, phong cách kiến trúc, khái niệm khoa học và sắc thái văn hóa — và có thể thể hiện chúng một cách trực quan.

Kiểm Soát Chính Xác

Kiểm soát cấp độ studio đối với ánh sáng, góc máy ảnh, độ sâu trường ảnh và bố cục. Các nhiếp ảnh gia và nhà thiết kế chuyên nghiệp cuối cùng có thể nhận được kết quả phù hợp với tầm nhìn của họ mà không cần tái tạo vô tận.

Bố Cục Nhiều Hình Ảnh

Kết hợp tối đa 14 hình ảnh tham khảo vào một bố cục duy nhất. Duy trì tính nhất quán của nhân vật, pha trộn phong cách, chuyển các yếu tố giữa các hình ảnh — tất cả trong khi vẫn giữ lại những phẩm chất bạn muốn giữ.

Đầu Ra Linh Hoạt

Độ phân giải gốc 2K với đầu ra 4K tùy chọn. Hỗ trợ nhiều tỷ lệ khung hình. Tạo mọi thứ từ hình nền điện thoại dọc đến bố cục điện ảnh siêu rộng 21:9.

Chỉnh Sửa Thông Minh

Sửa đổi các hình ảnh hiện có bằng các lệnh văn bản trong khi vẫn giữ lại các yếu tố bạn muốn giữ. Thay đổi mùa, hoán đổi đối tượng, điều chỉnh ánh sáng — tất cả đều không có các vấn đề trôi dạt đã làm hỏng các mô hình trước đó.

Nơi Truy Cập Nano Banana Pro

Hiện tại, Nano Banana Pro có sẵn thông qua một số kênh, mỗi kênh có các khả năng khác nhau:

  • Ứng dụng Gemini: Tùy chọn dễ tiếp cận nhất. Trong Gemini, bật chế độ "Thinking" (Suy nghĩ) và yêu cầu tạo hình ảnh để kích hoạt Nano Banana Pro. Điều này cung cấp cho bạn khả năng đầy đủ của mô hình với giao diện dựa trên trò chuyện.
  • Google AI Studio: Dành cho các nhà phát triển và người dùng muốn kiểm soát nhiều hơn. Truy cập vào các tham số nâng cao và tích hợp với quy trình làm việc tùy chỉnh.
  • Vertex AI: Truy cập cấp doanh nghiệp với khả năng API đầy đủ cho các ứng dụng sản xuất.
  • Nền tảng bên thứ ba: Các dịch vụ như Lovart.ai thường cung cấp quyền truy cập sớm vào các mô hình mới với thời gian dùng thử miễn phí.
💡

Mẹo chuyên nghiệp: Trong ứng dụng Gemini, việc tạo hình ảnh thứ hai với cùng một prompt thường mang lại kết quả tốt hơn lần thử đầu tiên. Mô hình dường như sử dụng lần tạo đầu tiên làm bối cảnh ngầm để tinh chỉnh. Tôi đã biến điều này thành một phần của quy trình làm việc tiêu chuẩn của mình.

Ba Đột Phá Quan Trọng

Mặc dù Nano Banana Pro bao gồm hàng chục cải tiến, ba đột phá cụ thể thay đổi cơ bản những gì có thể với việc tạo hình ảnh AI. Hiểu những điều này sẽ giúp bạn tận dụng sức mạnh thực sự của mô hình.

1
Độ Phân Giải Gốc 4K với Đầu Ra Trực Tiếp

Các mô hình trước đây hoặc không thể tạo ra hình ảnh độ phân giải cao hoặc yêu cầu nâng cấp thường tạo ra các tạo tác. Nano Banana Pro tạo ra hình ảnh 4K gốc trực tiếp, với chi tiết và độ rõ nét được tích hợp ngay từ đầu. Đây không chỉ là về số lượng pixel — đó là về chi tiết xác thực ở cấp độ lông mi riêng lẻ, mẫu dệt vải và các biến thể kết cấu tinh tế. Đối với nhiếp ảnh sản phẩm và công việc thương mại, điều này thay đổi tất cả.

2
Tỷ Lệ Khung Hình Tùy Chỉnh Không Thỏa Hiệp

Cần một poster dọc 9:16? Một khung hình điện ảnh 21:9? Một hình vuông hoàn hảo cho Instagram? Nano Banana Pro xử lý bất kỳ tỷ lệ khung hình nào mà không gặp các vấn đề về bố cục đã làm hỏng các mô hình trước đó. AI hiểu cách bố cục hình ảnh chính xác bất kể định dạng — chủ thể không bị cắt một cách vụng về, văn bản không bị tràn và cân bằng hình ảnh vẫn chuyên nghiệp.

3
Tạo Tích Hợp Suy Luận

Đây là điều lớn lao. Vì Nano Banana Pro được xây dựng trên công cụ suy luận của Gemini 2.0, nó không chỉ khớp các mẫu — nó suy nghĩ về những gì bạn đang yêu cầu. Yêu cầu một sơ đồ kiến trúc của một tòa nhà, và nó suy nghĩ về kỹ thuật kết cấu. Yêu cầu một minh họa khoa học, và nó rút ra từ kiến thức khoa học thực sự. Yêu cầu một tham chiếu văn hóa, và nó hiểu bối cảnh. Khả năng suy luận này là thứ cho phép hầu hết các kỹ thuật nâng cao trong hướng dẫn này.

Cuộc Cách Mạng Trong Kết Xuất Văn Bản

Tôi cần dành một chút thời gian cho việc kết xuất văn bản vì đây là khả năng khiến tôi sốc nhất. Trong nhiều năm, các trình tạo hình ảnh AI về cơ bản là vô dụng cho bất kỳ công việc nghiêm túc nào liên quan đến văn bản ngoài các từ tiếng Anh đơn giản. Kiểu chữ phức tạp, phông chữ cách điệu và các chữ viết không phải Latinh xuất hiện lộn xộn, lặp đi lặp lại, thiếu các yếu tố hoặc đơn giản là sai. Bạn có thể tạo ra một hình ảnh đẹp và sau đó phải làm lại hoàn toàn bất kỳ yếu tố văn bản nào trong Photoshop.

Nano Banana Pro thay đổi hoàn toàn điều này. Tôi đã tạo ra các poster phim với thư pháp phức tạp, bao bì sản phẩm với thông số kỹ thuật chi tiết, đồ họa thông tin với các đoạn văn bản dày đặc — tất cả đều được hiển thị chính xác. Kiểu chữ không chỉ dễ đọc; nó thực sự đẹp. Các kiểu phông chữ được tôn trọng. Khoảng cách ký tự là tự nhiên. Khả năng đơn lẻ này mở ra toàn bộ danh mục công việc trước đây là không thể.

Và không chỉ là văn bản cách điệu. Việc kết xuất văn bản tiếng Anh tiêu chuẩn cũng đã được cải thiện đáng kể. Văn bản nhỏ vẫn dễ đọc. Độ chính xác chính tả là đáng chú ý. Bạn có thể đưa các đoạn văn bản vào một hình ảnh và thực sự sử dụng đầu ra một cách chuyên nghiệp.

Khung Prompt Thay Đổi Mọi Thứ

Sau khi tạo ra hàng ngàn hình ảnh với Nano Banana Pro, tôi đã phát triển một cách tiếp cận có cấu trúc cho các prompt tạo ra kết quả xuất sắc một cách nhất quán. Hãy quên các kỹ thuật nhồi nhét từ khóa cũ từ các mô hình AI trước đó — "masterpiece, ultra-detailed, trending on ArtStation" không giúp ích gì ở đây. Nano Banana Pro phản hồi với sự rõ ràng, cấu trúc và tính cụ thể.

Tôi gọi nó là Khung ICS: Image type (Loại hình ảnh), Content (Nội dung), và Style (Phong cách). Mọi prompt hiệu quả tôi viết bây giờ đều tuân theo cấu trúc này.

Khung Prompt ICS
IMAGE TYPE (LOẠI HÌNH ẢNH):
- [Loại hình ảnh gì: nhiếp ảnh, minh họa, sơ đồ, poster, mockup giao diện người dùng, v.v.]
- [Mục đích sử dụng và bối cảnh khán giả]

CONTENT (NỘI DUNG):
- [Chủ đề chính với các chi tiết cụ thể]
- [Mô tả nền/môi trường]
- [Hành động hoặc mối quan hệ giữa các yếu tố]
- [Bất kỳ văn bản nào cần xuất hiện, trong dấu ngoặc kép]

STYLE (PHONG CÁCH):
- [Phương tiện: nhiếp ảnh, màu nước, kết xuất 3D, vector, v.v.]
- [Tham khảo: \"Nhiếp ảnh sản phẩm Apple\", \"poster du lịch cổ điển\", v.v.]
- [Chi tiết kỹ thuật: ống kính máy ảnh, ánh sáng, bảng màu]
- [Yêu cầu về chất lượng và độ phân giải]

Khung này cung cấp cho mô hình bối cảnh rõ ràng cho mọi quyết định hình ảnh mà nó cần đưa ra.

Nguyên Tắc Phân Cấp

Đây là điều mà hầu hết các hướng dẫn sẽ không cho bạn biết: thứ tự thông tin trong prompt của bạn rất quan trọng. Các yếu tố được đề cập sớm hơn có ảnh hưởng lớn hơn đến đầu ra cuối cùng. Tôi cấu trúc các prompt của mình với các yếu tố quan trọng nhất đầu tiên:

1
Chủ Đề Trước

Tiêu điểm chính của hình ảnh là gì? Xác định nó rõ ràng và sớm. "Một cốc cà phê gốm" tốt hơn là "một hình ảnh hiển thị một cái cốc."

2
Hành Động và Mối Quan Hệ

Điều gì đang xảy ra? Các yếu tố liên quan với nhau như thế nào? "Cốc đặt trên bàn gỗ phong hóa, hơi nước bốc lên từ cà phê nóng."

3
Vị Trí và Môi Trường

Điều này diễn ra ở đâu? Điều gì bao quanh chủ đề? "Ánh sáng buổi sáng tràn qua cửa sổ quán cà phê, tạo ra những bóng mềm mại."

4
Phong Cách và Chi Tiết Kỹ Thuật

Nó nên được hiển thị như thế nào? Máy ảnh, ánh sáng hoặc phong cách nghệ thuật nào? "Chụp bằng Canon 5D Mark IV, ống kính 85mm, f/2.8, phân loại màu tự nhiên."

Bảy Nguyên Tắc Prompt Hiệu Quả

Ngoài cấu trúc, những nguyên tắc này chi phối cách tôi viết mọi prompt. Chúng là sự khác biệt giữa những hình ảnh gần như hoạt động và những hình ảnh đánh trúng tầm nhìn của bạn một cách chính xác.

01

Cấu Trúc Hơn Từ Khóa

Sử dụng một thứ tự nhất quán: nền → chủ đề → chi tiết → ràng buộc. Đối với các yêu cầu phức tạp, hãy sử dụng các phần có nhãn hoặc ngắt dòng. Các đoạn văn dài làm rối mô hình; cấu trúc có tổ chức hướng dẫn nó đến ý định của bạn.

02

Cụ Thể Hơn So Sánh Nhất

Thay vì "chất lượng cao" hoặc "cực kỳ chi tiết", hãy mô tả các thuộc tính hình ảnh thực tế. Vật liệu, kết cấu, hình dạng, phương tiện. "Lỗ chân lông da có thể nhìn thấy và tàn nhang tinh tế" luôn đánh bại "khuôn mặt rất chi tiết".

03

Kiểm Soát Bố Cục Rõ Ràng

Đặt tên cho khung hình của bạn (cận cảnh, góc rộng, toàn cảnh), phối cảnh (ngang tầm mắt, góc thấp, góc nghiêng) và tâm trạng ánh sáng (khuếch tán mềm, giờ vàng, ánh sáng vành độ tương phản cao). Đừng để nó cho may rủi.

04

Hợp Đồng Thay Đổi vs. Giữ Nguyên

Để chỉnh sửa, hãy nêu rõ ràng những gì phải thay đổi VÀ những gì phải giữ nguyên chính xác. Sử dụng "chỉ thay đổi X" và "giữ nguyên chính xác Y". Lặp lại danh sách giữ nguyên này trong mỗi lần lặp lại để ngăn chặn sự trôi dạt.

05

Văn Bản Yêu Cầu Sự Chính Xác

Đặt văn bản bắt buộc trong "dấu ngoặc kép" hoặc CHỮ IN HOA. Chỉ định kiểu phông chữ, kích thước, màu sắc và vị trí. Đối với các từ khó hoặc tên thương hiệu, hãy đánh vần từng chữ cái. Luôn thêm "hiển thị chính xác một lần, không trùng lặp".

06

Sự Rõ Ràng Của Tham Chiếu Nhiều Hình Ảnh

Khi làm việc với nhiều hình ảnh đầu vào, hãy tham chiếu đến từng hình ảnh bằng chỉ mục và mô tả: "Hình ảnh 1: ảnh chụp sản phẩm, Hình ảnh 2: tham chiếu phong cách." Nêu rõ ràng cách chúng nên tương tác.

07

Lặp Lại Hơn Quá Tải

Bắt đầu với một prompt cơ sở sạch sẽ, sau đó tinh chỉnh bằng các thay đổi tiếp theo nhỏ, đơn lẻ. "Làm cho ánh sáng ấm hơn." "Xóa cái cây ở nền." Các bước nhỏ cộng lại thành kết quả chính xác.

Ví Dụ Prompt Thực Tế

Hãy để tôi chỉ cho bạn cách khung này chuyển thành các prompt thực tế trong các trường hợp sử dụng khác nhau:

Chân Dung Chân Thực Như Ảnh Chụp
Một bức chân dung cận cảnh chân thực như ảnh chụp của một thợ gốm Nhật Bản lớn tuổi
đang kiểm tra một bát trà. Ánh sáng giờ vàng tràn qua cửa sổ,
tạo ra những điểm nổi bật ấm áp trên đôi bàn tay phong hóa. Chụp bằng Canon 5D Mark IV
với ống kính 85mm ở f/2.8. Độ sâu trường ảnh nông với nền bokeh.
Phân loại màu tự nhiên, kết cấu da và lỗ chân lông có thể nhìn thấy. Định dạng 16:9.
Thiết Kế Nhãn Dán Kawaii
Một nhãn dán phong cách kawaii của một con gấu trúc đỏ đội mũ tre.
Đường viền màu đen dày, phong cách cel-shading, bảng màu pastel
với hồng và xanh lá cây mềm mại. Biểu cảm dễ thương với đôi mắt sáng bóng.
Nền trắng để dễ dàng cắt ra. Thiết kế đơn giản, sạch sẽ phù hợp
để in hàng hóa.
Poster Phim Với Văn Bản Cách Điệu
Poster nghệ thuật cho một bí ẩn phim noir. Hình ảnh trung tâm cho thấy
một hình bóng thám tử chống lại những cửa sổ mưa.
Tiêu đề chính bằng kiểu chữ Art Deco đậm \"SHADOWS OF DOUBT\",
với phụ đề serif thanh lịch, mỏng \"Some secrets should stay buried\" bên dưới.
Văn bản tín dụng sản xuất nhỏ ở dưới cùng cho tính xác thực.
Tất cả văn bản phải sạch sẽ và dễ đọc. Chất lượng điện ảnh, bầu không khí tâm trạng.
Ánh sáng độ tương phản cao với bóng sâu và điểm nổi bật ấn tượng.
💡

Sự khác biệt chính với việc prompt Nano Banana Pro: mô tả những gì bạn muốn thấy, không phải cách bạn muốn cảm nhận. "Một hình ảnh tuyệt đẹp tuyệt vời đáng kinh ngạc" không nói gì với AI. "Ánh sáng ngược giờ vàng tạo ra những bóng dài trên những con đường lát đá cuội" cho nó biết chính xác những gì cần hiển thị.

Tô Màu Manga và Phép Thuật Dịch Thuật

Kỹ thuật này là khám phá đầu tiên của tôi đã làm tôi choáng ngợp với Nano Banana Pro, và nó vẫn là một trong những khả năng ấn tượng nhất mà tôi từng thấy. Khả năng lấy một trang manga đen trắng, tô màu nó và dịch văn bản — tất cả chỉ với một prompt duy nhất — thay đổi cơ bản quy trình làm việc cho người hâm mộ manga, nhà xuất bản và người sáng tạo nội dung.

Đây là cách tôi phát hiện ra nó. Tôi luôn gặp khó khăn khi đọc manga đen trắng. Có điều gì đó về thông tin hình ảnh dày đặc mà không có tín hiệu màu sắc khiến tôi khó theo dõi hành động. Tôi đã thử nhiều công cụ tô màu khác nhau, nhưng tất cả đều yêu cầu công việc thủ công đáng kể và không thể xử lý văn bản.

Đêm đầu tiên với Nano Banana Pro, tôi đã tải lên một trang từ Demon Slayer và gõ một prompt đơn giản: "Làm cho hình ảnh này có màu, dịch sang tiếng Anh và đặt văn bản vào bong bóng thoại tương ứng, giữ mọi thứ khác giống nhau, và sau đó đưa cho tôi hình ảnh."

Những gì trả lại thật đáng kinh ngạc. Màu sắc sống động và đúng nhân vật — mẫu kẻ sọc xanh lá cây của Tanjiro được hiển thị hoàn hảo. Văn bản tiếng Nhật trong bong bóng thoại đã được thay thế bằng các bản dịch tiếng Anh chính xác. Nghệ thuật đường nét được bảo tồn. Nó trông giống như một bản phát hành màu chính thức.

Prompt Tô Màu Manga + Dịch Thuật
Biến đổi bảng manga đen trắng này:
1. Tô màu với màu sắc rực rỡ, phù hợp với anime
2. Dịch tất cả văn bản tiếng Nhật sang tiếng Anh
3. Đặt văn bản dịch vào đúng bong bóng thoại
4. Giữ nguyên tất cả biểu cảm nhân vật và bố cục gốc
5. Trả lại dưới dạng hình ảnh hoàn chỉnh, sẵn sàng để in

Kỹ Thuật Manga Nâng Cao

Nhưng phép thuật thực sự là bạn có thể đi xa hơn. Xa hơn nhiều. Bạn có thể biến đổi cùng một trang manga thành các phong cách hoàn toàn khác nhau:

Prompt Biến Đổi Phong Cách
// Phong Cách Thú Bông 3D
Biến đổi manga này thành phong cách kết cấu thú bông 3D/lông xù.
Giữ các nhân vật dễ nhận biết nhưng hiển thị chúng như thể chúng
là đồ chơi thú bông mềm mại. Giữ nguyên bong bóng thoại và văn bản.

// Phong Cách Mosaic Trung Cổ
Biến đổi manga này thành phong cách mosaic đá trung cổ,
giống như các tác phẩm nghệ thuật tôn giáo từ các nhà thờ cổ. Hãy cho nó một cảm giác
thiêng liêng, tôn kính trong khi vẫn giữ các bảng câu chuyện.

// Phong Cách Phù Điêu Đồng
Biến trang manga này thành phong cách phù điêu đồng điêu khắc.
Hiển thị các nhân vật và cảnh như thể chúng được nâng lên trong
kim loại đồng cũ, với lớp gỉ và ánh sáng phù hợp.

Tôi đã dành hàng giờ đêm đầu tiên đó để tạo ra cùng một cảnh manga theo hàng chục phong cách — khắc gỗ, màu nước, pixel art, hoạt hình đất sét. Mỗi sự biến đổi vẫn giữ cấu trúc câu chuyện trong khi hình dung lại hoàn toàn cách tiếp cận hình ảnh. Điều này mở ra các khả năng cho nghệ thuật của người hâm mộ, tài liệu giáo dục và các dự án sáng tạo mà trước đây đơn giản là không thể đạt được.

💡

Mẹo chuyên nghiệp để tô màu manga: Nano Banana Pro hiểu các quy ước nhân vật anime. Bạn không cần phải chỉ định màu tóc cho các nhân vật nổi tiếng — nó biết Tanjiro có tóc đen với ngọn màu đỏ tía và haori kẻ sọc xanh lá cây. Kiến thức tích hợp này làm cho việc tô màu nhanh hơn và chính xác hơn.

Thiết Kế Poster và Hình Ảnh Chuyên Nghiệp

Thiết kế poster là nơi tôi thực sự bắt đầu hiểu sức mạnh của khả năng hiển thị văn bản của Nano Banana Pro. Các mô hình AI trước đây có thể tạo ra những hình ảnh đẹp, nhưng ngay khi bạn cần văn bản — tiêu đề, tín dụng, khẩu hiệu — bạn đã quay lại làm việc thủ công trong Photoshop. Nano Banana Pro thay đổi hoàn toàn phương trình đó.

Hãy để tôi hướng dẫn bạn qua một số ví dụ cụ thể cho thấy những gì có thể làm được bây giờ:

Poster Phim Điện Ảnh

Poster Phim Hoạt Hình Retro
Tạo một poster phim cho 'Robot Dreams' theo phong cách hoạt hình retro giữa thế kỷ.

Cảnh: Chó nhân hình và robot hình hộp màu xanh xám đi tay trong tay trên
bãi biển cát lúc hoàng hôn, nhìn về phía bến tàu công viên giải trí đổ nát với vòng
đu quay và tàu lượn siêu tốc. Bầu trời cam đậm.

Phong cách: Minh họa phẳng, đường viền dày, bảng màu retro ấm áp.

Kiểu chữ: Tiêu đề \"ROBOT DREAMS\" bằng chữ in đậm khổng lồ ở giữa trên cùng, màu cam
đậm. Logo lễ hội nhỏ ở trên cùng. Các trích dẫn đánh giá màu trắng rải rác xung quanh các
nhân vật.

Tâm trạng: Hoài cổ, u sầu, cảm động.

Kết quả trông không thể phân biệt được với các poster phim cổ điển thực sự. Văn bản sạch sẽ và giãn cách chính xác. Phong cách minh họa nhất quán xuyên suốt. Ngay cả các chi tiết nhỏ như vòng nguyệt quế lễ hội và trích dẫn đánh giá cũng được hiển thị chính xác.

Poster Nặng Về Kiểu Chữ

Đây là nơi mọi thứ trở nên thực sự ấn tượng. Kiểu chữ phức tạp với nhiều phông chữ, kích cỡ và kiểu dáng mà các mô hình AI trước đây đơn giản là không thể hiểu được:

Poster Phim Cổ Điển
Poster nghệ thuật cho bộ phim \"Dead Poets Society\".
Phong cách nghệ thuật cổ điển với một cảnh mô tả khoảnh khắc mang tính biểu tượng
đứng trên bàn. Tiêu đề chính bằng thư pháp viết tay nghệ thuật
trôi chảy với các nét thanh lịch, mỏng.
Phụ đề tiếng Anh \"Carpe Diem\" bên dưới bằng chữ không chân tinh tế.
Khẩu hiệu \"Seize the day\" như một yếu tố văn bản nhỏ.
Văn bản tín dụng sản xuất nhỏ bổ sung ở dưới cùng cho tính xác thực.
Tất cả văn bản phải sạch sẽ và dễ đọc. Chất lượng cao cấp, bầu không khí
điện ảnh truyền tải sự kính sợ và cảm hứng.

Poster được tạo ra từ prompt này có thể dễ dàng được coi là công việc studio chuyên nghiệp. Thư pháp có sự thay đổi trọng lượng nét phù hợp. Bố cục tuân theo các nguyên tắc thiết kế cổ điển. Người xem sẽ không bao giờ đoán được nó được tạo ra bởi AI.

Thiết Kế Hình Ảnh Cyberpunk

Đối với các thiết kế phức tạp với nhiều văn bản, Nano Banana Pro xử lý thách thức cực kỳ tốt:

Thiết Kế Cyberpunk Nặng Về Văn Bản
Poster hình ảnh chính cyberpunk với các yếu tố văn bản dày đặc.
Môi trường đô thị được chiếu sáng bằng đèn neon với màn hình ba chiều hiển thị
nhiều văn bản và dữ liệu khác nhau. Chủ đề chính: một nhân vật điều khiển học
với các bộ phận cấy ghép phát sáng. Nhiều bảng văn bản trôi nổi với thông số
kỹ thuật và nhãn cảnh báo.

Phong cách: độ tương phản cao, màu neon trên nền tối.
Bao gồm cả văn bản hiển thị lớn và văn bản chi tiết nhỏ.
Tất cả các ký tự phải được hình thành chính xác và dễ đọc.
Định dạng điện ảnh 16:9.
💡

Mẹo thiết kế: Khi làm việc với các poster có nhiều văn bản, hãy luôn chỉ định "tất cả văn bản phải sạch sẽ và dễ đọc" ở đâu đó trong prompt của bạn. Điều này dường như kích hoạt các kiểm tra chất lượng bổ sung trong mô hình giúp cải thiện độ chính xác của việc hiển thị văn bản.

Trực Quan Hóa Kiến Thức và Sơ Đồ

Bởi vì Nano Banana Pro được xây dựng dựa trên khả năng suy luận của Gemini 2.0, nó có thể tạo ra các sơ đồ giáo dục và trực quan hóa kiến thức thực sự có ý nghĩa. Đây không chỉ là về việc hiển thị hình ảnh đẹp — đó là về việc đại diện cho thông tin phức tạp một cách chính xác.

Tôi đã thử nghiệm nó bằng cách yêu cầu nó tạo ra một sơ đồ cấu trúc của các tòa nhà lịch sử nổi tiếng. Không cần cung cấp hình ảnh tham khảo, tôi chỉ cần hỏi:

Sơ Đồ Kiến Thức Kiến Trúc
Tạo một sơ đồ cấu trúc chi tiết của một nhà thờ kiểu gothic
với văn bản giải thích toàn diện. Hiển thị hệ thống trụ bay,
bố cục gian giữa và cánh ngang, và độ cao nhiều tầng.
Bao gồm các chú thích chi tiết giải thích các kỹ thuật xây dựng
đã cho phép các cấu trúc thời trung cổ này tồn tại qua nhiều thế kỷ.
Tất cả văn bản phải sạch sẽ và dễ đọc.

Kết quả thật đáng kinh ngạc. Sơ đồ cho thấy chính xác những điều kỳ diệu của kỹ thuật kết cấu kiến trúc gothic. Tỷ lệ phù hợp với các tòa nhà thực tế. Và các chú thích cung cấp thông tin lịch sử và kỹ thuật chính xác. Đây là khả năng suy luận đang hoạt động — mô hình thực sự biết về lịch sử kiến trúc và có thể đại diện cho kiến thức đó một cách trực quan.

Tài Liệu Hóa Thủ Công Truyền Thống

Một ứng dụng mạnh mẽ khác là ghi lại các nghề thủ công và kỹ thuật truyền thống:

Infographic Thủ Công Truyền Thống
Tạo một hướng dẫn trực quan chi tiết cho các kỹ thuật thêu sashiko truyền thống của Nhật Bản.
Hiển thị các mẫu khâu khác nhau với
ví dụ cận cảnh. Bao gồm bảng màu chàm và trắng truyền thống.
Minh họa các góc kim và độ căng chỉ để đạt được các hiệu ứng
khác nhau. Thêm văn bản giải thích toàn diện bao gồm lịch sử và
các biến thể khu vực của nghề thủ công này. Phong cách infographic giáo dục
với bố cục sạch sẽ.

Sơ Đồ Khái Niệm Kỹ Thuật

Đối với khoa học viễn tưởng và công việc khái niệm, Nano Banana Pro có thể tạo ra tài liệu kỹ thuật ấn tượng:

Sơ Đồ Khái Niệm Kỹ Thuật
Sơ đồ kỹ thuật chi tiết dạng bung ra của mắt giả cyberpunk.
Hiển thị tất cả các thành phần bên trong: cảm biến quang học, kết nối giao diện thần kinh,
nguồn điện, đơn vị xử lý, cơ chế điều chỉnh.
Dán nhãn từng thành phần với thông số kỹ thuật. Bao gồm chế độ xem mặt cắt ngang
hiển thị cách nó kết nối với dây thần kinh thị giác. Hiển thị
chân thực như ảnh chụp với chú thích bản vẽ kỹ thuật. Thiết kế tương lai nhưng
hợp lý về mặt khoa học.

Mức độ chi tiết trong các sơ đồ kỹ thuật này cạnh tranh với những gì một nghệ sĩ ý tưởng chuyên nghiệp sẽ tạo ra, nhưng được tạo ra trong vài giây. Đối với các nhà thiết kế trò chơi, nhà văn khoa học viễn tưởng và nghệ sĩ ý tưởng, đây là một công cụ tạo mẫu nhanh đáng kinh ngạc.

Khả Năng Giải Toán Đáng Kinh Ngạc

Điều này thực sự làm tôi sốc. Nano Banana Pro không chỉ tạo ra hình ảnh — nó có thể giải quyết các vấn đề toán học và hiển thị quá trình giải quyết dưới dạng một trang tính viết tay. Công cụ suy luận đằng sau việc tạo hình ảnh thực sự hoạt động thông qua logic toán học.

Tôi đã thử nghiệm nó với một vấn đề hình học liên quan đến tam giác và tính toán góc. Tôi đã tải lên ảnh chụp màn hình của vấn đề và đưa ra prompt:

Prompt Giải Quyết Vấn Đề Toán Học
Soạn thảo một tờ giấy nháp hiển thị giải pháp hoàn chỉnh
cho vấn đề toán học này. Hiển thị tất cả công việc bao gồm sơ đồ,
phương trình và tính toán từng bước. Làm cho nó trông
giống như chữ viết tay xác thực của học sinh với các biến thể tự nhiên.
Bao gồm các bản phác thảo hình học nếu có liên quan.

Những gì trả lại là một trang toán viết tay thực tế, hoàn chỉnh với:

  • Sơ đồ hình học với các góc và cạnh được dán nhãn
  • Thao tác đại số từng bước
  • Các định lý và công thức được áp dụng chính xác
  • Một câu trả lời cuối cùng được khoanh tròn
  • Những điểm không hoàn hảo tự nhiên của chữ viết làm cho nó trông thật

Và đây là điều quan trọng — toán học thực sự đúng. Mô hình không chỉ tạo ra một cái gì đó trông giống như một giải pháp; nó đã làm việc thông qua suy luận toán học thực tế và đi đến câu trả lời đúng. Đối với những người tạo nội dung giáo dục, dịch vụ dạy kèm hoặc bất kỳ ai cần hiển thị công việc toán học, điều này thật đáng chú ý.

Cảnh Báo Quan Trọng

Mặc dù Nano Banana Pro làm đúng toán học hầu hết thời gian, bạn nên luôn xác minh các giải pháp cho bất cứ điều gì quan trọng. Suy luận rất ấn tượng nhưng không phải là không thể sai lầm. Tôi đã thấy các lỗi thỉnh thoảng trong các vấn đề nhiều bước phức tạp.

Chuyển Đổi Từ Giấy Sang Bảng Trắng

Một trong những ứng dụng thực tế nhất mà tôi tìm thấy là chuyển đổi nội dung dạng dài — tài liệu nghiên cứu, bài báo, tài liệu kỹ thuật — thành các bản tóm tắt trực quan trên bảng trắng. Kỹ thuật này đã được các nhà nghiên cứu nhấn mạnh trên X (trước đây là Twitter) và đã trở thành một trong những quy trình làm việc yêu thích của tôi.

Cách tiếp cận cơ bản rất đơn giản: cung cấp tài liệu văn bản (dưới dạng PDF đã tải lên, văn bản dán hoặc qua ảnh chụp màn hình) và yêu cầu tóm tắt trực quan theo phong cách bảng trắng:

Prompt Giấy Sang Bảng Trắng
Biến bài nghiên cứu/bài báo này thành một bức ảnh bảng trắng chi tiết
hiển thị các khái niệm chính, mối quan hệ và phát hiện.
Sử dụng phong cách viết tay tự nhiên với:
- Hộp và thùng chứa cho các khái niệm chính
- Mũi tên hiển thị mối quan hệ và luồng
- Dấu đầu dòng cho các chi tiết chính
- Sơ đồ đơn giản nếu hữu ích
- Mã màu cho các chủ đề khác nhau

Làm cho nó trông giống như một bảng trắng thực sự được chụp ảnh
với ánh sáng và phối cảnh thực tế. Bao gồm tất cả thông tin quan trọng
trong một bố cục phân cấp, dễ đọc.

Tôi đã thử nó với một bài báo kỹ thuật dài về kiến trúc LLaMA 3. Nano Banana Pro đã tạo ra một bản tóm tắt bảng trắng nắm bắt được những đổi mới chính, quyết định kiến trúc, cách tiếp cận đào tạo và kết quả điểm chuẩn — tất cả ở định dạng có thể hiểu được trong nháy mắt.

Các ứng dụng rất lớn:

  • Sinh viên: Chuyển đổi ghi chú bài giảng hoặc các chương sách giáo khoa thành công cụ hỗ trợ học tập trực quan
  • Nhà nghiên cứu: Tạo tóm tắt trực quan nhanh về các bài báo để trình bày
  • Giáo viên: Tạo giải thích theo phong cách bảng mà không cần viết thực sự lên bảng
  • Người tạo nội dung: Chuyển đổi nội dung viết thành các định dạng trực quan hấp dẫn

Như một nhà nghiên cứu đã lưu ý, khả năng này về cơ bản có thể thay thế nhu cầu giáo viên viết giải thích thủ công lên bảng trắng — mặc dù tôi sẽ tranh luận rằng nó được sử dụng tốt nhất như một sự bổ sung thay vì thay thế.

Tạo Giao Diện Trò Chơi

Nano Banana Pro rõ ràng đã được đào tạo trên một kho dữ liệu khổng lồ về cảnh quay trò chơi và ảnh chụp màn hình, bởi vì khả năng tạo ra các giao diện trò chơi thuyết phục của nó là đáng chú ý. Điều này vượt xa các mockup đơn giản — nó hiểu các quy ước UI trò chơi, các yếu tố cụ thể của thể loại và thậm chí cả các biến thể khu vực trong thiết kế trò chơi.

Trò Chơi Khám Phá Biển Sâu

Giao Diện Trò Chơi Indie
Tạo ảnh chụp màn hình từ trò chơi khám phá biển sâu tương tự như Dave the Diver.

Cảnh: Thợ lặn gặp phải một sinh vật khổng lồ chưa biết dưới vực thẳm.

Các yếu tố UI:
- Đồng hồ độ sâu hiển thị 850m
- Đồng hồ oxy ở mức 40%
- Khe kho đồ ở dưới cùng bên trái
- Bản đồ nhỏ ở góc trên bên phải
- Cảnh báo \"CẢNH BÁO: Phát hiện dạng sống chưa biết\"

Phong cách: Pixel art với hiệu ứng ánh sáng hiện đại, sương mù khí quyển, sinh vật phát quang sinh học.

Ảnh Chụp Màn Hình Trò Chơi FPS

Giao Diện Phong Cách Call of Duty
Tạo ảnh chụp màn hình từ game bắn súng góc nhìn thứ nhất theo phong cách Call of Duty,
nhưng kẻ thù là một con chó Shiba Inu (meme Cheems). Giao diện FPS đầy đủ
với tâm ngắm, bộ đếm đạn, bản đồ nhỏ, thanh máu và các chỉ số
killstreak. Cheems nên đeo thiết bị chiến thuật. Phong cách đồ họa
chân thực như ảnh chụp với ánh sáng điện ảnh. Bao gồm các điểm đánh dấu trúng đích và
làm mờ chuyển động nhẹ cho cảm giác hành động.

Sự kết hợp giữa cơ chế trò chơi nghiêm túc với sự hài hước vô lý này tạo ra những kết quả vui nhộn trông hoàn toàn xác thực. Các yếu tố UI được đặt hoàn hảo và có kiểu dáng phù hợp với thể loại.

Giao Diện Trò Chơi MOBA

Nơi mọi thứ trở nên thực sự thú vị là sự hiểu biết của Nano Banana Pro về văn hóa trò chơi cụ thể. Khi được yêu cầu tạo giao diện League of Legends hoặc MOBA tương tự hiển thị người chơi tương tác trong cuộc trò chuyện, nó tạo ra cuộc đối thoại phù hợp với bối cảnh:

Giao Diện Trò Chuyện MOBA
Tạo ảnh chụp màn hình trong trò chơi League of Legends hiển thị một cuộc
giao tranh đồng đội dữ dội đang diễn ra. Trong khu vực trò chuyện (dưới cùng bên trái), hiển thị người chơi
có một cuộc tranh luận nảy lửa về chiến lược trò chơi. Bao gồm các yếu tố UI MOBA điển hình:
thanh kỹ năng, bản đồ nhỏ, bảng điểm, khe vật phẩm. Cuộc trò chuyện nên
trông giống như hành vi xác thực của người chơi trong một trận đấu cạnh tranh.

Mô hình hiểu bối cảnh văn hóa của các cộng đồng trò chơi khác nhau và đại diện cho chúng một cách chính xác — đôi khi là một cách đau đớn. Đối với các nhà thiết kế trò chơi, người tạo nội dung và bất kỳ ai trong không gian trò chơi, đây là một khả năng vô cùng hữu ích.

Kết Xuất Sản Phẩm và Nhiếp Ảnh

Nhiếp ảnh sản phẩm là nơi sự kết hợp giữa kết xuất văn bản, kiểm soát ánh sáng và trí thông minh bố cục của Nano Banana Pro thực sự tỏa sáng. Khả năng đặt sản phẩm trong bất kỳ môi trường nào trong khi vẫn duy trì tính nhất quán của thương hiệu mở ra các quy trình làm việc sẽ tốn kém hoặc không thể thực hiện được với nhiếp ảnh truyền thống.

Ví Dụ Bìa Album

Hãy để tôi hướng dẫn bạn qua một ví dụ chi tiết cho thấy khả năng đầy đủ. Tôi bắt đầu với một ý tưởng đơn giản: một bìa album hư cấu. Đầu tiên, tôi tạo ra CD và vỏ:

Tạo Sản Phẩm Ban Đầu
Tạo ảnh chụp sản phẩm album CD. Tiêu đề album
\"MIDNIGHT ECHOES\" bằng kiểu chữ hiện đại cách điệu. Bìa album hiển thị
hình tượng siêu thực, mộng mơ kết hợp các yếu tố mạng và hữu cơ.
Bao gồm cả CD và vỏ jewel. Ánh sáng studio,
nền trắng sạch sẽ, phong cách nhiếp ảnh sản phẩm.

Đây là nơi mọi thứ trở nên thú vị. Với sản phẩm này được thiết lập, tôi có thể đặt nó trong bất kỳ môi trường nào trong khi vẫn duy trì sự nhất quán hoàn hảo:

Biến Thể Đặt Môi Trường
// Cửa Hàng Đĩa Nhạc Thập Niên 90
Đặt sản phẩm CD này trên kệ gỗ trong một cửa hàng đĩa nhạc
thập niên 1990. Được bao quanh bởi đĩa than và băng cassette cũ. Ánh sáng
vonfram ấm áp, phản chiếu của biển hiệu neon ở nền,
các hạt bụi lơ lửng trong không khí. Bầu không khí hoài cổ.

// Bay Lơ Lửng Siêu Thực
CD lơ lửng trong không khí được bao quanh bởi các mảnh thủy tinh vỡ
và bánh răng đồng hồ lơ lửng. Khái niệm: \"giấc mơ\" và
\"du hành thời gian\". Ánh sáng điện ảnh, bố cục ấn tượng.

// Cảnh Máy Nghe Nhạc CD
CD đang được đưa vào máy nghe nhạc CD cầm tay. Vỏ CD
đứng gần đó. Ánh sáng mặt trời chiều muộn xuyên qua rèm cửa.
Bề mặt bàn gỗ. Tâm trạng ấm áp, trầm ngâm.

// Cảnh Buổi Hòa Nhạc
Đặt sản phẩm này trong bối cảnh buổi hòa nhạc sân vận động.
Năng lượng đám đông, ánh sáng sân khấu, màn hình lớn ở nền.
CD trông lớn đến mức không thể, giống như một đạo cụ sân khấu.

Trong mỗi môi trường, văn bản trên CD vẫn sắc nét và dễ đọc. Sản phẩm vẫn giữ được bản sắc hình ảnh của nó trong khi thích nghi tự nhiên với từng tình huống ánh sáng và bối cảnh mới. Đối với thương mại điện tử, các chiến dịch tiếp thị hoặc trực quan hóa thương hiệu, điều này mang tính cách mạng.

Ảnh Chụp Sản Phẩm Kỹ Thuật

Đối với nhiếp ảnh sản phẩm kỹ thuật hơn, Nano Banana Pro xử lý các chi tiết quan trọng:

Nhiếp Ảnh Sản Phẩm Thương Mại Điện Tử
iPhone 17 Pro, Cosmic Orange, góc sau 45 độ nhấn mạnh thiết kế mặt sau
và mô-đun máy ảnh.

Nền: Mẫu trừu tượng thẩm mỹ công nghệ chuyển màu mềm mại với chuyển động
trôi chảy tự nhiên và sự rung cảm nghệ thuật hiện đại. Tránh màu đen tuyền. Nhấn mạnh sự tương tác ánh sáng-bóng tối
và chuyển đổi màu sắc tinh tế.

Các yếu tố văn bản trôi nổi xung quanh thiết bị: \"A19 Pro Chip\", \"8x Optical Zoom\",
\"48MP Rear Camera\" — bố cục trôi nổi hiện đại, hộp văn bản trong suốt, thẩm mỹ
sạch sẽ và công nghệ tiên tiến.

Tổng thể: Năng động, tương lai, chất lượng nhiếp ảnh sản phẩm chuyên nghiệp.

Khám Phá Hạt Perler

Đây hoàn toàn là một sự tình cờ. Tôi đang thử nghiệm với các phong cách thủ công khác nhau thì tình cờ phát hiện ra khả năng đáng chú ý của Nano Banana Pro trong việc tạo ra nghệ thuật hạt perler (còn được gọi là hạt cầu chì hoặc hạt hama). Kết quả rất nhất quán và đáng yêu đến mức nó đã trở thành một trong những phong cách thẩm mỹ yêu thích của tôi.

Nhân Vật Hạt Perler
Nghệ thuật hạt perler 3D: một hộp trưng bày chứa một nhân vật tinh xảo.

Phong cách: Kết xuất chân thực như ảnh chụp hiển thị kết cấu hạt riêng lẻ, lớp hoàn thiện
bóng bẩy, ánh sáng nhiếp ảnh sản phẩm chuyên nghiệp.

Bao gồm: Mẫu lưới hạt có thể nhìn thấy, bóng tinh tế giữa các hạt, sự không hoàn hảo
nhẹ cho tính xác thực.

Mô hình hiểu rằng hạt perler có các đặc điểm cụ thể — hình trụ, khoảng cách nhỏ giữa các hạt, cách chúng hợp nhất tại các điểm kết nối. Nó hiển thị những chi tiết này một cách chính xác trong khi vẫn giữ được tính thẩm mỹ dễ thương làm cho phong cách thủ công này trở nên hấp dẫn.

Các biến thể hoạt động đẹp mắt:

  • Chó hạt perler: Các giống chó khác nhau được thể hiện trong thẩm mỹ pixel-art-gặp-thủ-công
  • Mèo hạt perler với biểu đồ màu: Hiển thị nhân vật bên cạnh màu hạt được sử dụng
  • Mô hình hạt perler: Toàn bộ cảnh được xây dựng từ thẩm mỹ hạt cầu chì
  • Móc khóa hạt perler: Các thiết kế nhỏ hơn phù hợp cho mockup hàng hóa

Đối với các nhà thiết kế mẫu thủ công, người tạo hàng hóa hoặc bất kỳ ai yêu thích thẩm mỹ đáng yêu này, Nano Banana Pro là một mỏ vàng.

Tạo Giao Diện Mạng Xã Hội

Khả năng này vừa ấn tượng vừa đòi hỏi việc sử dụng có trách nhiệm. Nano Banana Pro có thể tạo ra các bản tái tạo chính xác đến từng pixel của các giao diện mạng xã hội — iMessage, Instagram, Twitter và hơn thế nữa. Các ứng dụng từ hợp pháp (tạo nội dung, giáo dục, mockup) đến có khả năng gây vấn đề (trò chuyện giả mạo), vì vậy hãy sử dụng nó một cách có trách nhiệm.

Giao Diện Trò Chuyện iMessage
Tạo ảnh chụp màn hình giao diện trò chuyện iMessage tuân theo thiết kế
và bố cục iOS chính xác. Cuộc trò chuyện được dán nhãn \"Sếp\"
ở trên cùng:

1. Sếp: \"Tại sao bạn luôn trông buồn ngủ khi đến làm việc?\"
2. Nhân viên: \"Nếu tôi hoàn toàn tỉnh táo trước khi đến làm việc, tôi sẽ đến muộn\"
3. Sếp: \"Tại sao bạn luôn rời đi đúng giờ đóng cửa?\"
4. Nhân viên: \"Rời đi trước giờ đóng cửa sẽ là về sớm\"
5. Sếp: \"Bạn lại đến muộn!\"
6. Nhân viên: \"Ngay cả công lý cũng có thể đến muộn. Tại sao tôi lại không?\"

Phong cách iOS chính xác với bong bóng tin nhắn, dấu thời gian,
và các yếu tố giao diện chính xác.

Mức độ chính xác của giao diện người dùng là đáng chú ý — kiểu bong bóng tin nhắn, vị trí hình đại diện, định dạng dấu thời gian, ngay cả các gradient và bóng tinh tế phân biệt các nền tảng với nhau.

Lời Nhắc Về Đạo Đức

Ảnh chụp màn hình trò chuyện giả mạo có thể được sử dụng để đưa thông tin sai lệch hoặc lừa đảo. Chỉ sử dụng khả năng này cho nội dung hư cấu hoặc giáo dục rõ ràng. Không bao giờ tạo các cuộc trò chuyện giả mạo có thể bị nhầm là thật hoặc được sử dụng để đánh lừa người khác.

Poster Quảng Bá Thành Phố

Kiến thức thế giới của Nano Banana Pro mở rộng đến địa lý và các địa danh. Nó biết các tòa nhà mang tính biểu tượng của các thành phố lớn và có thể sắp xếp chúng thành tài liệu quảng cáo gắn kết. Điều này đặc biệt ấn tượng đối với các thành phố có di sản kiến trúc phức tạp.

Poster Du Lịch Thành Phố
Tạo một poster quảng bá cho Thành phố New York. Nền có
các địa danh mang tính biểu tượng: Tòa nhà Empire State, Tượng Nữ thần Tự do, Cầu Brooklyn,
One World Trade Center, Quảng trường Thời đại. Các địa danh nên có
hệ thống phân cấp hình ảnh với điểm nhấn chính và phụ rõ ràng.
Phong cách minh họa đường nét sạch sẽ với bảng màu táo bạo.

Kiểu chữ lớn ở trung tâm: \"NEW YORK\" với văn bản nhỏ hơn \"The City
That Never Sleeps\" gần đó. Khẩu hiệu bên dưới: \"Where Dreams Take Flight\".
Bao gồm các yếu tố hiện đại như taxi màu vàng và lối vào tàu điện ngầm để
hiển thị NYC đương đại.

Bố cục sạch sẽ, trôi chảy với sự sắp xếp yếu tố tự nhiên.
Nhấn mạnh sự pha trộn giữa các địa danh lịch sử và năng lượng hiện đại.
Bầu không khí năng động, đô thị.

Mô hình nhận ra và hiển thị chính xác các đặc điểm riêng biệt của từng địa danh — chóp Art Deco của Tòa nhà Empire State, lớp gỉ đồng của Tượng Nữ thần Tự do, các tháp gothic của Cầu Brooklyn. Nó cũng hiểu ngôn ngữ hình ảnh của tiếp thị du lịch và áp dụng phong cách phù hợp.

Bảng Phân Cảnh Truyện Tranh và Nghệ Thuật Tuần Tự

Đối với những người sáng tạo làm việc trên truyện tranh, manga hoặc bảng phân cảnh, khả năng của Nano Banana Pro trong việc tạo ra các chuỗi nhiều bảng là một sự tiết kiệm thời gian rất lớn. Nó hiểu dòng chảy tường thuật, bố cục bảng và cách hình dung các nhịp cảm xúc.

Bảng Phân Cảnh Truyện Tranh Hành Động
Tạo một chuỗi manga 5 bảng mô tả một trận chiến hoành tráng:

Bảng 1: Anh hùng đứng trên đỉnh núi. Kẻ ác xuất hiện từ bóng tối.
Bầu không khí căng thẳng.

Bảng 2: Mắt họ gặp nhau. Trận chiến sắp xảy ra. Bố cục màn hình chia nhỏ cận cảnh.

Bảng 3: Chiến đấu dữ dội. Tia chớp lóe lên. Anh hùng tấn công bằng vũ khí
phát sáng, Kẻ ác đỡ đòn bằng năng lượng tối.

Bảng 4: Đụng độ trên không. Sóng năng lượng bùng nổ ra ngoài. Tư thế hành động năng động.

Bảng 5: Cả hai chiến binh đối mặt với nhau. Mắt Anh hùng thể hiện sự quyết tâm,
Kẻ ác thể hiện cảm xúc phức tạp.

Phong cách: Phong cách hành động manga Shonen. Độ tương phản cao. Đường tốc độ. Bóng ấn tượng.

Mô hình hiểu từ vựng hình ảnh của manga — đường tốc độ, khung tác động, cận cảnh cảm xúc, góc năng động. Nó duy trì tính nhất quán của nhân vật qua các bảng và tạo ra dòng chảy tường thuật chân thực thay vì năm hình ảnh không liên quan.

Tôi đã thử nghiệm nó với nhiều kịch bản khác nhau:

  • Cảnh chia tay đầy cảm xúc — giọng điệu u sầu, sâu sắc
  • Khoảnh khắc gắn kết thầy trò — trầm ngâm, phức tạp
  • Nhân vật gốc trong các kịch bản đời thường
  • Chuỗi hành động theo phong cách không phải anime

Hạn chế chính mà tôi nhận thấy: đôi khi bảng 1 và 2 hoặc 4 và 5 có thể quá giống nhau nếu prompt không chỉ định đủ sự khác biệt. Thêm các yếu tố hình ảnh hoặc góc máy ảnh riêng biệt vào mỗi mô tả bảng giúp ngăn chặn điều này.

Chất Lượng 4K và Làm Việc Chi Tiết

Khả năng đầu ra 4K gốc của Nano Banana Pro không chỉ là về số độ phân giải — đó là về mức độ chi tiết được thực hiện. Đối với nhiếp ảnh cận cảnh, ảnh chụp sản phẩm và bất kỳ ứng dụng nào mà chi tiết nhỏ quan trọng, điều này thay đổi những gì có thể đạt được.

Chi Tiết Nhiếp Ảnh Macro
Tạo một bức ảnh macro 4K cực kỳ chi tiết của một con bướm
Monarch đang nghỉ ngơi trên một bông hoa màu vàng. Tập trung chính xác vào
vảy cánh và kết cấu, hiển thị các vảy riêng lẻ
tạo nên mẫu. Chụp kết cấu cánh hoa ở mức độ chi tiết tương đương.

Ánh sáng khuếch tán mềm mại, độ sâu trường ảnh nông với bokeh
nền kem. Bảng màu tự nhiên với chút ấm áp nhẹ.
Độ chính xác khoa học trong giải phẫu bướm. Loại ảnh chụp mà
sẽ giành chiến thắng trong cuộc thi nhiếp ảnh thiên nhiên.

Khi bạn phóng to hình ảnh kết quả, bạn có thể thấy các vảy cánh riêng lẻ, hạt phấn hoa và cấu trúc tế bào của cánh hoa. Mức độ chi tiết này trước đây chỉ có thể đạt được với thiết bị nhiếp ảnh macro chuyên dụng và hậu kỳ đáng kể.

Khi Nào Sử Dụng 4K

Chất Lượng Tiêu Chuẩn

Tạo nhanh (3-5 giây) với chất lượng tuyệt vời cho hầu hết các trường hợp sử dụng:

  • Khám phá ý tưởng và động não
  • Nội dung mạng xã hội
  • Bản nháp ban đầu trước khi tinh chỉnh cuối cùng
  • Nhu cầu tạo khối lượng lớn
  • Bố cục đơn giản không có văn bản nhỏ

Chất Lượng Cao / 4K

Thời gian tạo kéo dài (8-15 giây) cho độ trung thực tối đa:

  • Hình ảnh sản xuất cuối cùng
  • Văn bản dày đặc và công việc kiểu chữ
  • Đồ họa thông tin phức tạp với các chi tiết nhỏ
  • Chân dung chân thực như ảnh chụp
  • Tài liệu sẵn sàng in

Để động não và lặp lại, hãy giữ ở độ phân giải mặc định để duy trì các vòng lặp phản hồi nhanh.

Tính Nhất Quán Của Nhân Vật Qua Nhiều Hình Ảnh

Một trong những vấn đề khó khăn nhất trong lịch sử tạo hình ảnh AI là duy trì tính nhất quán của nhân vật qua nhiều hình ảnh. Bạn sẽ tạo ra một nhân vật bạn yêu thích, sau đó cố gắng đặt họ vào một tư thế hoặc môi trường khác, và đột nhiên họ trông giống như một người hoàn toàn khác.

Nano Banana Pro đạt được tiến bộ đáng kể về vấn đề này thông qua khả năng đầu vào nhiều hình ảnh. Bạn có thể cung cấp hình ảnh tham khảo và mô hình sẽ duy trì danh tính trong các thế hệ mới.

Quy Trình Làm Việc Nhất Quán Nhân Vật
Bước 1: Thiết Lập Nhân Vật
\"Tạo một bảng tham khảo nhân vật cho Người 1: một phụ nữ châu Á
30 tuổi với mái tóc đen ngang vai, đôi mắt nâu ấm áp và nụ cười
thân thiện. Hiển thị chế độ xem phía trước, hồ sơ bên và góc ba phần tư.\"

Bước 2: Tạo Cảnh
\"Người 1 đang ngồi ở bàn quán cà phê, đọc sách. Ánh sáng buổi sáng
qua cửa sổ. Quần áo thường ngày.\"

Bước 3: Chuyển Đổi Bối Cảnh
\"Người 1 hiện đang trong một cuộc họp kinh doanh, mặc trang phục chuyên nghiệp.
Cùng một nhân vật, môi trường khác nhau.\"

Bước 4: Nhiều Nhân Vật
\"Người 1 và Người 2 (thiết lập Người 2 trước) đang đi bộ cùng nhau
trong công viên. Ánh sáng chiều mùa thu.\"

Quy trình làm việc này mang tính biến đổi cho:

  • Thương mại điện tử thời trang: Hiển thị cùng một người mẫu trong nhiều trang phục mà không cần chụp ảnh đắt tiền
  • Thiết kế nhân vật: Khám phá các biến thể trong khi vẫn duy trì danh tính
  • Tạo truyện tranh/manga: Giữ cho các nhân vật chính nhất quán qua các cảnh
  • Nội dung người có ảnh hưởng ảo: Tạo ra một tính cách nhất quán qua các bài đăng
  • Tạo tài sản trò chơi: Nhân vật trong nhiều tư thế và biểu cảm
💡

Mẹo chuyên nghiệp cho sự nhất quán của nhân vật: Khi cung cấp hình ảnh tham khảo, hãy bao gồm ít nhất một ảnh chụp khuôn mặt phía trước được chiếu sáng tốt. Mô hình sử dụng điều này để neo danh tính. Các góc bổ sung giúp ích nhưng không quan trọng bằng tham chiếu chính này.

Các Mẫu Cảnh Chính Thức Của Google

Google đã cung cấp các mẫu prompt chính thức cho các trường hợp sử dụng phổ biến. Tôi đã thử nghiệm chúng rộng rãi và muốn chia sẻ các phiên bản tinh chỉnh của tôi dựa trên kết quả thực tế. Mỗi mẫu tuân theo một cấu trúc nhất quán mà mô hình phản hồi một cách đáng tin cậy.

Mẫu Nhiếp Ảnh Chân Thực Như Ảnh Chụp

Cấu trúc: Loại Cảnh Quay + Chủ Đề + Hành Động/Biểu Cảm + Môi Trường + Ánh Sáng + Thông Số Máy Ảnh + Tỷ Lệ Khung Hình

Mẫu
Một [loại cảnh quay] chân thực như ảnh chụp của [chủ đề], [hành động hoặc biểu cảm],
đặt tại [môi trường]. Cảnh được chiếu sáng bởi [mô tả ánh sáng],
tạo ra một bầu không khí [tâm trạng]. Chụp bằng [chi tiết máy ảnh/ống kính],
nhấn mạnh [kết cấu và chi tiết chính]. Hình ảnh phải ở định dạng
[tỷ lệ khung hình].
Ví Dụ Ứng Dụng
Một bức chân dung cận cảnh chân thực như ảnh chụp của một thợ gốm Nhật Bản lớn tuổi
đang kiểm tra một bát trà, ánh sáng giờ vàng tràn qua cửa sổ
bên trái, tạo ra bầu không khí trầm ngâm. Chụp bằng ống kính
85mm ở f/2.8, nhấn mạnh kết cấu da, bàn tay phong hóa và
lớp men gốm. Định dạng 16:9.

Mẫu Minh Họa và Nhãn Dán

Cấu trúc: Phong Cách + Chủ Đề + Các Đặc Điểm Chính + Bảng Màu + Kiểu Đường Nét + Nền

Mẫu
Một nhãn dán [phong cách] của một [chủ đề], có [các đặc điểm chính]
và một [bảng màu]. Thiết kế nên có [kiểu đường nét] và
[kiểu đổ bóng]. Nền phải là [yêu cầu nền].

Mẫu Thiết Kế Thương Hiệu

Cấu trúc: Loại Hình Ảnh + Thương Hiệu/Khái Niệm + Nội Dung Văn Bản + Kiểu Chữ + Phong Cách Thiết Kế + Phối Màu

Mẫu
Tạo một [loại hình ảnh] cho [thương hiệu/khái niệm] với văn bản \"[văn bản chính xác]\"
bằng [kiểu phông chữ]. Thiết kế phải là [mô tả phong cách], với một
[phối màu]. Bao gồm [các yếu tố thiết kế bổ sung]. Cảm giác tổng thể
phải truyền đạt [giá trị thương hiệu/thông điệp].

Mẫu Nhiếp Ảnh Sản Phẩm

Cấu trúc: Mô Tả Sản Phẩm + Nền + Thiết Lập Ánh Sáng + Góc Máy Ảnh + Chi Tiết Chính + Tỷ Lệ Khung Hình

Mẫu
Một bức ảnh sản phẩm độ phân giải cao, được chiếu sáng studio của một [mô tả sản phẩm]
trên một [bề mặt nền]. Ánh sáng là một [thiết lập ánh sáng] cho
[mục đích ánh sáng]. Góc máy ảnh là một [loại góc] để làm nổi bật
[tính năng cụ thể]. Rất thực tế, với tiêu điểm sắc nét vào [chi tiết chính].
[Tỷ lệ khung hình].

Mẫu Không Gian Âm Tối Giản

Cấu trúc: Vị Trí Chủ Đề + Không Gian Nền Trống + Ánh Sáng + Tỷ Lệ Khung Hình

Mẫu
Một bố cục tối giản có một [chủ đề] duy nhất được đặt
ở [vị trí: dưới cùng bên phải/trên cùng bên trái/v.v.] của khung hình.
Nền là một khung vẽ [màu] rộng lớn, trống rỗng, tạo ra không gian
âm đáng kể. Ánh sáng mềm mại, tinh tế từ [hướng]. [Tỷ lệ khung hình].

Mẫu Bảng Truyện Tranh

Cấu trúc: Phong Cách Nghệ Thuật + Nhân Vật/Hành Động Tiền Cảnh + Thiết Lập Nền + Đối Thoại/Chú Thích + Tâm Trạng

Mẫu
Một bảng truyện tranh đơn lẻ theo phong cách [phong cách nghệ thuật]. Ở tiền cảnh,
[mô tả nhân vật và hành động]. Ở nền, [chi tiết thiết lập].
Bảng có một [hộp đối thoại/chú thích] với văn bản \"[văn bản chính xác]\".
Ánh sáng tạo ra một tâm trạng [tâm trạng]. [Tỷ lệ khung hình].

Các Kỹ Thuật Chỉnh Sửa Hình Ảnh Nâng Cao

Ngoài việc tạo văn bản thành hình ảnh, Nano Banana Pro vượt trội trong việc sửa đổi các hình ảnh hiện có. Chìa khóa là hiểu cách mô tả các chỉnh sửa của bạn một cách rõ ràng trong khi chỉ định những gì phải giữ nguyên.

Hợp Đồng Thay Đổi vs. Giữ Nguyên

Khi chỉnh sửa hình ảnh, tôi sử dụng một cấu trúc cụ thể tập trung vào sự rõ ràng về những gì nên và không nên thay đổi:

Cấu Trúc Prompt Chỉnh Sửa Hình Ảnh
KEEP (GIỮ NGUYÊN): [Các yếu tố phải giữ nguyên]
- \"Giữ nguyên các đặc điểm khuôn mặt chính xác và biểu cảm của người đó\"
- \"Giữ nguyên hướng và cường độ ánh sáng ban đầu\"

CHANGE (THAY ĐỔI): [Yêu cầu sửa đổi cụ thể]
- \"Thay thế nền bằng cảnh bãi biển hoàng hôn\"
- \"Thay đổi màu áo từ xanh sang đỏ\"

HOW (NHƯ THẾ NÀO): [Hướng dẫn phong cách và chất lượng]
- \"Đảm bảo tích hợp ánh sáng tự nhiên\"
- \"Khớp phân loại màu của hình ảnh gốc\"

CONSTRAINTS (RÀNG BUỘC): [Những điều cần tránh]
- \"Không thay đổi bất kỳ đặc điểm khuôn mặt nào\"
- \"Tránh thay đổi hướng bóng\"

Thêm và Xóa Các Yếu Tố

Mẫu Thêm Yếu Tố
Sử dụng hình ảnh được cung cấp của [chủ đề], vui lòng thêm [yếu tố]
vào cảnh. Đặt nó [mô tả vị trí]. Đảm bảo phần bổ sung
[mô tả tích hợp: khớp ánh sáng, khớp phối cảnh, v.v.].
Giữ nguyên tất cả các yếu tố khác chính xác như chúng xuất hiện trong bản gốc.
Ví Dụ Thực Tế
Sử dụng hình ảnh con mèo của tôi này, hãy thêm một chiếc mũ phù thủy đan nhỏ
lên đầu nó. Chiếc mũ nên nằm tự nhiên, phù hợp với ánh sáng
mềm mại của bức ảnh. Giữ nguyên biểu cảm, tư thế của con mèo và
tất cả các yếu tố nền không thay đổi.

Chuyển Đổi Phong Cách

Chuyển Đổi Phong Cách Nghệ Thuật
Biến đổi bức ảnh được cung cấp của [chủ đề] sang phong cách
nghệ thuật của [nghệ sĩ/phong trào nghệ thuật]. Giữ nguyên bố cục ban đầu
nhưng hiển thị tất cả các yếu tố bằng [mô tả các yếu tố phong cách].

Ví dụ: Biến đổi bức ảnh đường phố hiện đại vào ban đêm này
sang phong cách \"Starry Night\" của Vincent van Gogh. Giữ nguyên bố cục
của các tòa nhà và ô tô nhưng hiển thị mọi thứ bằng nét cọ xoáy, impasto
và một bảng màu ấn tượng của xanh đậm và vàng tươi.

Bố Cục Nhiều Hình Ảnh

Kết Hợp Nhiều Hình Ảnh
Tạo một hình ảnh mới kết hợp các yếu tố từ các hình ảnh được cung cấp.
Lấy [yếu tố từ Hình ảnh 1] và đặt nó với/vào [yếu tố từ Hình ảnh 2].
Hình ảnh cuối cùng phải là [mô tả kết quả mong muốn].

Ví dụ: Kết hợp những hình ảnh này - lấy tàu tên lửa từ Hình ảnh 1
và đặt nó phóng đi từ bãi biển đảo nhiệt đới trong Hình ảnh 2.
Hình ảnh cuối cùng nên hiển thị một cảnh bãi biển yên bình với một tên lửa
phóng đi một cách ấn tượng ở nền, ánh sáng hoàng hôn.

Bảo Tồn Danh Tính Độ Trung Thực Cao

Đối với các chỉnh sửa mà việc bảo tồn danh tính khuôn mặt là rất quan trọng:

Chỉnh Sửa Bảo Tồn Danh Tính
Sử dụng các hình ảnh được cung cấp, đặt [yếu tố từ Hình ảnh 2] lên
[chủ đề trong Hình ảnh 1]. Đảm bảo các đặc điểm của [chủ đề] vẫn
hoàn toàn không thay đổi — cùng cấu trúc khuôn mặt, biểu cảm và
tỷ lệ. Yếu tố được thêm vào nên tích hợp tự nhiên với
[mô tả yêu cầu tích hợp].

Ví dụ: Lấy người phụ nữ có mái tóc nâu và đôi mắt xanh từ Hình ảnh 1.
Thêm logo từ Hình ảnh 2 vào áo phông đen của cô ấy. Giữ khuôn mặt
và các đặc điểm của cô ấy chính xác không thay đổi. Logo nên trông tự nhiên
được in trên vải, theo các nếp gấp của áo.

Phác Thảo Thành Hiện Thực

Phát Triển Khái Niệm
Biến đổi bản phác thảo thô [phương tiện: bút chì/bút đánh dấu/kỹ thuật số] này của
[chủ đề] thành một hình ảnh hoàn thiện [mô tả phong cách]. Giữ nguyên
[các đặc điểm cụ thể cần giữ] từ bản phác thảo nhưng thêm
[chi tiết/vật liệu/lớp hoàn thiện mới].

Ví dụ: Biến đổi bản phác thảo bút chì thô của một chiếc xe hơi tương lai này
thành một bức ảnh showroom bóng bẩy của chiếc xe nguyên mẫu cuối cùng.
Giữ nguyên các đường nét bóng bẩy và cấu hình thấp từ bản phác thảo nhưng thêm
sơn màu xanh kim loại và ánh sáng vành neon.

Những Sai Lầm Đã Giết Chết Kết Quả Của Tôi

Học những gì KHÔNG nên làm cũng quan trọng như học những gì nên làm. Dưới đây là những sai lầm liên tục tạo ra kết quả kém cho đến khi tôi xác định và loại bỏ chúng.

Sai Lầm 1: Nhồi Nhét Từ Khóa

Những gì tôi đã làm: Thêm các từ khóa chất lượng như "masterpiece, ultra-detailed, 8K, trending on ArtStation, unreal engine" vào mọi prompt.

Tại sao nó thất bại: Nano Banana Pro được đào tạo khác với các mô hình cũ hơn. Những từ khóa này hoặc không có tác dụng hoặc thực sự có thể làm rối mô hình về ý định thực sự của bạn.

Cách tiếp cận tốt hơn: Tập trung vào tính cụ thể mô tả thay vì từ khóa chất lượng. Mô tả chính xác những gì bạn muốn thấy.

Sai Lầm 2: Prompt Tiêu Cực

Những gì tôi đã làm: Viết "no blur, no artifacts, no deformed hands, no extra fingers."

Tại sao nó thất bại: Nano Banana Pro không hỗ trợ prompt tiêu cực theo cách tương tự như các mô hình khuếch tán. Việc nói cho nó biết những gì không nên làm thực sự có thể giới thiệu những yếu tố đó.

Cách tiếp cận tốt hơn: Mô tả những gì bạn muốn một cách tích cực. Thay vì "no blur," hãy nói "sharp focus."

Sai Lầm 3: Tham Chiếu Phong Cách Mơ Hồ

Những gì tôi đã làm: Viết "beautiful image, stunning, amazing, gorgeous."

Tại sao nó thất bại: Những từ này không cung cấp thông tin có thể hành động. Những gì làm cho một cái gì đó "đẹp" là chủ quan.

Cách tiếp cận tốt hơn: Mô tả các phẩm chất hình ảnh cụ thể. "Warm color palette with golden highlights" cho mô hình biết chính xác những gì cần hiển thị.

Sai Lầm 4: Bỏ Qua Tỷ Lệ Khung Hình

Những gì tôi đã làm: Không chỉ định tỷ lệ khung hình và sau đó cố gắng cắt kết quả để phù hợp với nhu cầu của mình.

Tại sao nó thất bại: Mô hình bố cục hình ảnh khác nhau dựa trên tỷ lệ khung hình. Một bố cục hình vuông có sự cân bằng khác với một cảnh quay rộng điện ảnh.

Cách tiếp cận tốt hơn: Luôn chỉ định tỷ lệ khung hình mục tiêu của bạn trước. "16:9 horizontal," "9:16 vertical," "1:1 square."

Sai Lầm 5: Prompt Quá Phức Tạp

Những gì tôi đã làm: Cố gắng chỉ định mọi chi tiết có thể trong một prompt khổng lồ.

Tại sao nó thất bại: Vượt quá một mức độ phức tạp nhất định, các yếu tố bắt đầu bị mất hoặc xung đột với nhau.

Cách tiếp cận tốt hơn: Bắt đầu với các yếu tố cốt lõi, tạo, sau đó tinh chỉnh thông qua cuộc trò chuyện với các hành động tiếp theo có mục tiêu.

Sai Lầm 6: Quên Chế Độ Suy Nghĩ

Những gì tôi đã làm: Sử dụng chế độ tiêu chuẩn cho các bố cục phức tạp.

Tại sao nó thất bại: Chế độ tiêu chuẩn không tham gia vào khả năng suy luận đầy đủ cho các yêu cầu phức tạp.

Cách tiếp cận tốt hơn: Đối với các bố cục phức tạp, hãy bật chế độ suy nghĩ. Điều này cho phép mô hình phân tích sâu sắc các mối quan hệ không gian trước khi tạo.

💡

Bài học meta: Nano Banana Pro là một đối tác trò chuyện, không phải là một máy đánh bạc. Hãy đối xử với nó như thể bạn đang chỉ đạo một nghệ sĩ rất có năng lực — đưa ra hướng dẫn rõ ràng, kiểm tra kết quả, tinh chỉnh hợp tác. Cách tiếp cận lặp đi lặp lại đánh bại việc cố gắng đạt được sự hoàn hảo trong một prompt duy nhất.

Tích Hợp API Cho Nhà Phát Triển

Đối với các nhà phát triển muốn tích hợp Nano Banana Pro vào các ứng dụng, API có sẵn thông qua Google AI Studio và Vertex AI. Dưới đây là các chi tiết kỹ thuật chính:

Yêu Cầu Tạo Cơ Bản

Ví Dụ Python API
from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_images(
    model='imagen-3.0-generate-002',  # Nano Banana Pro
    prompt='A photorealistic portrait of a robot barista...',
    config=types.GenerateImagesConfig(
        number_of_images=1,
        aspect_ratio='16:9',
        output_mime_type='image/jpeg'
    )
)

# Access the generated image
image_data = response.generated_images[0].image.image_bytes

Yêu Cầu Chỉnh Sửa Hình Ảnh

Chỉnh Sửa Với Độ Trung Thực Cao
response = client.models.edit_image(
    model='imagen-3.0-capability-001',
    prompt='Change the background to a sunset beach...',
    reference_images=[open('original.png', 'rb')],
    config=types.EditImageConfig(
        edit_mode='INPAINT',
        number_of_images=1,
        input_fidelity='high',  # Critical for identity preservation
        output_mime_type='image/png'
    )
)

Cài đặt input_fidelity='high' cải thiện đáng kể việc bảo tồn danh tính khi thực hiện các chỉnh sửa trên hình ảnh có khuôn mặt hoặc chi tiết quan trọng.

Các Tham Số Chính

  • aspect_ratio: \"1:1\", \"16:9\", \"9:16\", \"4:3\", \"3:4\", \"21:9\"
  • number_of_images: 1-4 hình ảnh mỗi yêu cầu
  • output_mime_type: \"image/jpeg\" hoặc \"image/png\"
  • input_fidelity: \"low\" (nhanh hơn) hoặc \"high\" (bảo tồn danh tính tốt hơn)
  • safety_filter_level: Kiểm soát mức độ nghiêm ngặt của việc lọc nội dung

Giới Hạn Tốc Độ và Hạn Ngạch

Lưu ý về giới hạn sử dụng:

  • Hạn ngạch Gemini 2.0 Flash áp dụng cho việc tạo hình ảnh
  • Nếu bạn đạt đến giới hạn hàng ngày, hãy chuyển sang chế độ \"Fast\" để tiếp tục tạo tiêu chuẩn
  • Tài khoản Enterprise Vertex AI có giới hạn cao hơn
  • Cân nhắc triển khai hàng đợi yêu cầu cho các ứng dụng khối lượng lớn

Thư Viện Prompt Tối Ưu

Tôi đã sắp xếp các prompt thành công nhất của mình thành các danh mục để dễ dàng tham khảo. Tất cả những thứ này đã được thử nghiệm và tinh chỉnh qua nhiều lần lặp lại.

Nhiếp Ảnh Chân Dung

Chân Dung Môi Trường
Chân dung môi trường của một [nghề nghiệp] trong không gian làm việc của họ.
Ánh sáng cửa sổ tự nhiên từ bên trái tạo ra bóng mềm mại.
Chủ đề được đặt ở mốc một phần ba, nhìn hơi xa máy ảnh.
Nền hiển thị các công cụ xác thực của nghề nghiệp của họ, hơi mất nét.
Chụp trên tiêu cự tương đương 50mm f/2.0. Nhiệt độ màu ấm.
Phong cách nhiếp ảnh tài liệu, xác thực.

Ảnh Chụp Sản Phẩm

Hình Ảnh Sản Phẩm Anh Hùng
Ảnh chụp sản phẩm anh hùng [sản phẩm] trôi nổi trên nền
chuyển màu chuyển từ [màu 1] sang [màu 2].
Ánh sáng ba điểm tạo ra bóng và điểm nổi bật ấn tượng.
Sản phẩm ở một góc nhỏ hiển thị hình dạng không gian.
Phản chiếu trên bề mặt bóng loáng bên dưới.
Các tính năng chính được làm nổi bật với các chú thích văn bản trôi nổi tối thiểu.
Độ phân giải 4K, thẩm mỹ nhiếp ảnh thương hiệu cao cấp.

Phong Cách Minh Họa

Poster Du Lịch Cổ Điển
Poster du lịch cổ điển cho [điểm đến] theo phong cách Art Deco những năm 1930.
Hình dạng hình học táo bạo, bảng màu hạn chế [3-4 màu].
Địa danh mang tính biểu tượng làm tiêu điểm trung tâm với các tia nắng cách điệu phía sau.
Tiêu đề sans-serif lớn \"[TÊN ĐIỂM ĐẾN]\" ở trên cùng.
Khẩu hiệu nhỏ \"[cụm từ hấp dẫn]\" ở dưới cùng.
Kết cấu hơi phong hóa cho tính xác thực.
Định dạng dọc để in poster.

Mockup UI/UX

Màn Hình Ứng Dụng Di Động
Thiết kế UI ứng dụng di động cho ứng dụng [loại ứng dụng].
Giao diện hiện đại theo phong cách iOS với màu nhấn [phối màu].
[Loại màn hình: nguồn cấp dữ liệu trang chủ / hồ sơ / cài đặt / v.v.]
Bao gồm nội dung thực tế: [các yếu tố cụ thể].
Kiểu chữ sạch sẽ với SF Pro hoặc tương tự.
Bóng và độ sâu tinh tế.
Khung thiết bị tùy chọn.
Tập trung vào khả năng sử dụng và phân cấp hình ảnh.

Nghệ Thuật Khái Niệm

Khái Niệm Môi Trường
Nghệ thuật khái niệm cho một [thể loại: khoa học viễn tưởng/giả tưởng/v.v.] [loại địa điểm].
Ánh sáng [thời gian trong ngày] thiết lập tâm trạng [tâm trạng].
Các đặc điểm chính: [liệt kê 3-5 yếu tố đặc biệt].
Hình người để chia tỷ lệ ở [địa điểm].
Phong cách hội họa với các nét cọ có thể nhìn thấy ở nền,
nghệ thuật đường nét chi tiết cho các yếu tố kiến trúc.
Bố cục điện ảnh với sự phân tách tiền cảnh-trung cảnh-hậu cảnh mạnh mẽ.
Định dạng 16:9 cho trò chơi/phim.

Đồ Họa Thông Tin

Quy Trình Đồ Họa Thông Tin
Đồ họa thông tin giải thích [quy trình/khái niệm] trong [số] bước.
Thiết kế sạch sẽ, hiện đại với [phối màu].
Mỗi bước được đánh số với biểu tượng và văn bản giải thích ngắn gọn.
Luồng hình ảnh từ [hướng: trên xuống dưới / trái sang phải].
Mũi tên hoặc đường nối giữa các bước.
Tiêu đề: \"[Tiêu Đề Chủ Đề]\" ở trên cùng bằng chữ in đậm.
Tất cả văn bản phải sắc nét và dễ đọc.
Nền trắng hoặc xám nhạt.
Thích hợp cho [nền tảng: mạng xã hội / in ấn / thuyết trình].

Suy Nghĩ Cuối Cùng

Đêm đó khi Nano Banana Pro ra mắt, tôi đã trải nghiệm một điều gì đó mà tôi chưa cảm thấy kể từ những lần gặp gỡ đầu tiên với việc tạo hình ảnh AI: sự kinh ngạc thực sự về những gì đột nhiên có thể thực hiện được. Các rào cản đã xác định quy trình làm việc của tôi — hạn chế kết xuất văn bản, vấn đề nhất quán, thiếu suy luận — đã bốc hơi từng cái một khi tôi khám phá.

Nhưng tôi cũng học được một điều gì đó sâu sắc hơn qua nhiều tháng sử dụng chuyên sâu: công cụ ít quan trọng hơn người sử dụng nó. Nano Banana Pro cực kỳ mạnh mẽ, nhưng sức mạnh đó chỉ hữu ích nếu bạn hiểu cách truyền đạt tầm nhìn của mình một cách rõ ràng, lặp lại cẩn thận và nhận ra cả tiềm năng và giới hạn của công nghệ.

Các kỹ thuật trong hướng dẫn này là điểm khởi đầu, không phải điểm kết thúc. Những người sáng tạo sẽ làm những công việc thực sự đáng chú ý với Nano Banana Pro là những người sẽ lấy những nền tảng này và đẩy chúng đi xa hơn — kết hợp các khả năng theo những cách không ai nghĩ tới, giải quyết các vấn đề mà không ai nhận ra là có thể giải quyết được, tạo ra những trải nghiệm hình ảnh gây bất ngờ và thích thú.

\"Khi AI trở nên mạnh mẽ hơn, điều duy nhất giới hạn chúng ta là trí tưởng tượng nghèo nàn của chính chúng ta.\"

Tôi đã viết điều đó trong ghi chú của mình vào lúc 5 giờ sáng vào đêm Nano Banana Pro ra mắt, và nó đã trở thành một nguyên tắc hướng dẫn. Công nghệ sẽ tiếp tục tiến bộ. Các khả năng mới sẽ xuất hiện. Nhưng kỹ năng cơ bản — dịch những hình ảnh trong đầu bạn thành các hướng dẫn mà máy móc có thể thực hiện — sẽ vẫn có giá trị bất kể mô hình nào đang hiện hành.

Vì vậy, hãy thử nghiệm không ngừng nghỉ. Đẩy các ranh giới. Thử các prompt có vẻ không thể. Tạo ra hàng ngàn hình ảnh. Tìm hiểu những gì hoạt động và, quan trọng không kém, những gì không. Xây dựng trực giác của riêng bạn về cách các hệ thống này suy nghĩ.

Tương lai của việc sáng tạo hình ảnh là sự hợp tác — con người cung cấp tầm nhìn, hướng đi và phán đoán; AI cung cấp tốc độ thực thi và năng lực kỹ thuật. Nano Banana Pro là đối tác hợp tác có năng lực nhất mà chúng tôi từng có. Câu hỏi không còn là \"AI có thể làm điều này không?\" mà là \"chúng ta sẽ tạo ra cái gì cùng nhau?\".

Tôi rất nóng lòng được xem những gì bạn xây dựng.

💡

Sẵn sàng để bắt đầu? Mở Gemini, bật chế độ Thinking (Suy nghĩ), và thử prompt này: \"Tạo một poster phim chi tiết cho một bộ phim chỉ tồn tại trong trí tưởng tượng của tôi — một câu chuyện về [ý tưởng của bạn]. Làm cho tiêu đề trở thành tâm điểm hình ảnh với kiểu chữ đẹp.\" Sau đó lặp lại, tinh chỉnh và biến nó thành của riêng bạn.

Thảo luận

0 bình luận

Để lại bình luận

Hãy là người đầu tiên chia sẻ suy nghĩ của bạn!