Google เปิดตัว Nano Banana Pro สร้างความตื่นตะลุกด้วยการสร้างภาพ AI ที่สมจริงและฟีเจอร์ใหม่อันทรงพลัง

ทีมบรรณาธิการ BigGo

Google เปิดตัว Nano Banana Pro สร้างความตื่นตะลุกด้วยการสร้างภาพ AI ที่สมจริงและฟีเจอร์ใหม่อันทรงพลัง

ในภูมิทัศน์ที่พัฒนาอย่างรวดเร็วของการสร้างภาพ AI Google ได้ก้าวกระโดดครั้งสำคัญด้วยการเปิดตัว Nano Banana Pro รุ่นใหม่นี้ ซึ่งขับเคลื่อนโดยโมเดล Gemini 3 ขั้นสูง ถือเป็นการอัปเกรดครั้งใหญ่ในด้านคุณภาพ รายละเอียด และการควบคุมของผู้ใช้ ก้าวข้ามจากการเป็นเพียงนวัตกรรมใหม่ๆ ไปสู่การเป็นเครื่องมืออันทรงพลังสำหรับทั้งความคิดสร้างสรรค์และประสิทธิภาพการทำงาน ผู้ใช้ยุคแรกและนักวิจารณ์ด้านเทคโนโลยีต่างกำลังสำรวจความสามารถที่ได้รับการปรับปรุงแล้ว ตั้งแต่การสร้างภาพเปลี่ยนแปลงที่สวยงามอย่างน่าทึ่ง ไปจนถึงการสร้างอินโฟกราฟิกที่ซับซ้อน ซึ่งส่งสัญญาณถึงการท้าทายผู้เล่นรายใหญ่ในวงการ AI อย่างจริงจัง

การอัปเกรดครั้งใหญ่ในด้านความสมจริงและการควบคุม

ความก้าวหน้าหลักของ Nano Banana Pro อยู่ที่คุณภาพผลลัพธ์ที่พัฒนาขึ้นอย่างมาก ผู้ใช้รายงานว่าโมเดลตอนนี้ให้ภาพที่ "สมจริงอย่างน่าประหลาด" จัดการกับคำสั่งสร้างสรรค์ที่หลากหลายได้อย่างง่ายดายอย่างน่าทึ่ง ก้าวกระโดดนี้มาจากสถาปัตยกรรมพื้นฐานของ Gemini 3 ซึ่งเพิ่มความสามารถของ AI ในการทำความเข้าใจและปฏิบัติตามคำสั่งที่ซับซ้อน ไม่ว่างานนั้นจะเกี่ยวข้องกับการเปลี่ยนมุมกล้อง การสลับองค์ประกอบภายในภาพ หรือการเปลี่ยนแปลงสภาพอากาศทั้งหมด รุ่น Pro ก็ยังคงรักษาระดับความสม่ำเสมอ รายละเอียด และการผสมผสานที่สมจริงทางภาพถ่ายในระดับสูง ซึ่งในรุ่นก่อนหน้านี้มีน้อยกว่า สิ่งนี้ทำให้มีคุณค่าอย่างยิ่งสำหรับผู้สร้างเนื้อหาที่ต้องการตัวเลือกภาพหลายแบบจากภาพต้นทางเพียงภาพเดียว โดยไม่จำเป็นต้องถ่ายใหม่

การประยุกต์ใช้จริงและความเป็นไปได้ในการสร้างสรรค์

การประยุกต์ใช้จริงสำหรับ Nano Banana Pro นั้นกว้างขวางและหลากหลาย หนึ่งในการใช้งานที่น่าสนใจที่สุดคือการแก้ไขภาพแบบไดนามิก เช่น คำสั่ง "เปลี่ยนมุมกล้อง" ซึ่งสามารถสร้างภาพถ่ายเดียวใหม่จากสี่มุมมองที่แตกต่างกัน ในขณะที่ยังคงรักษาวัตถุและพื้นหลังให้สม่ำเสมอสมบูรณ์แบบ อีกฟีเจอร์หนึ่งที่ทรงพลังคือ "การแทนที่ภาพ" ซึ่งอนุญาตให้ผู้ใช้สลับองค์ประกอบเฉพาะในภาพได้อย่างราบรื่น เช่น การเปลี่ยนจักรยานเด็กเป็นม้าพันธุ์เล็ก ในขณะที่ยังคงรักษาแสงและสไตล์ดั้งเดิมไว้ สำหรับธุรกิจขนาดเล็กและผู้สร้างงานหัตถกรรม คำสั่ง "การจัดวางผลิตภัณฑ์" นำเสนอทางเลือกที่ประหยัดค่าใช้จ่ายแทนการถ่ายภาพมืออาชีพ โดยการผสานผลิตภัณฑ์ เช่น ผ้านวมทำมือ เข้าไปในฉากห้องนอนที่จัดสไตล์ไว้อย่างสมจริง พร้อมทั้งรอยพับและเงาธรรมชาติ

คำสั่งยอดนิยมที่ผู้ใช้สร้างขึ้นสำหรับ Nano Banana Pro:

ฟิกเกอร์ Funko Pop: "สร้างภาพเรนเดอร์ 3D แบบละเอียดของฟิกเกอร์สไตล์ชิบิในรูปแบบ Funko Pop จากรูปอ้างอิงที่อัปโหลด จับคู่ทรงผม เสื้อผ้า และสไตล์เฉพาะตัวของบุคคลได้อย่างแม่นยำ"
เปลี่ยนสภาพอากาศ/ทิวทัศน์: "ใช้บุคคลจากภาพที่อัปโหลด สร้างฉากใหม่ด้วยสภาพอากาศและชุดเสื้อผ้าใหม่ทั้งหมด รักษาตัวตน ลักษณะใบหน้า และสัดส่วนของบุคคลให้คงที่"
การเปลี่ยนแปลงอายุ: "ใช้บุคคลจากภาพที่อัปโหลด สร้างเวอร์ชันที่แก่ลงอย่างสมจริง รักษาตัวตน โครงสร้างใบหน้า รูปร่างทรงผม และลักษณะเด่นต่างๆ ให้คงที่ ในขณะที่เพิ่มอายุตามธรรมชาติให้แก่ขึ้น 20 ปี"

การขยายขอบเขตไปสู่การออกแบบข้อมูลและการเล่าเรื่อง

เหนือไปกว่าการจัดการภาพอย่างง่าย Nano Banana Pro แสดงความสามารถอันน่าเกรงขามในการแสดงผลข้อความและการออกแบบเลย์เอาต์ แนวโน้มสำคัญในหมู่ผู้ใช้ยุคแรกคือการสร้างอินโฟกราฟิกที่ซับซ้อน โมเดลสามารถประมวลผลข้อความยาว เช่น บทความหรือเอกสาร Markdown และเปลี่ยนพวกมันเป็นกราฟิกที่สวยงามและอัดแน่นไปด้วยข้อมูล พร้อมด้วยการจัดวางแบบตัวอักษรที่สวยงามและโครงสร้างที่มีตรรกะ ความสามารถนี้ยังขยายไปสู่การสร้างการ์ตูนหลายช่อง ด้วยการใช้ประโยชน์จากความสม่ำเสมอที่ได้รับการปรับปรุงและเข้าถึงความรู้เกี่ยวกับโลกจริงผ่าน Google Search AI สามารถสร้างการ์ตูนสตริปที่สอดคล้องกันโดยอิงจากรูปภาพของผู้ใช้หรือการปรากฏตัวออนไลน์ของบุคคลสาธารณะได้ ซึ่งเปิดประตูบานใหม่สำหรับการเล่าเรื่องด้วยภาพและการสร้างเนื้อหา

กรอบการตั้งคำถามอย่างเป็นทางการของ Nano Banana Pro: คำถามที่ประสบความสำเร็จควรประกอบด้วย:

หัวเรื่อง: คำอธิบายสั้นๆ เกี่ยวกับบุคคลหรือวัตถุหลักในภาพ
องค์ประกอบ: การจัดเฟรมภาพ (เช่น ภาพใกล้, มุมกว้าง, มุมต่ำ, ภาพบุคคล)
การกระทำ: สิ่งที่หัวเรื่องกำลังทำอยู่
สถานที่: บรรยากาศหรือฉากหลัง
สไตล์: สุนทรียภาพโดยรวม (เช่น แอนิเมชัน 3 มิติ, ฟิล์ม นัวร์, สีน้ำ, เหมือนจริง)
คำแนะนำในการแก้ไข: การเปลี่ยนแปลงหรือข้อกำหนดเฉพาะใดๆ

คำแนะนำอย่างเป็นทางการเพื่อเพิ่มประสิทธิภาพผลลัพธ์สูงสุด

Google ได้ให้คำแนะนำโดยละเอียดเพื่อช่วยให้ผู้ใช้ควบคุมศักยภาพเต็มที่ของ Nano Banana Pro กุญแจสำคัญในการบรรลุผลลัพธ์ที่แม่นยำอยู่ที่การสร้างคำสั่งที่ครอบคลุมซึ่งกำหนดหัวเรื่อง โครงสร้าง การกระทำ สถานที่ และสไตล์ศิลปะที่ต้องการอย่างชัดเจน สำหรับผลลัพธ์ระดับมืออาชีพ คำแนะนำแนะนำให้ใช้คำศัพท์ทางการถ่ายภาพที่เฉพาะเจาะจง เช่น "ภาพมุมต่ำด้วยระยะชัดลึกตื้น (f/1.8)" หรือ "แสงยามเย็นแบบ backlit" โมเดลยังรองรับอัตราส่วนภาพแบบกำหนดเองสำหรับรูปแบบต่างๆ เช่น โพสต์โซเชียลมีเดียหรือจอกว้างแบบภาพยนตร์ และฟีเจอร์อินพุตภาพหลายภาพใหม่ของมันอนุญาตให้ผสานภาพที่ไม่เกี่ยวข้องกันสูงสุด 14 ภาพให้เป็นภาพใหม่เดียวที่สอดคล้องกัน ซึ่งเป็นก้าวสำคัญในการควบคุมการสร้างสรรค์

แพลตฟอร์มที่ให้บริการ Nano Banana Pro:

แอป Gemini และ Gemini Web Platform
Google AI Studio (Paid API)
Google Vertex AI (Paid API)
แพลตฟอร์มของบริษัทอื่น เช่น Flowith, PixVerse และ Higgs Field (บางแพลตฟอร์มมีบริการทดลองใช้ฟรีแบบจำกัด)

ข้อจำกัดในปัจจุบันและศักยภาพในอนาคต

แม้จะมีขีดความสามารถที่น่าประทับใจ Nano Banana Pro ก็ไม่ได้ปราศจากข้อจำกัด ฟีเจอร์ตรวจจับภาพ AI ที่ได้รับการพูดถึงอย่างมาก ซึ่งออกแบบมาเพื่อระบุว่าภาพนั้นถูกสร้างโดย AI หรือไม่ ตามรายงานยังอยู่ในช่วงการเปิดตัวและไม่สามารถทำงานนี้ได้อย่างน่าเชื่อถือระหว่างการทดสอบครั้งแรก เช่นเดียวกับโมเดลภาษาขนาดใหญ่หลายตัว ศักยภาพสำหรับ "ภาพหลอนของ AI" หรือความไม่ถูกต้องของข้อเท็จจริงยังคงมีอยู่ โดยเฉพาะเมื่อสร้างแผนภูมิที่มีข้อมูลจำนวนมาก ซึ่งจำเป็นต้องมีการตรวจสอบข้อมูลที่สำคัญด้วยตนเอง ผู้ใช้อาจพบเห็นสิ่งประดิษฐ์เล็กน้อยในการเรนเดอร์ในฉากที่ซับซ้อนเป็นครั้งคราว และพบความท้าทายบางอย่างกับข้อความขนาดเล็กมากหรือการสะกดที่ซับซ้อน อย่างไรก็ตาม ด้วยการเปิดตัวฟีเจอร์ต่างๆ อย่างเต็มที่ เช่น การตรวจจับ AI ที่อยู่บนขอบฟ้า เครื่องมือภาพของ Google มีแนวโน้มที่จะมีความโปร่งใสและสำคัญต่อการสร้างเนื้อหาดิจิทัลยิ่งขึ้น โมเดลในปัจจุบันสามารถเข้าถึงได้ผ่านแอป Gemini และแพลตฟอร์มเว็บ โดยมี API ให้เข้าถึงผ่าน Google AI Studio และ Vertex สำหรับนักพัฒนา

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌