Google เปิดตัว Nano Banana Pro ตั้งเป้าแก้ปัญหาเรื่องข้อความและความน่าเชื่อถือของ AI

ทีมบรรณาธิการ BigGo

Google เปิดตัว Nano Banana Pro ตั้งเป้าแก้ปัญหาเรื่องข้อความและความน่าเชื่อถือของ AI

Google ได้เปิดตัว Nano Banana Pro ซึ่งเป็นการอัปเกรดครั้งสำคัญของเทคโนโลยีสร้างภาพ AI ที่สร้างบนโมเดล Gemini 3 Pro การเปิดตัวใหม่นี้จัดการกับสองความท้าทายที่ยืดเยื้อที่สุดในแวดวงสร้างภาพ AI โดยตรง นั่นคือการแสดงผลข้อความที่อ่านออกและสร้างความโปร่งใสของเนื้อหา โมเดลนี้กำลังเริ่มทยอยเปิดให้บริการทั่วทั้งระบบนิเวศของ Google ตั้งแต่แอป Gemini สำหรับผู้ใช้ทั่วไป ไปจนถึงเครื่องมือระดับมืออาชีพอย่าง Google Slides และ Google Ads ซึ่งส่งสัญญาณถึงการผลักดันครั้งใหญ่เพื่อให้ภาพที่สร้างจาก AI สามารถใช้งานได้จริงทั้งสำหรับการสร้างสรรค์ในชีวิตประจำวันและการประยุกต์ใช้ในธุรกิจ

ก้าวกระโดดด้านการแสดงผลข้อความและความรู้เกี่ยวกับโลกจริง

การปรับปรุงที่สังเกตเห็นได้ชัดเจนที่สุดใน Nano Banana Pro คือความสามารถในการสร้างข้อความที่ถูกต้องและอ่านออกภายในภาพ ซึ่งก่อนหน้านี้เป็นจุดอ่อนที่มีชื่อเสียงสำหรับเครื่องสร้างภาพ AI ที่มักผลิตตัวอักษรที่บิดเบี้ยวและคำที่ไร้ความหมาย Google อ้างว่าโมเดลนี้ให้ "การแสดงผลข้อความที่สมบูรณ์แบบ" โดยรองรับหลายภาษาและแม้แต่การแปล การทดสอบเบื้องต้นแสดงให้เห็นว่ามันสามารถสร้างอินโฟกราฟิกที่สอดคล้องกัน ใส่ป้ายกำกับไดอะแกรมได้ถูกต้อง และผลิตสื่อการตลาดที่มีประโยคเต็มที่อ่านได้ ความสามารถนี้ขับเคลื่อนโดยการคิดเหตุผลขั้นสูงของ Gemini 3 Pro ซึ่งช่วยให้โมเดลดึงข้อมูลแบบเรียลไทม์จาก Google Search เพื่อสร้างภาพที่อุดมด้วยบริบท เช่น อินโฟกราฟิกที่ขับเคลื่อนด้วยข้อมูลหรือสูตรอาหารพร้อมคำแนะนำที่ถูกต้อง

การปรับปรุงคุณสมบัติหลักใน Nano Banana Pro:

โมเดลพื้นฐาน: สร้างบน Gemini 3 Pro (เทียบกับ Nano Banana รุ่นดั้งเดิมที่ใช้ Gemini 2.5 Flash)
การแสดงผลข้อความ: สร้างข้อความในภาพได้อย่างสมบูรณ์แบบ รองรับหลายภาษา
การผสมผสานภาพ: รวมองค์ประกอบจากภาพต้นทางได้สูงสุดถึง 14 ภาพ
ความสม่ำเสมอของบุคคล: รักษาความคล้ายคลึงของบุคคลได้สูงสุด 5 คน ระหว่างการสร้างภาพต่างๆ
การควบคุมเชิงสร้างสรรค์: การแก้ไขเฉพาะจุด, การปรับมุมกล้อง, การควบคุมโฟกัส, การปรับเกรดสี
ความโปร่งใส: มีลายน้ำ SynthID พร้อมเครื่องมือตรวจสอบสาธารณะในแอป Gemini

การควบคุมการสร้างสรรค์ที่เพิ่มขึ้นและการผสานรวมระดับมืออาชีพ

สำหรับผู้ใช้ระดับมืออาชีพ Nano Banana Pro เสนอชุดเครื่องมือควบคุมการสร้างสรรค์ใหม่ที่ก้าวไปไกลกว่าการสร้างภาพจากพรอมต์ง่ายๆ ผู้ใช้สามารถทำการแก้ไขภาพเฉพาะจุด ปรับแต่งบางส่วนของภาพให้ละเอียดยิ่งขึ้น และปรับองค์ประกอบต่างๆ เช่น มุมกล้อง โฟกัส การปรับเกรดสี และแสงในฉาก โมเดลนี้ยังสามารถผสมผสานองค์ประกอบจากภาพอินพุตที่แตกต่างกันได้สูงสุด 14 ภาพ ในขณะที่ยังคงความสม่ำเสมอและความคล้ายคลึงของบุคคลได้สูงสุดห้าคน ซึ่งเป็นประโยชน์อย่างมากสำหรับการสร้างเนื้อหาที่มีแบรนด์ การผสานรวมเข้ากับชุดเครื่องมือระดับมืออาชีพของ Google—รวมถึง Google Ads, Google Workspace, Google Slides และ Google Vids—เป็นการเน้นย้ำกลุ่มเป้าหมายหลัก นั่นคือธุรกิจที่มองหาวิธีที่มีต้นทุนประสิทธิภาพในการผลิตสื่อการตลาดและสื่อนำเสนอที่ดูสมบูรณ์แบบ

มาตรฐานใหม่สำหรับความโปร่งใสของ AI

คุณสมบัติที่อาจจะก้าวหน้าที่สุดคือเครื่องมือเพิ่มความโปร่งใสใหม่ของ Google ตอนนี้ใครก็ตามสามารถอัปโหลดภาพเข้าไปในแอป Gemini และถามได้ว่าภาพนั้นถูกสร้างโดย Google AI หรือไม่ สิ่งนี้ขับเคลื่อนโดย SynthID เทคโนโลยีลายน้ำดิจิทัลของ Google ที่ฝังสัญญาณที่มองไม่เห็นลงในสื่อที่สร้างโดย AI ในขณะที่โมเดลอื่นๆ ใช้การใส่ลายน้ำเช่นกัน Google กำลังทำให้การยืนยันสามารถเข้าถึงได้โดยตรงสำหรับผู้บริโภค ในขั้นตอนที่สำคัญสำหรับผู้ใช้ระดับมืออาชีพ ผู้สมัครสมาชิก Google AI Ultra จะมีลายน้ำ "Gemini sparkle" ที่มองเห็นได้ถูกนำออกจากการสร้างสรรค์ของพวกเขา ซึ่งเป็นการยอมรับถึงความจำเป็นในการมีสื่อระดับมืออาชีพที่สะอาดตา ในขณะที่ยังคงรักษาลายเซ็นดิจิทัลพื้นฐานที่สามารถยืนยันได้

ความพร้อมใช้งานและรูปแบบการเข้าถึง

Nano Banana Pro มีให้บริการทั่วโลกในแอป Gemini เมื่อผู้ใช้เลือกโมเดล 'Thinking' ผู้ใช้ระดับฟรีจะได้รับโควตารายวันที่จำกัดก่อนที่จะถูกสลับกลับไปใช้โมเดล Nano Banana ดั้งเดิม ผู้ใช้ที่สมัครสมาชิกแบบเสียเงิน รวมถึงผู้ใช้ Google AI Plus, Google AI Pro และ Google AI Ultra จะได้รับขีดจำกัดการสร้างภาพที่สูงขึ้น สำหรับนักพัฒนาและองค์กรต่างๆ โมเดลนี้สามารถเข้าถึงได้ผ่าน Gemini API, Google AI Studio และจะ很快พร้อมใช้งานบน Vertex AI รูปแบบการเข้าถึงแบบแบ่งระดับนี้ทำให้ Google สามารถตอบสนองความต้องการของทุกคน ตั้งแต่ผู้ใช้ทั่วไปที่ทดลองเล่นกับ AI ไปจนถึงธุรกิจขนาดใหญ่ที่ต้องการสร้างเนื้อหาใน規模ใหญ่

ระดับการเข้าถึงสำหรับ Nano Banana Pro:

ผู้ใช้ฟรี: มีโควต้าจำกัดต่อวันในแอป Gemini; พร้อมลายน้ำที่มองเห็นได้
ผู้สมัครสมาชิก Google AI Plus/Pro/Ultra: มีขีดจำกัดการสร้างที่สูงขึ้น
ผู้ใช้ AI Pro & Ultra (สหรัฐอเมริกา): เข้าถึงได้ผ่านโหมด AI ในแอป Gemini
ผู้สมัครสมาชิก Google AI Ultra: ไม่มีลายน้ำที่มองเห็นได้; เข้าถึงได้ใน Flow (เครื่องมือสร้างภาพยนตร์ด้วย AI)
นักพัฒนา/องค์กรธุรกิจ: เข้าถึงได้ผ่าน Gemini API, Google AI Studio, Vertex AI
Workspace/Google Ads: มีการผนวกรวมสำหรับลูกค้าธุรกิจ

คำตัดสินเกี่ยวกับภาพที่สร้างโดย AI ระดับองค์กร

การทดสอบใช้งานเบื้องต้นเผยให้เห็นเครื่องมือที่มีความสามารถน่าทายแต่ก็ยังมีข้อจำกัดที่คุ้นเคย แม้ว่าการแสดงผลข้อความจะดีขึ้นอย่างมาก แต่โมเดลยังคงสามารถมีปัญหากับงานที่ซับซ้อน เช่น การติดป้ายกำกับภาพที่แม่นยำ แนวโน้มการผลักดันให้มีการนำไปใช้ในระดับมืออาชีพนั้นชัดเจน และความละเอียดภาพที่เพิ่มขึ้นรวมถึงการควบคุมที่ดีขึ้นจะดึงดูดใจธุรกิจอย่างไม่ต้องสงสัย อย่างไรก็ตาม ผลลัพธ์ที่ได้ยังคงสามารถมีสุนทรียภาพเฉพาะตัว บางครั้งก็ดูไม่เป็นธรรมชาติ ของกราฟิกที่สร้างโดย AI ได้ เมื่อเทคโนโลยีนี้ถูกฝังลงในเครื่องมือในที่ทำงาน ยุคของการสื่อสารระดับองค์กรที่ได้รับความช่วยเหลือจาก AI ก็มาถึงแล้วอย่างแน่นอน ซึ่งสัญญาว่าจะมีประสิทธิภาพ แต่ก็ทำให้เกิดคำถามเกี่ยวกับการทำให้สื่อภาพมีความเหมือนกันไปหมด Google Nano Banana Pro เป็นตัวแทนของก้าวที่สำคัญในการทำให้การสร้างภาพ AI เติบโตจากของ新奇กลายเป็นเครื่องมือที่ใช้งานได้จริง

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌