Google ได้เปิดตัวการอัปเดตครั้งสำคัญสำหรับแพลตฟอร์ม AI Gemini โดยนำเสนอความสามารถในการแก้ไขภาพที่ได้รับการปรับปรุงและฟีเจอร์แชทชั่วคราวที่เน้นความเป็นส่วนตัว การพัฒนาเหล่านี้ถือเป็นก้าวสำคัญไปข้างหน้าในการนำเสนอ AI ของบริษัท แม้ว่าจะยังคงมีคำถามสำคัญเกี่ยวกับเทคโนโลยี deepfake และการจัดการดิจิทัล
การแก้ไขภาพที่ปฏิวัติวงการด้วย Gemini 2.5 Flash
จุดเด่นของการอัปเดตล่าสุดของ Google คือโมเดลการสร้างภาพ Gemini 2.5 Flash ที่ทีมพัฒนาตั้งชื่อเล่นว่า Nano Banana ระบบ AI ที่ได้รับการปรับปรุงนี้แสดงให้เห็นถึงการก้าวกระโดดครั้งใหญ่ในความสม่ำเสมอและคุณภาพของการแก้ไขภาพ โมเดลนี้ขณะนี้อยู่ในอันดับแรกของกระดานผู้นำการแก้ไขภาพของ LMArena ซึ่งแสดงให้เห็นถึงความเหนือกว่าทางเทคนิคเมื่อเทียบกับโซลูชันคู่แข่ง
ความสามารถใหม่ช่วยให้ผู้ใช้สามารถรวมภาพถ่ายหลายภาพได้อย่างราบรื่น วางตัวเองข้างสัตว์เลิ้ยงหรือในสภาพแวดล้อมที่แตกต่างกันโดยสิ้นเชิงในขณะที่ยังคงความสม่ำเสมอทางภาพ ผู้ใช้สามารถเปลี่ยนรูปลักษณ์ของตนเองเป็นตัวละครต่างๆ ตั้งแต่นักสู้วัวไปจนถึงบุคลิกภาพในซิทคอมยุค 1990 ด้วยความแม่นยำที่น่าทึ่ง ระบบมีความเป็นเลิศในการแก้ไขแบบหลายรอบ ทำให้สามารถเปลี่ยนแปลงภาพทีละน้อยโดยไม่ทำให้เกิดความไม่สอดคล้องทางภาพที่มักจะเกิดขึ้นกับเนื้อหาที่สร้างโดย AI
คุณสมบัติหลักของ Gemini 2.5 Flash "Nano Banana" :
- การแก้ไขภาพแบบหลายรอบพร้อมการรักษาความสอดคล้อง
- การรวมวัตถุจากภาถ่ายหลายๆ ภาพ
- การจัดการพื้นหลังและการเปลี่ยนฉาก
- ความสามารถในการเปลี่ยนแปลงตัวละคร
- ปัจจุบันอันดับ 1 ใน LMArena's image editing leaderboard
- ไม่สามารถทำการครอปพื้นฐานเป็นอัตราส่วนที่เฉพาะเจาะจงได้
ฟีเจอร์ขั้นสูงและข้อจำกัด
แอป Gemini ที่ได้รับการอัปเดตของ Google ขณะนี้รองรับการจัดการพื้นหลังที่ซับซ้อนและการรวมหัวข้อ ผู้ใช้สามารถถ่ายภาพห้องเปล่าและมอบหมายให้ AI จัดเฟอร์นิเจอร์ หรือเปลี่ยนวอลเปเปอร์เพื่อดูตัวอย่างตัวเลือกการออกแบบภายใน ระบบยังคงความสอดคล้องตลอดหลายเซสชันการแก้ไข ซึ่งแก้ไขจุดอ่อนทั่วไปในตัวแก้ไขภาพ AI รุ่นก่อน
อย่างไรก็ตาม เทคโนโลยีนี้ยังคงมีข้อจำกัดที่น่าแปลกใจ แม้จะมีความสามารถขั้นสูง แต่ระบบไม่สามารถทำงานพื้นฐาน เช่น การครอปภาพให้เป็นอัตราส่วนที่เฉพาะเจาะจง เมื่อขอให้แปลงภาพสี่เหลี่ยมจัตุรัสเป็นรูปแบบ 16:9 Gemini จะระบุอย่างชัดเจนว่าไม่สามารถทำการแก้ไขที่แม่นยำ เช่น การครอปภาพให้เป็นอัตราส่วนที่เฉพาะเจาะจงได้
ความกังวลด้านความเป็นส่วนตัวและผลกระทบจาก Deepfake
ความสามารถในการแก้ไขภาพที่ได้รับการปรับปรุงทำให้เกิดความกังวลอย่างมากเกี่ยวกับการจัดการดิจิทัลและความถูกต้อง ระบบสามารถสร้างภาพที่น่าเชื่อถือสูงของคนดังที่เสียชีวิตแล้วในสถานการณ์ที่แต่งขึ้นโดยสิ้นเชิง ซึ่งท้าทายความสามารถของผู้ใช้ในการแยกแยะระหว่างเนื้อหาจริงและที่สร้างโดย AI แม้ว่า Google จะรวมลายน้ำที่มองเห็นได้ในภาพที่สร้างขึ้นทั้งหมด แต่สิ่งเหล่านี้สามารถมองข้ามหรือลบออกได้อย่างง่ายดายโดยผู้ที่มีเจตนาร้ายโดยใช้ซอฟต์แวร์แก้ไขมาตรฐาน
Google ได้ใช้ระบบลายน้ำดิจิทัลที่มองไม่เห็น SynthID ที่ออกแบบมาให้ตรวจจับได้โดย SynthID Detector ของบริษัท อย่างไรก็ตาม ระบบการตรวจจับนี้ยังคงอยู่ในขั้นตอนการทดสอบที่จำกัดและยังไม่เปิดให้สาธารณชนเข้าถึงได้อย่างกว้างขวาง ทำให้เกิดช่องว่างในความสามารถในการตรวจสอบ
มาตรการความปลอดภัยและการตรวจสอบ:
- ลายน้ำที่มองเห็นได้บนภาพที่สร้างด้วย AI ทั้งหมด
- ระบบลายน้ำดิจิทัลแบบมองไม่เห็น SynthID
- SynthID Detector สำหรับการตรวจสอบ (มีจำหน่ายอย่างจำกัด)
- ลายน้ำสามารถถูกตัดออกได้โดยซอฟต์แวร์บุคคลที่สาม
ฟีเจอร์แชทชั่วคราวเพิ่มความเป็นส่วนตัว
นอกเหนือจากการอัปเดตการแก้ไขภาพแล้ว Google ยังได้แนะนำฟังก์ชัน Temporary Chat ให้กับ Gemini ซึ่งเป็นฟีเจอร์ที่มีอยู่แล้วในแพลตฟอร์มคู่แข่ง เช่น ChatGPT เครื่องมือที่เน้นความเป็นส่วนตัวนี้ช่วยให้ผู้ใช้สามารถโต้ตอบกับ AI โดยไม่บันทึกประวัติการสนทนา ซึ่งตอบสนองต่อความกังวลที่เพิ่มขึ้นเกี่ยวกับการเก็บข้อมูลและความเป็นส่วนตัว
ฟีเจอร์แชทชั่วคราวสามารถเข้าถึงได้ผ่านไอคอนแชทเส้นประที่อยู่ข้างปุ่มแชทใหม่มาตรฐาน การสนทนาในโหมดนี้จะไม่มีส่วนร่วมในการฝึกโมเดล การปรับแต่งส่วนบุคคล หรือปรากฏในประวัติแชท อย่างไรก็ตาม Google เก็บการสนทนาเหล่านี้ไว้เป็นเวลา 72 ชั่วโมงเพื่อวัตถุประสงค์ด้านความปลอดภัยและการปรับปรุงการตอบสนอง
ข้อกำหนดของ Temporary Chat :
- ใช้งานได้บนแพลตฟอร์ม Android , iOS และเว็บ
- การสนทนาจะไม่ถูกนำไปใช้สำหรับการฝึกฝนโมเดลหรือการปรับแต่งส่วนบุคคล
- ข้อมูลจะถูกเก็บไว้เป็นเวลา 72 ชั่วโมงเพื่อวัตถุประสงค์ด้านความปลอดภัย
- ไม่สามารถเข้าถึงประวัติการสนทนา Temporary Chat ก่อนหน้าได้
- จำกัดเฉพาะบัญชี Google ส่วนบุคคล (ไม่รวมบัญชีที่ทำงาน/โรงเรียน)
ความพร้อมใช้งานและการเข้าถึง
ฟีเจอร์แชทชั่วคราวกำลังเปิดตัวให้กับผู้ใช้ Google Gemini ทั้งหมดบนแพลตฟอร์ม Android, iOS และเว็บ ฟังก์ชันนี้พร้อมใช้งานสำหรับผู้ใช้ที่มีบัญชี Google ส่วนบุคคล แม้ว่าผู้ที่ใช้บัญชีโรงเรียนหรือที่ทำงานจะยังไม่สามารถเข้าถึงได้ในขณะนี้ ความสามารถในการสร้างภาพ รวมถึงฟีเจอร์ Nano Banana ใหม่ พร้อมใช้งานสำหรับผู้ใช้ทุกคนไม่ว่าจะเป็นสถานะการสมัครสมาชิกใด แม้ว่าแผนพรีเมียมจะปลดล็อกฟีเจอร์เพิ่มเติม
การอัปเดตเหล่านี้แสดงให้เห็นถึงการลงทุนอย่างต่อเนื่องของ Google ในความสามารถของ AI ในขณะที่เน้นย้ำถึงความท้าทายอย่างต่อเนื่องในการสร้างสมดุลระหว่างนวัตกรรมกับการใช้งานที่รับผิดชอบในยุคที่มีความกังวลเพิ่มขึ้นเกี่ยวกับการจัดการดิจิทัลและความเป็นส่วนตัว