OpenAI อัปเกรด ChatGPT ครั้งใหญ่ เพิ่มความสามารถสร้างภาพใหม่ เร็วขึ้นสี่เท่า เพื่อต้าน Google Gemini

ทีมบรรณาธิการ BigGo

OpenAI อัปเกรด ChatGPT ครั้งใหญ่ เพิ่มความสามารถสร้างภาพใหม่ เร็วขึ้นสี่เท่า เพื่อต้าน Google Gemini

ในสงครามการแข่งขันด้าน AI ที่ร้อนระอุขึ้นทุกขณะ OpenAI ได้ยิงกระสุนนัดสำคัญออกมา บริษัทได้เปิดตัวการอัปเกรดครั้งใหญ่ให้กับแพลตฟอร์ม ChatGPT ของตน โดยแนะนำโมเดลใหม่เฉพาะทางสำหรับการสร้างและแก้ไขภาพชื่อ GPT Image 1.5 การเคลื่อนไหวนี้ ซึ่งตามมาหลังจากที่ Google อัปเดต "Nano Banana" ครั้งใหญ่ให้กับ Gemini เมื่อไม่กี่เดือนก่อน เป็นสัญญาณของการต่อสู้ที่ดุเดือดเพื่อแย่งชิงความได้เปรียบในตลาด AI สำหรับผู้บริโภคและนักพัฒนา ซึ่งความสามารถด้านภาพกำลังกลายเป็นจุดแตกต่างที่สำคัญ การอัปเดตครั้งนี้ไม่เพียงแต่สัญญาว่าจะมีเครื่องมือแก้ไขที่ทรงพลังและเชื่อถือได้มากขึ้น แต่ยังเพิ่มความเร็วในการสร้างภาพขึ้นถึงสี่เท่าอย่างน่าทึ่ง เพื่อตอบสนองความต้องการของผู้ใช้ที่อยากได้เวิร์กโฟลว์การสร้างสรรค์ที่รวดเร็วและใช้งานง่ายขึ้น

หัวใจของการอัปเกรด: ความเร็วและความแม่นยำ

คุณสมบัติหลักของการอัปเดตล่าสุดจาก OpenAI คือการอ้างว่าความเร็วในการสร้างภาพเพิ่มขึ้นสี่เท่าเมื่อเทียบกับรุ่นก่อนหน้า การเพิ่มประสิทธิภาพนี้ถูกออกแบบมาเพื่อให้ประสบการณ์การสร้างสรรค์และการแก้ไขภาพแบบวนซ้ำเป็นไปอย่างลื่นไหลมากขึ้น นอกเหนือจากความเร็วแล้ว โมเดลใหม่ยังแนะนำอินเทอร์เฟซ "สร้างภาพ" เฉพาะภายใน ChatGPT ซึ่งเปลี่ยนจากระบบป้อนคำสั่งแบบแชทล้วนๆ ไปเป็นพื้นที่ทำงานที่มีโครงสร้างมากขึ้น สิ่งนี้ช่วยให้ผู้ใช้สามารถควบคุมได้อย่างแม่นยำยิ่งขึ้น โดยอนุญาตให้ทำการแก้ไขหลายครั้งต่อเนื่องกันกับภาพที่อัปโหลด เช่น การเปลี่ยนสไตล์ศิลปะ การปรับแสง หรือการเพิ่มคำบรรยาย โดยไม่สูญเสียบริบทของไฟล์ต้นฉบับ

ข้อมูลจำเพาะหลักของ GPT Image 1.5 อัปเดต:

ความเร็ว: อ้างว่าเร็วกว่าโมเดลสร้างภาพรุ่นก่อนหน้า 4 เท่า
อินเทอร์เฟซใหม่: ส่วน "Create image" ที่จัดสรรไว้ภายใน ChatGPT
ฟีเจอร์หลัก: การแก้ไขภาพอย่างแม่นยำ, การจัดองค์ประกอบภาพหลายภาพ, การเปลี่ยนสไตล์
การเข้าถึง: กำลังเปิดให้ผู้ใช้ทุกคน โดยฟีเจอร์ขั้นสูงมีให้สำหรับสมาชิก ChatGPT Plus (20 USD ต่อเดือน)

การแข่งขันแบบตัวต่อตัวกับ Google Gemini

ช่วงเวลาและลักษณะของการประกาศของ OpenAI ถูกมองโดยทั่วไปว่าเป็นการตอบโต้โดยตรงต่อความสามารถในการแก้ไขภาพขั้นสูงที่ Google เปิดตัวสำหรับ AI Gemini ของตนในเดือนสิงหาคม 2024 ปัจจุบันทั้งสองแพลตฟอร์มมีคุณสมบัติหลักที่คล้ายกันอย่างน่าทึ่ง นั่นคือ ความสามารถในการแก้ไขบางส่วนของภาพโดยแยกออกจากกัน รวมองค์ประกอบจากหลายภาพเข้าด้วยกันเป็นฉากเดียวที่สอดคล้องกัน และเปลี่ยนสไตล์โดยรวมของภาพ ในการทดสอบใช้งานจริง ทั้งโมเดลใหม่ของ ChatGPT และ Gemini Nano Banana Pro แสดงความสามารถที่น่าประทับใจในงานต่างๆ เช่น การลบวัตถุ การเปลี่ยนเสื้อผ้า และการปรับสี ซึ่งเป็นงานที่โดยปกติแล้วต้องใช้ทักษะระดับผู้เชี่ยวชาญในโปรแกรม Photoshop

การเปรียบเทียบโดยตรงระหว่างคู่แข่ง (ChatGPT กับ Google Gemini):

คุณสมบัติ	ChatGPT (GPT Image 1.5)	Google Gemini (Nano Banana Pro)
ระดับสมาชิกสำหรับการใช้งาน	ChatGPT Plus (20 ดอลลาร์สหรัฐ/เดือน)	Google AI Premium (20 ดอลลาร์สหรัฐ/เดือน)
การลบ/แก้ไขวัตถุ	ความสามารถสูง	ความสามารถสูง
การผสมภาพหลายภาพ	ความสอดคล้องที่เป็นธรรมชาติมากกว่าเล็กน้อย	อาจดูเหมือน "ตัดแปะ" มากกว่า
การเปลี่ยนสไตล์	มีประสิทธิภาพในการรักษาความสม่ำเสมอ	มีประสิทธิภาพ แต่อาจมีปัญหาเรื่องความสอดคล้องเชิงลึก
ข้อจำกัดที่รับทราบ	"ผลลัพธ์ยังไม่สมบูรณ์แบบ" (ตามที่ OpenAI ระบุ)	ความท้าทายคล้ายกันเกี่ยวกับมุมมองและความสมจริง

การประเมินอ้างอิงจากการทดสอบเปรียบเทียบตามที่ระบุในแหล่งข้อมูล

การเปรียบเทียบประสิทธิภาพและข้อจำกัดที่ยังคงอยู่

แม้โมเดล AI ทั้งสองจะทำงานในระดับสูงแล้ว แต่ก็ยังพบความแตกต่างเล็กน้อยเมื่อตรวจสอบอย่างละเอียด การเปรียบเทียบในเบื้องต้นชี้ให้เห็นว่า GPT Image 1.5 ของ ChatGPT อาจได้เปรียบเล็กน้อยในด้านการผสานภาพต่าง ๆ เข้าด้วยกันได้อย่างเป็นธรรมชาติมากขึ้น และการรักษาความสม่ำเสมอเมื่อเปลี่ยนสุนทรียภาพโดยรวมของภาพ เช่น การปรับใช้สไตล์ "ฟิล์มนัวร์" อย่างไรก็ตาม ระบบทั้งสองก็มีข้อจำกัดร่วมกัน พวกมันอาจยังมีปัญหาในการจัดการกับการเปลี่ยนแปลงมุมมองที่ซับซ้อน และเมื่อสร้างหรือแก้ไขใบหน้าของคนจริง ผลลัพธ์ที่ได้มักจะดูแปลกประหลาดหรือไม่สม่ำเสมอ เนื่องจาก AI ขาดความเข้าใจที่แท้จริงเกี่ยวกับลักษณะเฉพาะบุคคล OpenAI เองก็ยอมรับในการประกาศว่า "ผลลัพธ์ยังคงไม่สมบูรณ์แบบ" และ "ยังมีพื้นที่สำหรับการปรับปรุงอีกมาก"

เหตุผลที่สำคัญ: มากกว่าภาพ สู่การอยู่รอดของธุรกิจ

สงครามคุณสมบัตินี้เกิดขึ้นท่ามกลางแรงกดดันจากการแข่งขันที่รุนแรง ตามที่รายงานมา แหล่งข่าวภายใน OpenAI ได้อธิบายถึงความพยายามระดับ "Code Red" เพื่อป้องกันการแซงหน้าจาก Google โดยมีความกังวลว่าหาก Gemini แซงหน้า ChatGPT ในด้าน "ประสิทธิภาพดิบ" อาจส่งผลกระทบร้ายแรงต่อธุรกิจ API ของ OpenAI ภัยคุกคามนี้ทวีความรุนแรงขึ้นจากความเป็นไปได้ที่ Google จะให้บริการหลักของ Gemini ฟรี ซึ่งอาจบ่อนทำลายโมเดลการสมัครสมาชิกสำหรับผู้บริโภคของ OpenAI บริบทนี้ทำให้ทุกการอัปเดตคุณสมบัติ โดยเฉพาะในด้านที่มีการมองเห็นสูงอย่างการสร้างภาพ กลายเป็นกลยุทธ์สำคัญเพื่อรักษาผู้ใช้และปกป้องความเป็นผู้นำในตลาด

อนาคตของการสร้างสรรค์ด้วยความช่วยเหลือจาก AI

การอัปเกรดล่าสุดจาก OpenAI และ Google เป็นจุดเปลี่ยนสำคัญ ที่ทำให้การจัดการภาพขั้นสูงเป็นเรื่องที่ทุกคนเข้าถึงได้ และนำเครื่องมือสร้างสรรค์อันทรงพลังมาสู่มือผู้ใช้ทั่วไป จุดสนใจกำลังเปลี่ยนจากการสร้างภาพธรรมดา ไปสู่การแก้ไขที่ชาญฉลาดและตระหนักถึงบริบท เมื่อโมเดลพื้นฐานยังคงพัฒนาความเข้าใจในด้านฟิสิกส์ แสง และรายละเอียดเฉพาะอย่างต่อเนื่อง เส้นแบ่งระหว่างภาพที่แก้ไขด้วย AI และภาพที่แก้ไขโดยมืออาชีพจะยิ่งจางลง สำหรับตอนนี้ การประลองระหว่าง ChatGPT และ Gemini กำลังขับเคลื่อนนวัตกรรมอย่างรวดเร็ว มอบเครื่องมือที่ทรงพลังและรวดเร็วยิ่งขึ้นให้กับผู้ใช้ และเตรียมพร้อมสำหรับเฟสต่อไปของ AI สร้างสรรค์

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌