OpenAI เปิดตัว GPT Image 1.5: เร็วขึ้น ควบคุมได้ดีขึ้น แต่ยังสู้คู่แข่งเรื่องความสมจริงไม่ได้

ทีมบรรณาธิการ BigGo
OpenAI เปิดตัว GPT Image 1.5: เร็วขึ้น ควบคุมได้ดีขึ้น แต่ยังสู้คู่แข่งเรื่องความสมจริงไม่ได้

OpenAI ได้ก้าวเข้าสู่ระยะต่อไปของการแข่งขันสร้างภาพด้วย AI อย่างเป็นทางการ ด้วยการเปิดตัวโมเดลล่าสุด GPT Image 1.5 ซึ่งประกาศเมื่อวันที่ 17 ธันวาคม 2025 โมเดลนี้สัญญาว่าจะมีการปรับปรุงอย่างมีนัยสำคัญในด้านความเร็ว การทำตามคำสั่ง และความสามารถในการแก้ไข โดยมุ่งหมายที่จะท้าทายผู้นำตลาดในปัจจุบัน อย่างไรก็ตาม การทดสอบใช้งานจริงเบื้องต้นและความคิดเห็นจากชุมชนชี้ให้เห็นว่า แม้การผสานรวมเข้ากับผลิตภัณฑ์จะราบรื่น แต่คุณภาพผลลัพธ์ดิบอาจยังตามหลังมาตรฐานที่คู่แข่งอย่าง Google Nano Banana Pro ตั้งไว้

ก้าวกระโดดด้านความเร็วและการผสานรวมผลิตภัณฑ์

การปรับปรุงทางเทคนิคหลักสำหรับ GPT Image 1.5 คือความเร็วในการประมวลผล ซึ่ง OpenAI อ้างว่ามีความเร็วมากกว่าตัวก่อนหน้าถึงสี่เท่า ความเร่งนี้ถูกออกแบบมาเพื่อทำให้ขั้นตอนการทำงานสร้างสรรค์มีประสิทธิภาพมากขึ้น ทำให้การสร้างและแก้ไขภาพซ้ำๆ เป็นไปได้จริงมากขึ้น นอกจากความเร็วแล้ว OpenAI ยังได้ผสานรวมโมเดลนี้เข้ากับ ChatGPT อย่างลึกซึ้ง โดยเปิดส่วนสร้างภาพเฉพาะขึ้นมาใหม่ อินเทอร์เฟซใหม่นี้มอบเทมเพลตสำเร็จรูปและตัวเลือกสไตล์ที่หลากหลายให้ผู้ใช้ ซึ่งช่วยลดอุปสรรคในการเริ่มต้นสร้างภาพที่ซับซ้อนหรือมีสไตล์เฉพาะได้อย่างมาก การเคลื่อนไหวครั้งนี้เน้นย้ำถึงกลยุทธ์ของ OpenAI ที่ให้ความสำคัญกับการทำให้เป็นผลิตภัณฑ์ที่ใช้ง่าย ทำให้เครื่องมือ AI ขั้นสูงสามารถเข้าถึงได้โดยตรงผ่านอินเทอร์เฟซแชทที่ผู้ใช้คุ้นเคย

ข้อมูลจำเพาะหลักและราคาของ GPT Image 1.5

  • วันที่วางจำหน่าย: 17 ธันวาคม 2025
  • ความเร็วที่อ้างอิง: เร็วกว่าโมเดลสร้างภาพรุ่นก่อนหน้าของ OpenAI 4 เท่า
  • ราคา (ตามโทเค็น): คุณภาพสูง (1MP): ~133 USD ต่อภาพ 1,000 ภาพ คุณภาพต่ำ: ~9 USD ต่อภาพ 1,000 ภาพ
  • ความพร้อมใช้งาน: บูรณาการใน ChatGPT สำหรับผู้ใช้ทุกคน; ปล่อย API แล้ว

ประสิทธิภาพและราคา: ภาพรวมมาตรฐานที่หลากหลาย

OpenAI ได้ใช้โมเดลราคาแบบใช้โทเคนสำหรับ GPT Image 1.5 โดยมีต้นทุนที่ปรับตามความละเอียดและคุณภาพที่ตั้งค่า สำหรับภาพคุณภาพสูงขนาดหนึ่งเมกะพิกเซล ราคาอยู่ที่ประมาณ 133 ดอลลาร์สหรัฐ ต่อการสร้างหนึ่งพันภาพ ในขณะที่ภาพคุณภาพต่ำมีราคาประมาณ 9 ดอลลาร์สหรัฐ ต่อการสร้างหนึ่งพันภาพ ผู้ใช้ ChatGPT ทุกคนได้รับสิทธิ์เข้าถึงโมเดลนี้ทันทีที่เปิดตัว พร้อมกับที่ API ของโมเดลก็พร้อมให้บริการสำหรับนักพัฒนาด้วย ในแง่ของมาตรฐานอย่างเป็นทางการ มีรายงานว่า GPT Image 1.5 ติดอันดับหนึ่งทั้งในกระดานผู้นำด้านการสร้างภาพจากข้อความและการแก้ไขภาพบนเว็บไซต์ Artificial Analysis แซงหน้า Google Nano Banana Pro และยังได้ตำแหน่งผู้นำที่คล้ายกันบน LMArena model arena ซึ่งบ่งชี้ถึงประสิทธิภาพที่แข็งแกร่งในสภาพแวดล้อมการทดสอบที่ควบคุมได้

ผลการทดสอบมาตรฐานที่รายงาน (ณ วันที่ 17 ธันวาคม 2025)

  • Artificial Analysis: อันดับ 1 ในกระดานผู้นำ Text-to-Image และ Image Editing
  • LMArena: อันดับ 1 ในกระดานผู้นำ Text-to-Image และ Image Editing
  • หมายเหตุ: OpenAI ยังไม่ได้เปิดเผยข้อมูลการทดสอบมาตรฐานอย่างเป็นทางการของตนเอง## การทดสอบใช้งานจริงเผยให้เห็นสุนทรียะแบบ "หนืด" และปัญหาด้านรายละเอียด แม้จะมีคะแนนมาตรฐานที่น่าพอใจ แต่การทดสอบอิสระโดยสื่อเทคโนโลยีและผู้ใช้กลับเผยให้เห็นช่องว่างที่สังเกตได้ในคุณภาพผลลัพธ์ เมื่อสร้างฉากที่ซับซ้อน เช่น กลางคืนที่มีฝนตกในโตเกียวพร้อมองค์ประกอบที่ระบุหลายอย่าง ผลลัพธ์จาก GPT Image 1.5 มักถูกอธิบายว่ามี "ความรู้สึกแบบ AI" ที่ชัดเจน หรือความรู้สึกแบบ "หนืด" มีสีที่อิ่มตัวเกินไป และการผสมผสานระหว่างวัตถุเบื้องหน้าและพื้นหลังที่ไม่เป็นธรรมชาติ ยังพบข้อผิดพลาดสำคัญ เช่น การสร้างมือที่มีเพียงสี่นิ้ว ซึ่งถือเป็นความล้มเหลวขั้นพื้นฐานสำหรับโมเดลในยุคปี 2025 ในงานถ่ายโอนสไตล์ เช่น การสร้างฉากใหม่ในสไตล์ภาพThe Starry Night ของ Vincent van Gogh โมเดลนี้ประสบปัญหาในการจับคู่ลวดลายแปรงและโทนสีอันเป็นเอกลักษณ์ของผลงานต้นฉบับได้อย่างแม่นยำ ในขณะที่คู่แข่งทำสำเร็จ

ผลการทดสอบภาคปฏิบัติและชุมชน เทียบกับ Nano Banana Pro

หัวข้อทดสอบ ข้อสังเกตจาก GPT Image 1.5 ข้อสังเกตจาก Nano Banana Pro (สำหรับเปรียบเทียบ)
ด้านสุนทรียภาพ มักดู "หนืด" อิ่มสีเกินจริง มี "ความรู้สึกแบบ AI" ดูเป็นธรรมชาติ มีคุณภาพเหมือนภาพถ่าย ความไม่สมบูรณ์แบบเล็กน้อยเพิ่มความสมจริง
ความแม่นยำของรายละเอียด ต่อสู้กับคำสั่งที่ซับซ้อน (เช่น ขาดรายละเอียดมือ) มีแนวโน้มผิดพลาด เช่น กายวิภาคไม่ถูกต้อง มีความแม่นยำสูงในการสร้างรายละเอียดตามคำสั่ง
การถ่ายโอนสไตล์ อาจพลาดองค์ประกอบศิลปะหลัก (เช่น ลายแปรงของ Van Gogh) เชื่อฟังต่อลักษณะเฉพาะของสไตล์ที่ร้องขอมากกว่า
กรณีขอบเขต ประสิทธิภาพลดลงอย่างมีนัยสำคัญ (เช่น มุมมองบิดเบี้ยว) จัดการกับคำสั่งที่ผิดปกติได้อย่างแข็งแกร่งกว่า
ความเร็ว เร็วก่​อนรุ่นก่อนหน้า แต่รายงานว่าช้ากว่า Nano Banana Pro ในบางการทดสอบ ถูกบันทึกไว้ว่ามีเวลาสร้างภาพเร็ว (~15 วินาทีในการทดสอบหนึ่ง)
จุดแข็ง การทำตามคำสั่งสำหรับการแก้ไขดี, การหลอมรวมองค์ประกอบหลายอย่างดี, การผสานเข้ากับผลิตภัณฑ์ยอดเยี่ยม มีพื้นฐานความสมจริงและความสม่ำเสมอของรายละเอียดสูง

กรณีพิเศษและความสมจริงยังตามหลังคู่แข่ง

จุดอ่อนของโมเดลจะเด่นชัดมากขึ้นในสถานการณ์กรณีพิเศษ คำสั่งที่ขอให้สร้างภาพจากมุมมองบุคคลที่หนึ่งของแมว ส่งผลให้ได้ภาพที่บิดเบือนอย่างรุนแรง มีรายละเอียดที่ไม่สอดคล้องกัน และไม่สามารถสื่อมุมมองที่ขอได้อย่างน่าเชื่อถือ ในการเปรียบเทียบแบบเคียงข้างกันที่แชร์กันออนไลน์ ภาพบุคคลที่สร้างโดย GPT Image 1.5 มักแสดงปัญหาเรื่องสัดส่วน เช่น ศีรษะที่ใหญ่เกินไป และแสงที่ดูเป็นธรรมชาติน้อยกว่าเมื่อเทียบกับภาพจาก Nano Banana Pro ผู้ใช้สังเกตว่าผลลัพธ์จาก Nano Banana Pro บางครั้งมีข้อบกพร่องเล็กน้อย เช่น หน้าต่างที่สว่างจ้าเกินไปเล็กน้อย ซึ่งกลับช่วยเพิ่มความรู้สึกสมจริงแบบภาพถ่ายให้มากขึ้น บางคนที่ทดสอบพบว่าผลลัพธ์ของ GPT Image 1.5 สามารถปรับปรุงได้โดยเพิ่มคำสั่งเฉพาะทางภาพถ่าย เช่น "unprocessed iPhone photo" ลงในคำสั่ง ซึ่งชี้ให้เห็นว่าสุนทรียะพื้นฐานของมันถูกประมวลผลมากเกินไป

จุดแข็งด้านการแก้ไขและการหลอมรวมหลายองค์ประกอบ

จุดที่ GPT Image 1.5 แสดงให้เห็นถึงศักยภาพอย่างมากคือความสามารถในการแก้ไขภาพและประกอบภาพ OpenAI สาธิตความสามารถของโมเดลในการสลับองค์ประกอบที่ซับซ้อน เช่น การเปลี่ยนสีเสื้อผ้า ประเภทยานพาหนะ และป้ายถนนภายในภาพที่มีอยู่เดิมด้วยความแม่นยำสูง นอกจากนี้ยังรองรับการหลอมรวมหลายองค์ประกอบ เช่น การวางคนหลายคนและสุนัขลงในฉากเดียวที่เชื่อมโยงกันอย่างน่าเชื่อถือตามคำอธิบาย เทมเพลตสไตล์ที่มีอยู่ภายในช่วยให้สามารถเปลี่ยนแปลงได้รวดเร็ว เช่น การเปลี่ยนภาพบุคคลในองค์กรให้กลายเป็นหน้าปกเทปออกกำลังกายสไตล์ VHS ในยุค 80 หรือเปลี่ยนฉากให้เป็นสุนทรียะสีชมพูแบบเกมตุ๊กตาในยุคต้นปี 2000 ซึ่งแสดงให้เห็นถึงประโยชน์ของมันสำหรับการรีมิกซ์สร้างสรรค์อย่างรวดเร็ว

สรุป: ผลิตภัณฑ์ที่สมบูรณ์แบบรอการพัฒนาผ่านโมเดล

การเปิดตัว GPT Image 1.5 เป็นการอัปเดตแบบค่อยเป็นค่อยไปที่แข็งแกร่งจาก OpenAI ซึ่งโดดเด่นในด้านประสบการณ์ผู้ใช้ ความเร็ว และการควบคุมสร้างสรรค์ผ่านการแก้ไขและเทมเพลต การผสานรวมที่ราบรื่นเข้ากับ ChatGPT ทำให้การสร้างภาพอันทรงพลังสามารถเข้าถึงได้ง่ายกว่าที่เคย อย่างไรก็ตาม ฉันทามติจากการทดสอบเบื้องต้นคือ โมเดลหลักยังคงตามหลังเทคโนโลยีล่าสุดในปัจจุบันในด้านสำคัญ เช่น ความสมจริง ความสม่ำเสมอของรายละเอียด และความน่าเชื่อถือกับคำสั่งที่ซับซ้อนหรือไม่ปกติ ในตลาดที่ความคาดหวังของผู้ใช้ถูกยกระดับขึ้นอย่างมากโดยคู่แข่ง GPT Image 1.5 มอบประสบการณ์ผลิตภัณฑ์ที่เหนือกว่า แต่ยังมีพื้นที่ให้ปรับปรุงในเครื่องมือสร้างภาพพื้นฐาน การตอบรับจากตลาดในท้ายที่สุดจะขึ้นอยู่กับว่าผู้ใช้ให้คุณค่ากับขั้นตอนการทำงานที่ราบรื่นเหนือความเที่ยงตรงสูงสุดของผลลัพธ์มากน้อยเพียงใด