OpenAI ได้ก้าวเข้าสู่ระยะต่อไปของการแข่งขันสร้างภาพด้วย AI อย่างเป็นทางการ ด้วยการเปิดตัวโมเดลล่าสุด GPT Image 1.5 ซึ่งประกาศเมื่อวันที่ 17 ธันวาคม 2025 โมเดลนี้สัญญาว่าจะมีการปรับปรุงอย่างมีนัยสำคัญในด้านความเร็ว การทำตามคำสั่ง และความสามารถในการแก้ไข โดยมุ่งหมายที่จะท้าทายผู้นำตลาดในปัจจุบัน อย่างไรก็ตาม การทดสอบใช้งานจริงเบื้องต้นและความคิดเห็นจากชุมชนชี้ให้เห็นว่า แม้การผสานรวมเข้ากับผลิตภัณฑ์จะราบรื่น แต่คุณภาพผลลัพธ์ดิบอาจยังตามหลังมาตรฐานที่คู่แข่งอย่าง Google Nano Banana Pro ตั้งไว้
ก้าวกระโดดด้านความเร็วและการผสานรวมผลิตภัณฑ์
การปรับปรุงทางเทคนิคหลักสำหรับ GPT Image 1.5 คือความเร็วในการประมวลผล ซึ่ง OpenAI อ้างว่ามีความเร็วมากกว่าตัวก่อนหน้าถึงสี่เท่า ความเร่งนี้ถูกออกแบบมาเพื่อทำให้ขั้นตอนการทำงานสร้างสรรค์มีประสิทธิภาพมากขึ้น ทำให้การสร้างและแก้ไขภาพซ้ำๆ เป็นไปได้จริงมากขึ้น นอกจากความเร็วแล้ว OpenAI ยังได้ผสานรวมโมเดลนี้เข้ากับ ChatGPT อย่างลึกซึ้ง โดยเปิดส่วนสร้างภาพเฉพาะขึ้นมาใหม่ อินเทอร์เฟซใหม่นี้มอบเทมเพลตสำเร็จรูปและตัวเลือกสไตล์ที่หลากหลายให้ผู้ใช้ ซึ่งช่วยลดอุปสรรคในการเริ่มต้นสร้างภาพที่ซับซ้อนหรือมีสไตล์เฉพาะได้อย่างมาก การเคลื่อนไหวครั้งนี้เน้นย้ำถึงกลยุทธ์ของ OpenAI ที่ให้ความสำคัญกับการทำให้เป็นผลิตภัณฑ์ที่ใช้ง่าย ทำให้เครื่องมือ AI ขั้นสูงสามารถเข้าถึงได้โดยตรงผ่านอินเทอร์เฟซแชทที่ผู้ใช้คุ้นเคย
ข้อมูลจำเพาะหลักและราคาของ GPT Image 1.5
- วันที่วางจำหน่าย: 17 ธันวาคม 2025
- ความเร็วที่อ้างอิง: เร็วกว่าโมเดลสร้างภาพรุ่นก่อนหน้าของ OpenAI 4 เท่า
- ราคา (ตามโทเค็น): คุณภาพสูง (1MP): ~133 USD ต่อภาพ 1,000 ภาพ คุณภาพต่ำ: ~9 USD ต่อภาพ 1,000 ภาพ
- ความพร้อมใช้งาน: บูรณาการใน ChatGPT สำหรับผู้ใช้ทุกคน; ปล่อย API แล้ว
ประสิทธิภาพและราคา: ภาพรวมมาตรฐานที่หลากหลาย
OpenAI ได้ใช้โมเดลราคาแบบใช้โทเคนสำหรับ GPT Image 1.5 โดยมีต้นทุนที่ปรับตามความละเอียดและคุณภาพที่ตั้งค่า สำหรับภาพคุณภาพสูงขนาดหนึ่งเมกะพิกเซล ราคาอยู่ที่ประมาณ 133 ดอลลาร์สหรัฐ ต่อการสร้างหนึ่งพันภาพ ในขณะที่ภาพคุณภาพต่ำมีราคาประมาณ 9 ดอลลาร์สหรัฐ ต่อการสร้างหนึ่งพันภาพ ผู้ใช้ ChatGPT ทุกคนได้รับสิทธิ์เข้าถึงโมเดลนี้ทันทีที่เปิดตัว พร้อมกับที่ API ของโมเดลก็พร้อมให้บริการสำหรับนักพัฒนาด้วย ในแง่ของมาตรฐานอย่างเป็นทางการ มีรายงานว่า GPT Image 1.5 ติดอันดับหนึ่งทั้งในกระดานผู้นำด้านการสร้างภาพจากข้อความและการแก้ไขภาพบนเว็บไซต์ Artificial Analysis แซงหน้า Google Nano Banana Pro และยังได้ตำแหน่งผู้นำที่คล้ายกันบน LMArena model arena ซึ่งบ่งชี้ถึงประสิทธิภาพที่แข็งแกร่งในสภาพแวดล้อมการทดสอบที่ควบคุมได้
ผลการทดสอบมาตรฐานที่รายงาน (ณ วันที่ 17 ธันวาคม 2025)
- Artificial Analysis: อันดับ 1 ในกระดานผู้นำ Text-to-Image และ Image Editing
- LMArena: อันดับ 1 ในกระดานผู้นำ Text-to-Image และ Image Editing
- หมายเหตุ: OpenAI ยังไม่ได้เปิดเผยข้อมูลการทดสอบมาตรฐานอย่างเป็นทางการของตนเอง## การทดสอบใช้งานจริงเผยให้เห็นสุนทรียะแบบ "หนืด" และปัญหาด้านรายละเอียด แม้จะมีคะแนนมาตรฐานที่น่าพอใจ แต่การทดสอบอิสระโดยสื่อเทคโนโลยีและผู้ใช้กลับเผยให้เห็นช่องว่างที่สังเกตได้ในคุณภาพผลลัพธ์ เมื่อสร้างฉากที่ซับซ้อน เช่น กลางคืนที่มีฝนตกในโตเกียวพร้อมองค์ประกอบที่ระบุหลายอย่าง ผลลัพธ์จาก GPT Image 1.5 มักถูกอธิบายว่ามี "ความรู้สึกแบบ AI" ที่ชัดเจน หรือความรู้สึกแบบ "หนืด" มีสีที่อิ่มตัวเกินไป และการผสมผสานระหว่างวัตถุเบื้องหน้าและพื้นหลังที่ไม่เป็นธรรมชาติ ยังพบข้อผิดพลาดสำคัญ เช่น การสร้างมือที่มีเพียงสี่นิ้ว ซึ่งถือเป็นความล้มเหลวขั้นพื้นฐานสำหรับโมเดลในยุคปี 2025 ในงานถ่ายโอนสไตล์ เช่น การสร้างฉากใหม่ในสไตล์ภาพThe Starry Night ของ Vincent van Gogh โมเดลนี้ประสบปัญหาในการจับคู่ลวดลายแปรงและโทนสีอันเป็นเอกลักษณ์ของผลงานต้นฉบับได้อย่างแม่นยำ ในขณะที่คู่แข่งทำสำเร็จ
ผลการทดสอบภาคปฏิบัติและชุมชน เทียบกับ Nano Banana Pro
| หัวข้อทดสอบ | ข้อสังเกตจาก GPT Image 1.5 | ข้อสังเกตจาก Nano Banana Pro (สำหรับเปรียบเทียบ) |
|---|---|---|
| ด้านสุนทรียภาพ | มักดู "หนืด" อิ่มสีเกินจริง มี "ความรู้สึกแบบ AI" | ดูเป็นธรรมชาติ มีคุณภาพเหมือนภาพถ่าย ความไม่สมบูรณ์แบบเล็กน้อยเพิ่มความสมจริง |
| ความแม่นยำของรายละเอียด | ต่อสู้กับคำสั่งที่ซับซ้อน (เช่น ขาดรายละเอียดมือ) มีแนวโน้มผิดพลาด เช่น กายวิภาคไม่ถูกต้อง | มีความแม่นยำสูงในการสร้างรายละเอียดตามคำสั่ง |
| การถ่ายโอนสไตล์ | อาจพลาดองค์ประกอบศิลปะหลัก (เช่น ลายแปรงของ Van Gogh) | เชื่อฟังต่อลักษณะเฉพาะของสไตล์ที่ร้องขอมากกว่า |
| กรณีขอบเขต | ประสิทธิภาพลดลงอย่างมีนัยสำคัญ (เช่น มุมมองบิดเบี้ยว) | จัดการกับคำสั่งที่ผิดปกติได้อย่างแข็งแกร่งกว่า |
| ความเร็ว | เร็วก่อนรุ่นก่อนหน้า แต่รายงานว่าช้ากว่า Nano Banana Pro ในบางการทดสอบ | ถูกบันทึกไว้ว่ามีเวลาสร้างภาพเร็ว (~15 วินาทีในการทดสอบหนึ่ง) |
| จุดแข็ง | การทำตามคำสั่งสำหรับการแก้ไขดี, การหลอมรวมองค์ประกอบหลายอย่างดี, การผสานเข้ากับผลิตภัณฑ์ยอดเยี่ยม | มีพื้นฐานความสมจริงและความสม่ำเสมอของรายละเอียดสูง |
กรณีพิเศษและความสมจริงยังตามหลังคู่แข่ง
จุดอ่อนของโมเดลจะเด่นชัดมากขึ้นในสถานการณ์กรณีพิเศษ คำสั่งที่ขอให้สร้างภาพจากมุมมองบุคคลที่หนึ่งของแมว ส่งผลให้ได้ภาพที่บิดเบือนอย่างรุนแรง มีรายละเอียดที่ไม่สอดคล้องกัน และไม่สามารถสื่อมุมมองที่ขอได้อย่างน่าเชื่อถือ ในการเปรียบเทียบแบบเคียงข้างกันที่แชร์กันออนไลน์ ภาพบุคคลที่สร้างโดย GPT Image 1.5 มักแสดงปัญหาเรื่องสัดส่วน เช่น ศีรษะที่ใหญ่เกินไป และแสงที่ดูเป็นธรรมชาติน้อยกว่าเมื่อเทียบกับภาพจาก Nano Banana Pro ผู้ใช้สังเกตว่าผลลัพธ์จาก Nano Banana Pro บางครั้งมีข้อบกพร่องเล็กน้อย เช่น หน้าต่างที่สว่างจ้าเกินไปเล็กน้อย ซึ่งกลับช่วยเพิ่มความรู้สึกสมจริงแบบภาพถ่ายให้มากขึ้น บางคนที่ทดสอบพบว่าผลลัพธ์ของ GPT Image 1.5 สามารถปรับปรุงได้โดยเพิ่มคำสั่งเฉพาะทางภาพถ่าย เช่น "unprocessed iPhone photo" ลงในคำสั่ง ซึ่งชี้ให้เห็นว่าสุนทรียะพื้นฐานของมันถูกประมวลผลมากเกินไป
จุดแข็งด้านการแก้ไขและการหลอมรวมหลายองค์ประกอบ
จุดที่ GPT Image 1.5 แสดงให้เห็นถึงศักยภาพอย่างมากคือความสามารถในการแก้ไขภาพและประกอบภาพ OpenAI สาธิตความสามารถของโมเดลในการสลับองค์ประกอบที่ซับซ้อน เช่น การเปลี่ยนสีเสื้อผ้า ประเภทยานพาหนะ และป้ายถนนภายในภาพที่มีอยู่เดิมด้วยความแม่นยำสูง นอกจากนี้ยังรองรับการหลอมรวมหลายองค์ประกอบ เช่น การวางคนหลายคนและสุนัขลงในฉากเดียวที่เชื่อมโยงกันอย่างน่าเชื่อถือตามคำอธิบาย เทมเพลตสไตล์ที่มีอยู่ภายในช่วยให้สามารถเปลี่ยนแปลงได้รวดเร็ว เช่น การเปลี่ยนภาพบุคคลในองค์กรให้กลายเป็นหน้าปกเทปออกกำลังกายสไตล์ VHS ในยุค 80 หรือเปลี่ยนฉากให้เป็นสุนทรียะสีชมพูแบบเกมตุ๊กตาในยุคต้นปี 2000 ซึ่งแสดงให้เห็นถึงประโยชน์ของมันสำหรับการรีมิกซ์สร้างสรรค์อย่างรวดเร็ว
สรุป: ผลิตภัณฑ์ที่สมบูรณ์แบบรอการพัฒนาผ่านโมเดล
การเปิดตัว GPT Image 1.5 เป็นการอัปเดตแบบค่อยเป็นค่อยไปที่แข็งแกร่งจาก OpenAI ซึ่งโดดเด่นในด้านประสบการณ์ผู้ใช้ ความเร็ว และการควบคุมสร้างสรรค์ผ่านการแก้ไขและเทมเพลต การผสานรวมที่ราบรื่นเข้ากับ ChatGPT ทำให้การสร้างภาพอันทรงพลังสามารถเข้าถึงได้ง่ายกว่าที่เคย อย่างไรก็ตาม ฉันทามติจากการทดสอบเบื้องต้นคือ โมเดลหลักยังคงตามหลังเทคโนโลยีล่าสุดในปัจจุบันในด้านสำคัญ เช่น ความสมจริง ความสม่ำเสมอของรายละเอียด และความน่าเชื่อถือกับคำสั่งที่ซับซ้อนหรือไม่ปกติ ในตลาดที่ความคาดหวังของผู้ใช้ถูกยกระดับขึ้นอย่างมากโดยคู่แข่ง GPT Image 1.5 มอบประสบการณ์ผลิตภัณฑ์ที่เหนือกว่า แต่ยังมีพื้นที่ให้ปรับปรุงในเครื่องมือสร้างภาพพื้นฐาน การตอบรับจากตลาดในท้ายที่สุดจะขึ้นอยู่กับว่าผู้ใช้ให้คุณค่ากับขั้นตอนการทำงานที่ราบรื่นเหนือความเที่ยงตรงสูงสุดของผลลัพธ์มากน้อยเพียงใด
