OpenAI ตอบโต้ด้วย GPT-5.2: หมัดหนักที่ทรงพลังแต่ราคาสูงเพื่อรับมือ Gemini

ทีมบรรณาธิการ BigGo

OpenAI ตอบโต้ด้วย GPT-5.2: หมัดหนักที่ทรงพลังแต่ราคาสูงเพื่อรับมือ Gemini

ในจังหวะเชิงกลยุทธ์ที่ตรงกับวาระครบรอบ 10 ปี OpenAI ได้เปิดตัว GPT-5.2 ครอบครัวใหม่ของโมเดล AI ที่วางตำแหน่งให้ทรงพลังที่สุดเท่าที่เคยมีมา การเปิดตัวครั้งนี้เกิดขึ้นทันทีหลังจากมีบันทึกข้อความภายใน "สถานการณ์ฉุกเฉินร้ายแรง" (code red) จากซีอีโอ Sam Altman ซึ่งยอมรับถึงแรงกดดันการแข่งขันที่รุนแรง โดยเฉพาะจาก Google Gemini GPT-5.2 เป็นความพยายามหลายด้านเพื่อกอบกู้ตำแหน่งผู้นำกลับคืนมา โดยอ้างถึงการพัฒนาอย่างก้าวกระโดดในผลการทดสอบมาตรฐาน (benchmark) ความสามารถในการให้เหตุผลที่ดียิ่งขึ้น และความสามารถด้านการประมวลผลภาพที่พัฒนาขึ้น อย่างไรก็ตาม การทดสอบใช้งานจริงในระยะแรกและราคาที่ปรับขึ้นอย่างมาก ทำให้เกิดคำถามว่าการอัปเดตครั้งนี้ให้คุณค่าพอที่จะดึงดูดผู้ใช้ที่ย้ายไปใช้แพลตฟอร์มคู่แข่งกลับมาหรือไม่

กลุ่มโมเดลสามแบบสำหรับความต้องการที่ต่างกัน

OpenAI ได้จัดโครงสร้าง GPT-5.2 เป็นครอบครัวโมเดลสามรุ่น โดยแต่ละรุ่นมุ่งเป้าไปที่การใช้งานเฉพาะด้าน โมเดล GPT-5.2 Instant ถูกปรับให้เหมาะกับความเร็ว รับมือกับคำถามทั่วไป เช่น การค้นหาข้อมูลและการแปลภาษา สำหรับงานที่มีโครงสร้างซับซ้อนมากขึ้น เช่น การเขียนโปรแกรม การวิเคราะห์เอกสารยาว และการวางแผนโครงการ โมเดล GPT-5.2 Thinking คือตัวเลือกที่แนะนำ ส่วนรุ่นสูงสุดคือ GPT-5.2 Pro ซึ่งออกแบบมาสำหรับปัญหาที่สำคัญยิ่ง (mission-critical) ที่ต้องการความแม่นยำและความน่าเชื่อถือสูงสุด แม้จะแลกมาด้วยความเร็วที่ช้าลงและค่าใช้จ่ายที่สูงขึ้นอย่างมาก ทั้งสามเวอร์ชันกำลังเริ่มทยอยเปิดให้ผู้ใช้ ChatGPT ที่เป็นสมาชิกแบบชำระเงินใช้งาน โดย OpenAI ระบุว่าการเปิดตัวจะค่อยเป็นค่อยไปเพื่อรักษาความเสถียรของบริการ

ตระกูลโมเดล GPT-5.2

โมเดล	กรณีการใช้งานหลัก	คุณลักษณะสำคัญ
GPT-5.2 Instant	การสอบถามประจำวัน การค้นหาข้อมูล การเขียน การแปลภาษา	ปรับให้เร็วที่สุด
GPT-5.2 Thinking	การเขียนโปรแกรม การวิเคราะห์เอกสารยาว คณิตศาสตร์ การวางแผนโครงการ	งานที่ซับซ้อน มีโครงสร้าง
GPT-5.2 Pro	ปัญหาที่สำคัญยิ่งยวดซึ่งต้องการความแม่นยำสูงสุด	ความน่าเชื่อถือสูงสุด ช้าที่สุด แพงที่สุด

ราคาที่รายงาน (ต่อล้านโทเค็น)

GPT-5.2 Pro: อินพุต: USD 21, เอาต์พุต: USD 168
หมายเหตุ: โดยรวมแล้ว ราคาถูกรายงานว่าสูงกว่า GPT-5.1 ประมาณ 40%

ข้ออ้างอิงจากมาตรวัดประสิทธิภาพหลัก

ARC-AGI-1: GPT-5.2 Pro เป็นครั้งแรกที่ได้คะแนน >90%
AIME 2025: GPT-5.2 Pro ได้คะแนน 100% โดยไม่ใช้เครื่องมือช่วย
SWE-Bench Pro: GPT-5.2 Thinking ได้คะแนน 55.6%
การลดภาพหลอน: ลดลง 38% เมื่อเทียบกับ GPT-5.1 Thinking
บริบทยาว (MRCRv2): ความแม่นยำเกือบ 100% ในงานที่ใช้โทเค็น 256k

ความเป็นเจ้าแห่งผลทดสอบและคำมั่นสัญญาในทางปฏิบัติ

บนกระดาษ GPT-5.2 สร้างสถิติใหม่ OpenAI อ้างว่ารุ่น Pro เป็นโมเดลแรกที่ทำคะแนนทะลุเกณฑ์ 90% ในแบบทดสอบการให้เหตุผลที่ท้าทายอย่าง ARC-AGI-1 และทำคะแนนเต็มในการแข่งขันคณิตศาสตร์ AIME 2025 โดยไม่ใช้เครื่องมือช่วย ในแบบทดสอบความรู้ระดับมืออาชีพ รุ่น Thinking ทำได้ในระดับผู้เชี่ยวชาญในกว่า 70% ของกรณีศึกษา และทำงานเสร็จเร็วกว่ามืออาชีพที่เป็นมนุษย์ถึงกว่า 11 เท่า สำหรับวิศวกรรมซอฟต์แวร์ มันได้คะแนน 55.6% ในแบบทดสอบ SWE-Bench Pro ซึ่งแซงหน้าคู่แข่งอย่าง Claude 4.5 Sonnet และ Gemini 3 Pro โมเดลเหล่านี้ยังแสดงให้เห็นถึงการพัฒนาอย่างมากในการลดการหลงผิดทางข้อเท็จจริง (hallucinations) ลง 38% และในการทำความเข้าใจบริบทยาว (long-context) โดยเข้าใกล้ความแม่นยำ 100% ในแบบทดสอบที่ต้องการการสังเคราะห์ข้อมูลข้ามโทเค็นจำนวน 256,000 โทเค็น

ความเป็นจริงของประสิทธิภาพในการใช้งานจริง

แม้คะแนนจากแบบทดสอบจะน่าประทับใจ แต่ประสบการณ์ผู้ใช้ในระยะแรกกลับวาดภาพที่ซับซ้อนกว่า ผู้ใช้กลุ่มแรกรายงานว่าความสามารถในการให้เหตุผลที่พัฒนาขึ้นของโมเดล Thinking และ Pro มาพร้อมกับต้นทุนที่จับต้องได้ นั่นคือเวลาตอบสนองที่ช้าลงมาก งานที่ต้องการการให้เหตุผลซับซ้อน เช่น การสร้างแผนภูมิจากข้อมูล อาจใช้เวลามากกว่า 20 นาทีกับโมเดล Pro ในการทดสอบเชิงสร้างสรรค์ เช่น การสร้างฉาก 3 มิติด้วย Three.js หรือการจำลองดีไซน์เว็บไซต์จากภาพหน้าจอ GPT-5.2 แสดงให้เห็นถึงการพัฒนาที่ชัดเจนเมื่อเทียบกับรุ่นก่อนหน้า อย่างไรก็ตาม การเปรียบเทียบกับคู่แข่งนั้นมีทั้งดีและด้อย มันสามารถสร้างโค้ดที่ใช้งานได้สำหรับแอปพลิเคชัน เช่น กล้องเว็บสไตล์ Polaroid แต่ผลลัพธ์ของมันในด้านต่างๆ เช่น การอธิบายภาพประกอบ (annotation) และการออกแบบเชิงสุนทรียภาพบางประเภท ยังถูกมองว่าตามหลังคู่แข่งเฉพาะทางอย่าง Google Nano Banana อยู่

บริบทการแข่งขัน (ณ เวลาที่เปิดตัว)

คู่แข่งหลัก: โมเดล Gemini ของ Google
การเคลื่อนไหวล่าสุดของ Google: ออกแบบตัวแทน Gemini Deep Research ใหม่ พร้อมใช้งานผ่าน API
การทดสอบแบบตัวต่อตัว (HLE): ตัวแทน Gemini Deep Research ได้คะแนน 46.4% เทียบกับ GPT-5.2 Thinking ที่ 45.5%
ช่องว่างโมเดลภาพ: เครื่องสร้างภาพของ OpenAI (DALL-E) ยังไม่ได้รับการอัปเดตด้วย GPT-5.2 ในขณะที่ Nano Banana ของ Google นำหน้าในงานด้านภาพ เช่น การอธิบายภาพ
ขอบเขตความรู้: GPT-5.2 อัปเดตถึงเดือนสิงหาคม 2025 (เทียบกับ GPT-5.1 ที่สิงหาคม 2024)

โครงสร้างราคาใหม่ที่สูงขึ้นอย่างมาก

หนึ่งในผลกระทบที่เห็นได้ชัดเจนที่สุดสำหรับนักพัฒนาคือต้นทุนที่เพิ่มขึ้นอย่างมีนัยสำคัญ เมื่อเทียบกับ GPT-5.1 ราคาของครอบครัวโมเดล GPT-5.2 เพิ่มขึ้นประมาณ 40% GPT-5.2 Pro รุ่นหลัก (flagship) ถูกตั้งราคาอยู่ที่ 21 ดอลลาร์สหรัฐ ต่อล้านโทเค็นอินพุต และ 168 ดอลลาร์สหรัฐ ต่อล้านโทเค็นเอาต์พุต ซึ่งวางมันไว้ในระดับพรีเมียมใกล้เคียงกับโมเดลอย่าง Claude Opus การปรับราคาขึ้นครั้งนี้เปลี่ยนสมการคุณค่า (value proposition) ทำให้ความสามารถขั้นสูงของโมเดลกลายเป็นการลงทุนที่ต้องพิจารณาอย่างรอบคอบมากขึ้น โดยเฉพาะสำหรับแอปพลิเคชันที่ใช้งานปริมาณสูง

ภูมิทัศน์การแข่งขันยังคงดุเดือด

การเปิดตัวของ OpenAI ไม่ได้เกิดขึ้นในสุญญากาศ Google ยังคงพัฒนาต่อยอด Gemini อย่างต่อเนื่อง โดยล่าสุดได้ออกแบบตัวแทน Deep Research ใหม่และทำให้สามารถเข้าถึงได้ผ่าน API ในบางการทดสอบแบบตัวต่อตัว เช่น การสอบ Human-Level Exam (HLE) ตัวแทนใหม่ของ Gemini ได้คะแนน 46.4% ซึ่งนำหน้า GPT-5.2 Thinking ที่ได้ 45.5% เล็กน้อย สิ่งนี้บ่งชี้ว่าแม้ GPT-5.2 อาจชนะในบางสมรภูมิบนแบบทดสอบเฉพาะด้าน แต่สงครามโดยรวมเพื่อความเป็นเจ้าแห่ง AI ยังห่างไกลจากข้อสรุป แรงกดดันการแข่งขันแบบ "สถานการณ์ฉุกเฉินร้ายแรง" (code red) ที่กระตุ้นให้เกิดการเปิดตัวครั้งนี้มีแนวโน้มจะคงอยู่ต่อไป

มองไปข้างหน้า: การสร้างภาพและการปรับปรุง

OpenAI ได้ยอมรับถึงด้านที่ยังต้องพัฒนาต่อไป รวมถึงการทำงานเกี่ยวกับการ "ปฏิเสธเกินเหตุ" (over-refusals) ใน ChatGPT และการเพิ่มความน่าเชื่อถือของการตอบกลับ สิ่งที่ขาดหายไปจากการเปิดตัวครั้งนี้คือการอัปเดตเครื่องมือสร้างภาพ DALL-E ของบริษัท มีรายงานว่ามีแผนสำหรับโมเดลใหม่ที่มีความสามารถด้านภาพที่ดีขึ้นในช่วงต้นปีหน้า นอกจากนี้ บริษัทยังมีรายงานว่ากำลังพิจารณาผ่อนคลายข้อจำกัดเกี่ยวกับการสร้างเนื้อหาสำหรับผู้ใหญ่ในโมเดลของตน ซึ่งอาจเปิดโอกาสการใช้งานใหม่ๆ แต่ก็อาจนำมาซึ่งความขัดแย้งได้เช่นกัน

สรุป: ก้าวที่มั่นคง แต่ไม่ใช่หมัดน็อกเอาต์

GPT-5.2 เป็นการอัปเดตที่สำคัญและน่าประทับใจในเชิงเทคนิคจาก OpenAI ซึ่งส่งมอบความก้าวหน้าที่วัดผลได้ในด้านการให้เหตุผล ความรู้ และความเป็นหลายรูปแบบ (multimodality) มันตอบโต้เรื่องเล่าของความหยุดนิ่ง (stagnation) ได้สำเร็จ และมอบเครื่องมือใหม่ที่ทรงพลังสำหรับนักพัฒนาและองค์กรธุรกิจ อย่างไรก็ตาม ความเร็วที่ช้าลงในโหมดขั้นสูง ต้นทุนที่สูง และจังหวะการพัฒนานวัตกรรมที่ไม่หยุดหย่อนจากคู่แข่ง ทำให้มันไม่น่าจะเป็นหมัดเด็ดที่สามารถยึดตลาดคืนมาได้อย่างเด็ดขาด สำหรับผู้ใช้ การเลือกในตอนนี้เกี่ยวข้องกับการคำนวณที่ซับซ้อนมากขึ้นระหว่างความสามารถดิบ ความเร็ว ต้นทุน และความต้องการเฉพาะของขั้นตอนการทำงาน สัญญาณเตือน "สีแดง" ของ Sam Altman อาจหรี่ลงเล็กน้อย แต่ยังไม่ดับสนิทแน่นอน

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌