OpenAI เปิดตัว GPT-5.2 ท่ามกลางแรงกดดัน "Code Red" อ้างประสิทธิภาพเพิ่มขึ้นอย่างมาก

ทีมบรรณาธิการ BigGo
OpenAI เปิดตัว GPT-5.2 ท่ามกลางแรงกดดัน "Code Red" อ้างประสิทธิภาพเพิ่มขึ้นอย่างมาก

ในการเคลื่อนไหวที่เต็มไปด้วยความเสี่ยงภายในภูมิทัศน์ AI ที่มีการแข่งขันสูง OpenAI ได้เปิดตัว GPT-5.2 อย่างเป็นทางการแล้ว ซึ่งเป็นโมเดลภาษาล่าสุดที่เป็นเรือธงของบริษัท การเปิดตัวครั้งนี้เกิดขึ้นหลังจากมีการประกาศ "code red" ภายในบริษัท ขณะที่บริษัทเผชิญกับแรงกดดันที่ไม่เคยมีมาก่อนจากคู่แข่งอย่าง Google Gemini 3 ซึ่งบังคับให้ต้องปรับกลยุทธ์เพื่อมุ่งเน้นไปที่ผลิตภัณฑ์และเทคโนโลยีหลักของตนอีกครั้ง

บริบทของ "Code Red" และการเปลี่ยนกลยุทธ์

การเปิดตัว GPT-5.2 ไม่สามารถแยกออกจากสภาพแวดล้อมการแข่งขันที่เข้มข้นที่ OpenAI ต้องเผชิญอยู่ในปัจจุบันได้ Sam Altman ซีอีโอเพิ่งประกาศ "code red" ภายในบริษัท ซึ่งเป็นคำสั่งทั่วทั้งองค์กรเพื่อระดมทรัพยากรไปสู่การปรับปรุง ChatGPT สถานการณ์เร่งด่วนนี้เป็นการตอบสนองโดยตรงต่อความท้าทายที่น่าเกรงขามจากคู่แข่ง โดยเฉพาะอย่างยิ่ง Google แอป Gemini ของ Google เติบโตจนมีผู้ใช้งานรายเดือนมากกว่า 650 ล้านคน สร้างแรงกดดันอย่างมีนัยสำคัญต่อฐานผู้ใช้งานรายสัปดาห์ 800 ล้านคนที่ OpenAI รายงาน การแข่งขันนี้ทำให้ OpenAI ต้องระงับโครงการที่ทะเยอทะยานบางอย่าง เช่น การนำโฆษณาเข้ามาใน ChatGPT เพื่อทุ่มเททรัพยากรให้กับการปรับปรุงโมเดลพื้นฐานและประสบการณ์ผู้ใช้

บริบทการแข่งขัน (ข้อมูลผู้ใช้ ณ สิ้นปี 2025):

  • OpenAI ChatGPT: ผู้ใช้งานรายสัปดาห์ ~800 ล้านคน
  • Google Gemini App: ผู้ใช้งานรายเดือน >650 ล้านคน

GPT-5.2: ชุดโมเดลเฉพาะทางสามรูปแบบ

ต่างจากการเปิดตัวโมเดลเดี่ยวขนาดใหญ่ GPT-5.2 ถูกส่งออกมาในรูปแบบของโมเดลที่แตกต่างกันสามรูปแบบ โดยแต่ละโมเดลได้รับการปรับให้เหมาะสมกับงานที่ต่างกัน โมเดล GPT-5.2 Instant ให้ความสำคัญกับความเร็วและออกแบบมาสำหรับการค้นหาข้อมูลอย่างรวดเร็ว สำหรับการให้เหตุผลที่ซับซ้อนมากขึ้น รูปแบบ GPT-5.2 Thinking มีความเชี่ยวชาญในงานที่เกี่ยวข้องกับการเขียนโค้ด คณิตศาสตร์ และการวางแผนเชิงกลยุทธ์ ในระดับสูงสุด GPT-5.2 Pro ทำหน้าที่เป็นตัวเลือกที่มีประสิทธิภาพสูงสุด โดยมุ่งเป้าไปที่การให้ความแม่นยำที่สูงขึ้นสำหรับคำถามที่ยากและซับซ้อนที่สุด แนวทางแบบแบ่งระดับนี้ช่วยให้ผู้ใช้และนักพัฒนาสามารถเลือกสมดุลที่เหมาะสมระหว่างความสามารถและประสิทธิภาพตามความต้องการเฉพาะของพวกเขา

รุ่นโมเดล GPT-5.2:

  • GPT-5.2 Instant: ปรับให้เหมาะสมสำหรับความเร็วและการค้นหาข้อมูล
  • GPT-5.2 Thinking: โดดเด่นในงานที่ซับซ้อน เช่น การเขียนโค้ด คณิตศาสตร์ และการวางแผน
  • GPT-5.2 Pro: ระดับที่ทรงพลังที่สุดสำหรับความแม่นยำสูงสุดในคำถามที่ยาก

ประสิทธิภาพตามเกณฑ์มาตรฐานและการอ้างว่า "เทียบเท่ามนุษย์"

OpenAI กำลังอ้างสิทธิ์อย่างกล้าหาญเกี่ยวกับความสามารถของ GPT-5.2 โดยเฉพาะอย่างยิ่งสำหรับรุ่น "Thinking" บริษัทรายงานว่าในเกณฑ์มาตรฐานภายใน GDPval ของบริษัท ซึ่งเปรียบเทียบประสิทธิภาพของ AI กับผู้เชี่ยวชาญที่เป็นมนุษย์ใน 44 อาชีพในโลกแห่งความเป็นจริง GPT-5.2 Thinking ทำได้ดีกว่ามนุษย์ในงานมากกว่า 70% และที่น่าประหลาดใจยิ่งกว่านั้นคือ มันทำงานเหล่านี้เสร็จเร็วกว่าคู่แข่งที่เป็นมนุษย์ประมาณสิบเอ็ดเท่า สิ่งนี้วางตำแหน่งโมเดลดังกล่าวเป็นก้าวสำคัญสู่ AI ที่สามารถเทียบเคียงหรือเกินผลลัพธ์ของมนุษย์ที่เป็นมืออาชีพในหลากหลายสาขา ตั้งแต่การเขียนและการวิเคราะห์ไปจนถึงการแก้ปัญหาทางเทคนิค

รายงานข้ออ้างเกี่ยวกับประสิทธิภาพ (GPT-5.2 Thinking):

  • เกณฑ์มาตรฐาน GDPval: ทำผลงานได้ดีกว่าผู้เชี่ยวชาญมนุษย์ในงานมากกว่า 70% จาก 44 อาชีพ
  • ความเร็ว: ดำเนินการงานตามเกณฑ์มาตรฐานเสร็จเร็วกว่ามนุษย์ประมาณ 11 เท่า
  • การลดภาพหลอน: มีภาพหลอนน้อยลง 38% เมื่อเทียบกับ GPT-5.1 ในเกณฑ์มาตรฐานเชิงข้อเท็จจริง

การจัดการกับอาการหลอนและการโต้ตอบที่ละเอียดอ่อน

พื้นที่สำคัญของการปรับปรุงสำหรับโมเดลภาษาขนาดใหญ่ใดๆ คือการลด "อาการหลอน" ซึ่งคือการสร้างข้อมูลที่ฟังดูน่าเชื่อถือแต่ไม่ถูกต้องหรือถูกแต่งขึ้น OpenAI อ้างว่า GPT-5.2 Thinking มีอาการหลอนน้อยกว่า GPT-5.1 รุ่นก่อนหน้า 38% ในการวัดความแม่นยำตามข้อเท็จจริง นอกเหนือจากประสิทธิภาพดิบแล้ว บริษัทยังมุ่งเน้นไปที่พฤติกรรมของโมเดลในสถานการณ์ที่ละเอียดอ่อนอีกด้วย OpenAI ระบุว่าบริษัทได้ดำเนินการเสริมความแข็งแกร่งให้กับการตอบสนองของ ChatGPT ต่อคำขอที่บ่งชี้ถึงการทำร้ายตัวเอง ความทุกข์ทางสุขภาพจิต หรือการพึ่งพาอารมณ์ที่ไม่ดีต่อ AI อย่างต่อเนื่อง นอกจากนี้ บริษัทกำลังเริ่มดำเนินการเปิดตัวระบบการคาดการณ์อายุแบบเป็นขั้นตอนเพื่อใช้การป้องกันเนื้อหาอัตโนมัติสำหรับผู้ใช้ที่บริษัทประเมินว่าอายุต่ำกว่า 18 ปี โดยมีแผนสำหรับ "โหมดผู้ใหญ่" สำหรับผู้ใช้ที่มีอายุมากกว่า 18 ปี ซึ่งกำหนดไว้สำหรับไตรมาสแรกของปี 2026

การรั่วไหลของ "Afternoon Tea" และข่าวลือเกี่ยวกับโมเดลภาพ

ควบคู่ไปกับการประกาศอย่างเป็นทางการของ GPT-5.2 มีเรื่องราวแยกต่างหากที่เกิดขึ้นจากชุมชนนักพัฒนา ก่อนการเปิดตัว มีการค้นพบการอ้างอิงถึงชื่อรหัสภายใน เช่น "Olive Oil Cake" (ซึ่งเชื่อกันอย่างกว้างขวางว่าเป็น GPT-5.2) และ "Chestnut and Hazelnut" ซึ่งจุดประกายการคาดเดาเกี่ยวกับชุดโมเดลใหม่ทั้งหมด ชื่อรหัสหลังนี้ถูกสงสัยอย่างมากว่าหมายถึงโมเดลการสร้างภาพรุ่นต่อไปของ OpenAI ซึ่งอาจมีชื่อว่า Image-2 และ Image-2-mini ข้อมูลการทดสอบที่รั่วไหลออกมาแนะนำว่าโมเดลเหล่านี้มีเป้าหมายเพื่อแก้ไขปัญหาที่มีชื่อเสียงจากรุ่นก่อนหน้า เช่น สีเหลืองที่ปรากฏอย่างต่อเนื่อง ในขณะเดียวกันก็เพิ่มความละเอียดของรายละเอียดอย่างมีนัยสำคัญและแนะนำความสามารถใหม่ๆ เช่น การสร้างโค้ดจากภาพ แม้ว่าจะยังไม่ได้รับการยืนยันโดย OpenAI แต่ "afternoon tea" ของโมเดลเหล่านี้แสดงถึงการแข่งขันทางเทคโนโลยีในวงกว้าง โดยบริษัทมีเป้าหมายที่จะปิดช่องว่างที่รับรู้ได้กับคู่แข่งอย่างโมเดลภาพของ Google

ข้อมูลรัมเมอร์/หลุดออกมาเกี่ยวกับโมเดล "Afternoon Tea" (ไม่เป็นทางการ):

  • Olive Oil Cake: ชื่อรหัสภายในที่เกี่ยวข้องอย่างมากกับ GPT-5.2
  • Chestnut: ชื่อรหัสที่คาดการณ์ว่าเป็นโมเดลภาพรุ่นใหม่ "Image-2" (มาตรฐาน)
  • Hazelnut: ชื่อรหัสที่คาดการณ์ว่าเป็นโมเดลภาพแบบเบา "Image-2-mini"

อนาคตข้างหน้า: ความเพลิดเพลินเทียบกับความสามารถ

ความท้าทายที่คงอยู่สำหรับ OpenAI อยู่ที่การสร้างสมดุลระหว่างความสามารถดิบกับประสบการณ์ผู้ใช้ การเปิดตัว GPT-5 รุ่นดั้งเดิมในช่วงต้นปี 2025 ถูกตอบรับจากผู้ใช้ด้วยการต่อต้านต่อโทนเสียงของโมเดลที่รับรู้ว่า "เย็นชา" และมีส่วนร่วมน้อยลง ซึ่งเป็นปัญหาด้านคุณภาพที่ไม่ถูกบันทึกโดยเกณฑ์มาตรฐานทั่วไป ด้วย GPT-5.2 บริษัทต้องนำทางผ่านความตึงเครียดระหว่างการสร้างโมเดลที่เพลิดเพลินและมีส่วนร่วมในการโต้ตอบ ซึ่งจะช่วยขับเคลื่อนการใช้งานรายวัน และหลีกเลี่ยงข้อผิดพลาดของการสร้าง AI ที่ประจบสอพลอหรือยินยอมมากเกินไป การจัดการสมดุลนี้ได้สำเร็จเป็นสิ่งสำคัญเนื่องจากแรงกดดันจากการแข่งขันเพิ่มขึ้นเพื่อขยายและรักษาฐานผู้ใช้ ChatGPT

สรุป: การเล่นรับในตลาดที่เต็มไปด้วยการรุก

การเปิดตัว GPT-5.2 นั้นไม่ใช่การเปิดเผยที่ประสบชัยชนะ แต่เป็นการเคลื่อนไหวเชิงกลยุทธ์และป้องกันมากกว่า มันบ่งบอกถึงการเปลี่ยนผ่านของ OpenAI จากผู้นำตลาดที่ไม่มีข้อโต้แย้งไปสู่ผู้แข่งขันในสนามที่แออัดและก้าวหน้าอย่างรวดเร็ว แม้ว่าการปรับปรุงเกณฑ์มาตรฐานของโมเดลในการให้เหตุผล การเขียนโค้ด และการลดอาการหลอนจะเป็นสิ่งสำคัญในเชิงสาระ แต่การทดสอบที่แท้จริงจะอยู่ที่การยอมรับและความพึงพอใจของผู้ใช้ในวงกว้าง ในขณะที่ Google, Meta และบริษัทอื่นๆ ยังคงก้าวหน้าต่อไป "code red" ของ OpenAI สะท้อนให้เห็นถึงความเป็นจริงใหม่: ในการแข่งขัน AI แม้แต่ผู้บุกเบิกก็ต้องวิ่งเร็วเพื่อรักษาความเป็นผู้นำ ประสิทธิภาพของ GPT-5.2 พร้อมกับโมเดลภาพที่จะมาถึง จะเป็นตัวกำหนดว่าความพยายามล่าสุดนี้จะเพียงพอที่จะรักษาตำแหน่งของบริษัทไว้ที่แนวหน้าของอุตสาหกรรมได้หรือไม่