โมเดล GPT-5 ที่รอคอยกันอย่างใจจดใจจ่อของ OpenAI ได้เปิดตัวแล้วท่ามกลางเสียงผิดหวังอย่างล้นหลาม ซึ่งถือเป็นการเปลี่ยนแปลงครั้งสำคัญจากการทำนายอย่างกล้าหาญของ CEO Sam Altman เกี่ยวกับปัญญาประดิษฐ์ระดับเหนือมนุษย์ที่กำลังจะมาถึง การเปิดตัวครั้งนี้ถือเป็นสิ่งที่หลายคนมองว่าเป็นการตรวจสอบความเป็นจริงอย่างเข้มงวดสำหรับการอ้างที่ทะเยอทะยานที่สุดของอุตสาหกรรม AI
ประสิทธิภาพทางเทคนิคแสดงผลลัพธ์ที่หลากหลาย
โมเดลใหม่แสดงให้เห็นการปรับปรุงแบบค่อยเป็นค่อยไปในบางด้าน ขณะที่ล้าหลังในด้านอื่นๆ GPT-5 มีประสิทธิภาพดีกว่ารุ่นก่อนหน้า GPT-4o ในงานต่างๆ เช่น การสร้างเกมหมากรุกและการเขียนสคริปต์วิดีโอ และสามารถจัดสรรโมเดลที่เหมาะสมที่สุดสำหรับงานเฉพาะได้อย่างชาญฉลาด อย่างไรก็ตาม มันมีปัญหาในการสร้างภาพ เช่น ภาพขนาดย่อของ YouTube และการ์ดเชิญงานวันเกิด ซึ่ง GPT-4o ยังคงมีความเหนือกว่า
ที่น่ากังวลมากกว่าคือปัญหาทางเทคนิคที่รบกวนการเปิดตัว ผู้ใช้รายงานการตอบสนองที่ช้า การเกิดภาพลวงตา และข้อผิดพลาดที่น่าแปลกใจ กลไกการสลับโมเดลระหว่าง GPT-5 และ GPT-4o เสียหาย สร้างความหงุดหงิดให้กับลูกค้าที่จ่ายเงินซึ่งคาดหวังประสบการณ์ระดับพรีเมียม
ผลการทดสอบมาตรฐานเผยให้เห็นความก้าวหน้าที่จำกัด
ประสิทธิภาพในการทดสอบมาตรฐาน AI ที่ได้รับการยอมรับเล่าเรื่องที่เข้มงวดเกี่ยวกับความสามารถของ GPT-5 ใน Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI-2) GPT-5 ได้คะแนนเพียง 9.9% ซึ่งตามหลัง Grok-4 ของ Elon Musk อย่างมีนัยสำคัญที่ 15.9% แม้แต่ในการทดสอบ ARC-AGI-1 รุ่นเก่า GPT-5 ได้ความแม่นยำ 67.5% ซึ่งต่ำกว่าโมเดล o3 ของ OpenAI เอง ที่ได้คะแนน 76% ในเดือนธันวาคม 2024
ประสิทธิภาพการเขียนโค้ดเป็นอีกความผิดหวังหนึ่ง แม้ว่า GPT-5 จะแสดงการปรับปรุงในการวิเคราะห์ repository โค้ด การทดสอบเผยให้เห็นว่ามันเป็นการถอยหลังในความสามารถการเขียนโค้ดโดยรวม ไม่สามารถส่งมอบความก้าวหน้าที่เปลี่ยนเกมได้ตามที่หลายคนคาดหวัง
การเปรียบเทียบผลงานเชิงแข่งขัน:
- Grok-4 ( xAI ): 15.9% บน ARC-AGI-2
- GPT-5 ( OpenAI ): 9.9% บน ARC-AGI-2
- โมเดล OpenAI o3 : 76% บน ARC-AGI-1 (ธันวาคม 2024)
- GPT-5 : 67.5% บน ARC-AGI-1
ปัญหากฎการขยายขนาด
ประสิทธิภาพที่ไม่น่าประทับใจของ GPT-5 ได้จุดประกายการถกเถียงเกี่ยวกับสมมติฐานพื้นฐานที่ขับเคลื่อนการพัฒนา AI ขึ้นมาใหม่ กฎการขยายขนาด ซึ่งแนะนำว่าการเพิ่มขนาดโมเดลและความเข้มข้นของการฝึกอบรมเพียงอย่างเดียวจะปรับปรุงประสิทธิภาพอย่างต่อเนื่อง ดูเหมือนจะสูญเสียพลังในการทำนาย หลักการนี้ซึ่งระบุไว้ในงานวิจัยของ OpenAI ปี 2020 และดูเหมือนจะได้รับการยืนยันจากความสำเร็จของ GPT-3 อาจไม่เป็นจริงอีกต่อไป
ผู้สังเกตการณ์ในอุตสาหกรรมสังเกตว่าในขณะที่ GPT-3 มีขนาดใหญ่กว่า GPT-2 สิบเท่าพร้อมกับการก้าวกระโดดด้านประสิทธิภาพที่สอดคล้องกัน โมเดลล่าสุดแสดงผลตอบแทนที่ลดลงแม้จะมีการลงทุนทรัพยากรจำนวนมหาศาล อุปมาของการพัฒนา AI ได้เปลี่ยนจากการสร้างรถยนต์ที่ดีขึ้นผ่านการฝึกอบรมล่วงหน้าไปเป็นการเป็นช่างเครื่องที่มุ่งเน้นการปรับปรุงหลังการฝึกอบรม
การต่อต้านจากวงการวิชาการต่อการโฆษณาชวนเชื่อ AI
นักวิจัยกำลังท้าทายการอ้างของอุตสาหกรรมเกี่ยวกับความสามารถในการใช้เหตุผลของ AI มากขึ้น การศึกษาล่าสุดของ Apple สรุปว่าโมเดลการใช้เหตุผลขนาดใหญ่ล้มเหลวในการใช้เหตุผลอย่างสม่ำเสมอในแง่ที่มีความหมาย กลายเป็นเรื่องไม่แน่นอนเมื่อเผชิญกับปัญหาที่ซับซ้อน การวิจัยพบว่าโมเดลเหล่านี้ประสบกับการล่มสลายของความแม่นยำอย่างสมบูรณ์เมื่อเกินความซับซ้อนบางอย่าง
นักวิจัยจาก Arizona State University ได้หักล้างการรับรู้เกี่ยวกับการใช้เหตุผลอย่างตั้งใจในโมเดล AI ในทำนองเดียวกัน พวกเขาอธิบายผลลัพธ์ chain-of-thought ที่ละเอียดยาวว่าเป็นภาพลวงตาที่เปราะบางซึ่งหายไปเมื่อถูกผลักดันเกินการกระจายการฝึกอบรม แนะนำว่าความสามารถในการใช้เหตุผลที่ปรากฏนั้นผิวเผินกว่าที่ดูเหมือน
ผลกระทบทางเศรษฐกิจของความก้าวหน้าที่หยุดชะงัก
ผลกระทบขยายไปไกลเกินกว่าความผิดหวังทางเทคนิค หากกฎการขยายขนาดล้มเหลวจริง เศรษฐกิจ AI อาจมีขนาดเล็กกว่าที่คาดการณ์ไว้อย่างมีนัยสำคัญ นักวิเคราะห์ตอนนี้ประเมินว่าตลาด AI แบบ generative อาจถึง 50-100 พันล้านดอลลาร์สหรัฐฯ แทนที่จะเป็นการประเมินมูลค่าระดับล้านล้านดอลลาร์ที่ขับเคลื่อนความคลั่งไคล้การลงทุนล่าสุด
การประเมินใหม่นี้มาในช่วงเวลาสำคัญเมื่อบริษัทเทคโนโลยีใหญ่ๆ ได้ลงทุน 560 พันล้านดอลลาร์สหรัฐฯ ใน AI ในช่วง 18 เดือนที่ผ่านมา ขณะที่สร้างรายได้ที่เกี่ยวข้องเพียง 35 พันล้านดอลลาร์สหรัฐฯ เท่านั้น โดยมีประมาณ 35% ของมูลค่าตลาดหุ้นสหรัฐฯ ผูกติดกับยักษ์ใหญ่เทคโนโลยี 7 แห่งที่ลงทุนใน AI อย่างหนัก ความเสี่ยงสำหรับความก้าวหน้าที่ต่อเนื่องยังคงมีขนาดใหญ่มหาศาล
การลงทุนในอุตสาหกรรม AI เทียบกับรายได้ (18 เดือนที่ผ่านมา):
- การลงทุนใน AI รวม: 560 พันล้านดอลลาร์สหรัฐ
- รายได้จาก AI ที่สร้างขึ้น: 35 พันล้านดอลลาร์สหรัฐ
- อัตราส่วนการลงทุนต่อรายได้: 16:1
มองไปข้างหน้า
การเปิดตัว GPT-5 ทำหน้าที่เป็นจุดเปลี่ยนสำคัญสำหรับความสัมพันธ์ของอุตสาหกรรม AI กับความเป็นจริง แม้ว่าโมเดลจะแสดงถึงความก้าวหน้าทางเทคนิคอย่างแท้จริง แต่ก็ยังห่างไกลจากการพัฒนาที่ปฏิวัติวงการซึ่งวาทกรรมเรื่องปัญญาประดิษฐ์ระดับเหนือมนุษย์ของ Altman ได้สัญญาไว้ ขณะที่อุตสาหกรรมต่อสู้กับข้อจำกัดของแนวทางปัจจุบัน จุดสนใจอาจเปลี่ยนไปสู่ความคาดหวังที่สมจริงมากขึ้นและการประยุกต์ใช้ในทางปฏิบัติ แทนที่จะเป็นการอ้างที่เปลี่ยนแปลงโลกเกี่ยวกับปัญญาประดิษฐ์ทั่วไป