การเปิดตัว GPT-5 เวอร์ชันล่าสุดของ OpenAI ได้จุดประกายการพูดคุยอย่างกว้างขวางในหมู่ผู้ใช้ที่รายงานประสบการณ์ที่หลากหลายกับโมเดลใหม่นี้ แม้ว่าบริษัทจะวางตำแหน่ง GPT-5 เป็นความก้าวหน้าที่สำคัญ แต่ผู้ใช้จำนวนมากกลับพบว่าตนเองผิดหวังกับประสิทธิภาพและการทำงานในด้านต่างๆ
ข้อกังวลเรื่องคุณภาพและปัญหาการจัดเส้นทางโมเดล
ผู้ใช้ได้รายงานความแตกต่างด้านคุณภาพที่เห็นได้ชัดระหว่าง GPT-5 และโมเดลรุ่นก่อนหน้า หลายคนพบว่า GPT-5 สร้างรอบการคิดได้น้อยกว่าโมเดล O3 รุ่นก่อนหน้า และไม่ใช้การค้นหาเว็บได้อย่างมีประสิทธิภาพ Custom GPTs ซึ่งผู้ใช้หลายคนพึ่งพาสำหรับงานเฉพาะทาง ดูเหมือนจะเสียหายและไม่สนใจคำสั่งไม่ว่าจะเลือกโมเดลใด ฟังก์ชันการวิจัยเชิงลึก ซึ่งเป็นฟีเจอร์สำคัญสำหรับผู้ใช้มืออาชีพหลายคน ดูเหมือนจะไม่ทำงานแม้จะเลือกอย่างชัดเจน
ระบบจัดเส้นทางโมเดล ที่ออกแบบมาเพื่อเลือกโมเดลที่ดีที่สุดสำหรับแต่ละงานโดยอัตโนมัติ กลายเป็นจุดที่สร้างความหงุดหงิด ผู้ใช้รายงานว่าการตัดสินใจเส้นทางขาดความโปร่งใส และพวกเขาไม่สามารถควบคุมได้ง่ายๆ ว่าโมเดลใดเฉพาะเจาะจงจะจัดการกับคำขอของพวกเขา สิ่งนี้นำไปสู่ผลลัพธ์ที่คาดเดาไม่ได้และลดความเชื่อมั่นของผู้ใช้ในระบบ
ปัญหาทางเทคนิคที่รายงาน:
- Custom GPTs ไม่ปฏิบัติตามคำสั่งโดยไม่คำนึงถึงโมเดลที่เลือก
- ฟีเจอร์การวิจัยเชิงลึกดูเหมือนจะไม่ทำงาน
- กระบวนการล้างข้อมูลบริบททำให้สูญเสียเธรดการสนทนา
- ปัญหาการหลอนลวงยังคงมีอยู่ในโดเมนเฉพาะทาง
- การใช้เหตุผลเชิงพื้นที่และการประมวลผลภาพยังคงมีปัญหา
- การกำหนดเส้นทางโมเดลขาดความโปร่งใสและการควบคุมของผู้ใช้
ปัญหาการจัดการบริบทและการสนทนา
ปัญหาสำคัญที่ส่งผลต่อประสบการณ์ผู้ใช้คือความยากลำบากที่ชัดเจนของ GPT-5 ในการรักษาบริบทการสนทนา ผู้ใช้อธิบายสถานการณ์ที่โมเดลสูญเสียเส้นด้ายของการสนทนาอย่างกะทันหัน ต้องใช้คำสั่งเช่น กรุณาทบทวนการสนทนาล่าสุดก่อนดำเนินต่อ เพื่อให้กลับมาอยู่ในเส้นทางที่ถูกต้อง การตอบสนองก็กลายเป็นสั้นกระชับอย่างเห็นได้ชัด สร้างประสบการณ์ที่กระแทกใจเหมือนกับการพูดคุยกับคนที่ไม่ได้ฟัง
ปัญหาการจัดการบริบทนี้ดูเหมือนจะเกิดจากกระบวนการทำความสะอาดบริบทที่รุนแรง ซึ่งอาจสรุปไฮไลท์การสนทนาได้ไม่ดี ทำให้โมเดลมีหน่วยความจำการทำงานที่เล็กกว่าที่คาดหวัง
การแลกเปลี่ยนระหว่างประสิทธิภาพและต้นทุน
การเปิดตัวครั้งนี้ดูเหมือนจะเป็นส่วนหนึ่งของกลยุทธ์ของ OpenAI ในการจัดการต้นทุนในขณะที่ขยายไปยังฐานผู้ใช้ที่ใหญ่ขึ้น ผู้สังเกตการณ์ในอุตสาหกรรมสังเกตว่าการรันโมเดลเหล่านี้ที่ประสิทธิภาพสูงสุดอาจมีค่าใช้จ่ายหลายพันดอลลาร์สหรัฐต่อผู้ใช้ต่อเดือน การออกแบบของ GPT-5 ดูเหมือนจะปรับให้เหมาะสำหรับการยอมรับจากมวลชนมากกว่าประสิทธิภาพสูงสุด ซึ่งอธิบายได้ว่าทำไมผู้ใช้ขั้นสูงที่คุ้นเคยกับความสามารถของ O3 จึงรู้สึกผิดหวัง
น่าสนใจที่ GPT-5 Pro เวอร์ชันพรีเมียม แสดงประสิทธิภาพที่ดีกว่าในงานเขียนโค้ดและสามารถแก้ปัญหาซับซ้อนที่ทำให้โมเดลก่อนหน้าติดขัด อย่างไรก็ตาม มันมาพร้อมกับต้นทุนที่สูงกว่าและข้อจำกัดอัตราที่ทำให้เข้าถึงได้น้อยกว่าสำหรับการใช้งานปกติ
การเปรียบเทียบ GPT-5 กับโมเดลรุ่นก่อนหน้า:
- การจัดการบริบท: GPT-5 แสดงความสามารถที่ลดลงในการรักษาเธรดการสนทนาเมื่อเปรียบเทียบกับ O3
- การค้นหาเว็บ: การรวมระบบค้นหาเว็บมีประสิทธิภาพน้อยกว่าโมเดล O3 รุ่นก่อนหน้า
- Custom GPTs: ฟังก์ชันการทำงานเสียหาย ไม่สนใจคำสั่งของผู้ใช้
- Deep Research: ไม่สามารถใช้งานได้แม้จะเลือกใช้อย่างชัดเจน
- รูปแบบการตอบสนอง: การตอบสนองที่กระชับมากขึ้น รอบการคิดที่ลดลง
- ต้นทุน: ออกแบบมาเพื่อการนำไปใช้งานในวงกว้างมากกว่าประสิทธิภาพสูงสุด
ข้อจำกัดทางเทคนิคยังคงอยู่
แม้จะมีการเปิดตัวใหม่ แต่ปัญหาพื้นฐานที่รบกวนโมเดลภาษาขนาดใหญ่ยังคงส่งผลต่อ GPT-5 โมเดลยังคงมีปัญหาในการพูดว่า ฉันไม่รู้ เมื่อขาดข้อมูล แต่กลับสร้างการตอบสนองที่ฟังดูมั่นใจแต่ไม่ถูกต้อง ปัญหาการหลอนลวงนี้ส่งผลกระทบโดยเฉพาะต่อโดเมนเฉพาะทางที่ผู้ใช้ต้องการข้อมูลที่เชื่อถือได้และแม่นยำ
ความสามารถในการใช้เหตุผลเชิงพื้นที่และการประมวลผลภาพของโมเดลยังคงมีปัญหา โดยผู้ใช้รายงานว่ามันล้มเหลวในงานภาพพื้นฐานและสร้างการตอบสนองที่ไร้สาระเมื่อทำงานกับภาพ
การปรับตัวของผู้ใช้และความคาดหวัง
การตอบสนองของชุมชนเน้นย้ำถึงความท้าทายที่กว้างขึ้นในการพัฒนา AI: การจัดการความคาดหวังของผู้ใช้เทียบกับความเป็นจริงทางเทคนิค แม้ว่า GPT-5 จะแสดงถึงการปรับปรุงแบบเพิ่มหน่วยในบางพื้นที่ แต่ก็ไม่ถึงความก้าวหน้าแบบปฏิวัติที่ผู้ใช้หลายคนคาดหวัง ผู้ใช้บางคนได้ปรับตัวโดยใช้โมเดล AI หลายตัวสำหรับงานที่แตกต่างกัน โดยถือว่าแต่ละตัวเป็นเครื่องมือเฉพาะทางมากกว่าโซลูชันอเนกประสงค์
การต้อนรับที่หลากหลายของ GPT-5 สะท้อนถึงสถานะปัจจุบันของการพัฒนา AI ที่ความก้าวหน้ามาในขั้นตอนเล็กๆ มากกว่าการกระโดดแบบดราม่า ผู้ใช้กำลังเรียนรู้ที่จะนำทางจุดแข็งและจุดอ่อนของโมเดลต่างๆ มักจะรักษาการสมัครสมาชิกหลายบริการเพื่อเข้าถึงเครื่องมือที่ดีที่สุดสำหรับแต่ละงานเฉพาะ
อ้างอิง: GPT-5: Overdan, overhyped and underwhelming. And that's not the worst of it.