ผู้ใช้ GPT-5 รายงานปัญหาประสิทธิภาพและฟีเจอร์ที่หายไปหลังจาก OpenAI เปิดตัวเวอร์ชันล่าสุด

ทีมชุมชน BigGo
ผู้ใช้ GPT-5 รายงานปัญหาประสิทธิภาพและฟีเจอร์ที่หายไปหลังจาก OpenAI เปิดตัวเวอร์ชันล่าสุด

การเปิดตัว GPT-5 เวอร์ชันล่าสุดของ OpenAI ได้จุดประกายการพูดคุยอย่างกว้างขวางในหมู่ผู้ใช้ที่รายงานประสบการณ์ที่หลากหลายกับโมเดลใหม่นี้ แม้ว่าบริษัทจะวางตำแหน่ง GPT-5 เป็นความก้าวหน้าที่สำคัญ แต่ผู้ใช้จำนวนมากกลับพบว่าตนเองผิดหวังกับประสิทธิภาพและการทำงานในด้านต่างๆ

ข้อกังวลเรื่องคุณภาพและปัญหาการจัดเส้นทางโมเดล

ผู้ใช้ได้รายงานความแตกต่างด้านคุณภาพที่เห็นได้ชัดระหว่าง GPT-5 และโมเดลรุ่นก่อนหน้า หลายคนพบว่า GPT-5 สร้างรอบการคิดได้น้อยกว่าโมเดล O3 รุ่นก่อนหน้า และไม่ใช้การค้นหาเว็บได้อย่างมีประสิทธิภาพ Custom GPTs ซึ่งผู้ใช้หลายคนพึ่งพาสำหรับงานเฉพาะทาง ดูเหมือนจะเสียหายและไม่สนใจคำสั่งไม่ว่าจะเลือกโมเดลใด ฟังก์ชันการวิจัยเชิงลึก ซึ่งเป็นฟีเจอร์สำคัญสำหรับผู้ใช้มืออาชีพหลายคน ดูเหมือนจะไม่ทำงานแม้จะเลือกอย่างชัดเจน

ระบบจัดเส้นทางโมเดล ที่ออกแบบมาเพื่อเลือกโมเดลที่ดีที่สุดสำหรับแต่ละงานโดยอัตโนมัติ กลายเป็นจุดที่สร้างความหงุดหงิด ผู้ใช้รายงานว่าการตัดสินใจเส้นทางขาดความโปร่งใส และพวกเขาไม่สามารถควบคุมได้ง่ายๆ ว่าโมเดลใดเฉพาะเจาะจงจะจัดการกับคำขอของพวกเขา สิ่งนี้นำไปสู่ผลลัพธ์ที่คาดเดาไม่ได้และลดความเชื่อมั่นของผู้ใช้ในระบบ

ปัญหาทางเทคนิคที่รายงาน:

  • Custom GPTs ไม่ปฏิบัติตามคำสั่งโดยไม่คำนึงถึงโมเดลที่เลือก
  • ฟีเจอร์การวิจัยเชิงลึกดูเหมือนจะไม่ทำงาน
  • กระบวนการล้างข้อมูลบริบททำให้สูญเสียเธรดการสนทนา
  • ปัญหาการหลอนลวงยังคงมีอยู่ในโดเมนเฉพาะทาง
  • การใช้เหตุผลเชิงพื้นที่และการประมวลผลภาพยังคงมีปัญหา
  • การกำหนดเส้นทางโมเดลขาดความโปร่งใสและการควบคุมของผู้ใช้

ปัญหาการจัดการบริบทและการสนทนา

ปัญหาสำคัญที่ส่งผลต่อประสบการณ์ผู้ใช้คือความยากลำบากที่ชัดเจนของ GPT-5 ในการรักษาบริบทการสนทนา ผู้ใช้อธิบายสถานการณ์ที่โมเดลสูญเสียเส้นด้ายของการสนทนาอย่างกะทันหัน ต้องใช้คำสั่งเช่น กรุณาทบทวนการสนทนาล่าสุดก่อนดำเนินต่อ เพื่อให้กลับมาอยู่ในเส้นทางที่ถูกต้อง การตอบสนองก็กลายเป็นสั้นกระชับอย่างเห็นได้ชัด สร้างประสบการณ์ที่กระแทกใจเหมือนกับการพูดคุยกับคนที่ไม่ได้ฟัง

ปัญหาการจัดการบริบทนี้ดูเหมือนจะเกิดจากกระบวนการทำความสะอาดบริบทที่รุนแรง ซึ่งอาจสรุปไฮไลท์การสนทนาได้ไม่ดี ทำให้โมเดลมีหน่วยความจำการทำงานที่เล็กกว่าที่คาดหวัง

การแลกเปลี่ยนระหว่างประสิทธิภาพและต้นทุน

การเปิดตัวครั้งนี้ดูเหมือนจะเป็นส่วนหนึ่งของกลยุทธ์ของ OpenAI ในการจัดการต้นทุนในขณะที่ขยายไปยังฐานผู้ใช้ที่ใหญ่ขึ้น ผู้สังเกตการณ์ในอุตสาหกรรมสังเกตว่าการรันโมเดลเหล่านี้ที่ประสิทธิภาพสูงสุดอาจมีค่าใช้จ่ายหลายพันดอลลาร์สหรัฐต่อผู้ใช้ต่อเดือน การออกแบบของ GPT-5 ดูเหมือนจะปรับให้เหมาะสำหรับการยอมรับจากมวลชนมากกว่าประสิทธิภาพสูงสุด ซึ่งอธิบายได้ว่าทำไมผู้ใช้ขั้นสูงที่คุ้นเคยกับความสามารถของ O3 จึงรู้สึกผิดหวัง

น่าสนใจที่ GPT-5 Pro เวอร์ชันพรีเมียม แสดงประสิทธิภาพที่ดีกว่าในงานเขียนโค้ดและสามารถแก้ปัญหาซับซ้อนที่ทำให้โมเดลก่อนหน้าติดขัด อย่างไรก็ตาม มันมาพร้อมกับต้นทุนที่สูงกว่าและข้อจำกัดอัตราที่ทำให้เข้าถึงได้น้อยกว่าสำหรับการใช้งานปกติ

การเปรียบเทียบ GPT-5 กับโมเดลรุ่นก่อนหน้า:

  • การจัดการบริบท: GPT-5 แสดงความสามารถที่ลดลงในการรักษาเธรดการสนทนาเมื่อเปรียบเทียบกับ O3
  • การค้นหาเว็บ: การรวมระบบค้นหาเว็บมีประสิทธิภาพน้อยกว่าโมเดล O3 รุ่นก่อนหน้า
  • Custom GPTs: ฟังก์ชันการทำงานเสียหาย ไม่สนใจคำสั่งของผู้ใช้
  • Deep Research: ไม่สามารถใช้งานได้แม้จะเลือกใช้อย่างชัดเจน
  • รูปแบบการตอบสนอง: การตอบสนองที่กระชับมากขึ้น รอบการคิดที่ลดลง
  • ต้นทุน: ออกแบบมาเพื่อการนำไปใช้งานในวงกว้างมากกว่าประสิทธิภาพสูงสุด

ข้อจำกัดทางเทคนิคยังคงอยู่

แม้จะมีการเปิดตัวใหม่ แต่ปัญหาพื้นฐานที่รบกวนโมเดลภาษาขนาดใหญ่ยังคงส่งผลต่อ GPT-5 โมเดลยังคงมีปัญหาในการพูดว่า ฉันไม่รู้ เมื่อขาดข้อมูล แต่กลับสร้างการตอบสนองที่ฟังดูมั่นใจแต่ไม่ถูกต้อง ปัญหาการหลอนลวงนี้ส่งผลกระทบโดยเฉพาะต่อโดเมนเฉพาะทางที่ผู้ใช้ต้องการข้อมูลที่เชื่อถือได้และแม่นยำ

ความสามารถในการใช้เหตุผลเชิงพื้นที่และการประมวลผลภาพของโมเดลยังคงมีปัญหา โดยผู้ใช้รายงานว่ามันล้มเหลวในงานภาพพื้นฐานและสร้างการตอบสนองที่ไร้สาระเมื่อทำงานกับภาพ

การปรับตัวของผู้ใช้และความคาดหวัง

การตอบสนองของชุมชนเน้นย้ำถึงความท้าทายที่กว้างขึ้นในการพัฒนา AI: การจัดการความคาดหวังของผู้ใช้เทียบกับความเป็นจริงทางเทคนิค แม้ว่า GPT-5 จะแสดงถึงการปรับปรุงแบบเพิ่มหน่วยในบางพื้นที่ แต่ก็ไม่ถึงความก้าวหน้าแบบปฏิวัติที่ผู้ใช้หลายคนคาดหวัง ผู้ใช้บางคนได้ปรับตัวโดยใช้โมเดล AI หลายตัวสำหรับงานที่แตกต่างกัน โดยถือว่าแต่ละตัวเป็นเครื่องมือเฉพาะทางมากกว่าโซลูชันอเนกประสงค์

การต้อนรับที่หลากหลายของ GPT-5 สะท้อนถึงสถานะปัจจุบันของการพัฒนา AI ที่ความก้าวหน้ามาในขั้นตอนเล็กๆ มากกว่าการกระโดดแบบดราม่า ผู้ใช้กำลังเรียนรู้ที่จะนำทางจุดแข็งและจุดอ่อนของโมเดลต่างๆ มักจะรักษาการสมัครสมาชิกหลายบริการเพื่อเข้าถึงเครื่องมือที่ดีที่สุดสำหรับแต่ละงานเฉพาะ

อ้างอิง: GPT-5: Overdan, overhyped and underwhelming. And that's not the worst of it.