โมเดล AI ได้อันดับสองในชิงแชมป์โลกการเขียนโปรแกรม ขณะที่ชิงชนะของมนุษย์จุดประกายการถอดถอนในชุมชน

ทีมชุมชน BigGo
โมเดล AI ได้อันดับสองในชิงแชมป์โลกการเขียนโปรแกรม ขณะที่ชิงชนะของมนุษย์จุดประกายการถอดถอนในชุมชน

ชุมชนโปรแกรมเมอร์กำลังเต็มไปด้วยการอฟอร์ดหลังจากโมเดล AI แบบกำหนดเองของ OpenAI ได้อันดับสองที่น่าประทับใจในการแข่งขัน AtCoder World Tour Finals 2025 โดยแพ้ให้กับคู่แข่งมนุษย์ที่เหนื่อยล้า Przemysław Dębiak เพียงแค่ 9.5 เปอร์เซ็นต์ ในขณะที่หัวข้อข่าวเน้นไปที่ชัยชนะของมนุษย์ สมาชิกในชุมชนชี้ให้เห็นว่าประสิทธิภาพของ AI อาจมีความสำคัญมากกว่าที่เห็นในตอนแรก

ผลการแข่งขัน:

  • ผู้ชนะฝ่ายมนุษย์ ( Psyho ): 1,812,272,558,909 คะแนน
  • โมเดล OpenAI : 1,654,675,725,406 คะแนน
  • ช่วงห่าง: ต่างกัน 9.5%
  • รางวัล: 500,000 เยน (~3,367 ดอลลาร์สหรัฐ)
  • ระยะเวลา: 10 ชั่วโมง
  • ผู้เข้าร่วม: โปรแกรมเมอร์ชั้นนำ 12 คนจากทั่วโลก + โมเดล AI 1 ตัว

ประสิทธิภาพของ AI ท้าทายสมมติฐานการแก้ปัญหาระยะยาว

รูปแบบมาราธอน 10 ชั่วโมงได้จุดประกายการอภิปรายทางเทคนิคที่น่าสนใจในหมู่โปรแกรมเมอร์ สมาชิกในชุมชนบางคนเริ่มต้นสมมติว่าโมเดล AI จะประสบปัญหากับเซสชันการแก้ปัญหาที่ยืดเยื้อ โดยคาดหวังว่าพวกมันจะถึงจุดคงที่หลังจากความพยายามเริ่มต้น อย่างไรก็ตาม คะแนนสุดท้ายที่ใกล้เคียงกันแสดงให้เห็นเป็นอย่างอื่น AI รักษาประสิทธิภาพการแข่งขันตลอดการประกวด โดยจบด้วยคะแนน 1,654,675,725,406 เมื่อเทียบกับ 1,812,272,558,909 คะแนนของผู้ชนะ

สิ่งนี้ท้าทายความเชื่อทั่วไปที่ว่าโมเดลภาษาขนาดใหญ่ไม่ได้ปรับปรุงด้วยเวลาคิดที่ยาวนานขึ้น การแข่งขันที่ค่อนข้างแน่นแสดงให้เห็นว่า AI ยังคงมีความก้าวหน้าที่มีความหมายตลอดกรอบเวลาที่ยืดเยื้อ แทนที่จะหยุดนิ่งหลังจากความพยายามในช่วงแรก

ชุมชนตั้งคำถามเกี่ยวกับการดำเนินงานและความยุติธรรมของ AI

รายละเอียดทางเทคนิคเกี่ยวกับวิธีการทำงานของโมเดล AI ในระหว่างการแข่งขันได้กลายเป็นจุดสำคัญของการอภิปรายในชุมชน โปรแกรมเมอร์สงสัยว่าโมเดลได้รับการกระตุ้นจากมนุษย์อย่างต่อเนื่องหรือทำงานอย่างอิสระจากการกระตุ้นเริ่มต้น คำถามการดำเนินงานนี้มีความสำคัญต่อการเข้าใจธรรมชาติที่แท้จริงของการเปรียบเทียบระหว่างมนุษย์กับ AI

การแข่งขันใช้ฮาร์ดแวร์เหมือนกันสำหรับผู้เข้าร่วมทุกคน เพื่อให้แน่ใจว่าเป็นการแข่งขันที่เป็นธรรม อย่างไรก็ตาม สมาชิกในชุมชนสังเกตว่าความแตกต่างพื้นฐานระหว่างแนวทางการแก้ปัญหาของมนุษย์และ AI ทำให้การเปรียบเทียบโดยตรงมีความซับซ้อน

การยอมรับมากกว่ารางวัลเงิน

ผู้ชนะได้รับ 500,000 เยนญี่ปุ่น (ประมาณ 3,367 ดอลลาร์สหรัฐ) ซึ่งผู้สังเกตการณ์ในชุมชนสังเกตว่าเป็นค่าตอบแทนที่เจียมเนื้อเจียมตัวสำหรับความพยายามที่เข้มข้นเช่นนี้ คุณค่าที่แท้จริงดูเหมือนจะอยู่ที่การยอมรับและความก้าวหน้าในอาชีพ Dębiak อดีตพนักงาน OpenAI ได้รับการมองเห็นอย่างมากในวงการเทคโนโลยีหลังจากชัยชนะของเขา

จำนวนเงินรางวัลเน้นให้เห็นว่าการเขียนโปรแกรมแข่งขันมักให้ความสำคัญกับเกียรติยศและการแสดงทักษะมากกว่ารางวัลทางการเงิน คล้ายกับการแข่งขันทางปัญญาอื่นๆ

ความก้าวหน้าอย่างรวดเร็วของ AI ทำให้เกิดคำถามในอนาคต

การอภิปรายในชุมชนเผยให้เห็นการตระหนักรู้ที่เพิ่มขึ้นเกี่ยวกับความสามารถที่เร่งตัวของ AI ในงานการเขียนโค้ด เกณฑ์มาตรฐานล่าสุดแสดงให้เห็นว่าการแก้ปัญหาการเขียนโค้ดของ AI เพิ่มขึ้นจาก 4.4% ความสำเร็จในปี 2023 เป็น 71.7% ในปี 2024 เส้นทางการปรับปรุงที่น่าทึ่งนี้ทำให้โปรแกรมเมอร์สงสัยว่าข้อได้เปรียบของมนุษย์จะคงอยู่ได้นานแค่ไหน

ตอนนี้ลองจินตนาการดูว่าเราจะอยู่ที่ไหนในอีก 10 ปี และเราอยู่ที่ไหนเมื่อ 10 ปีที่แล้ว สิ่งต่างๆ เคลื่อนไหวเร็วมาก

การเปรียบเทียบ John Henry ของการแข่งขันสะท้อนกับสมาชิกในชุมชนหลายคนที่เห็นสิ่งนี้เป็นชัยชนะของมนุษย์ที่ชัดเจนครั้งสุดท้ายในการเขียนโปรแกรมแข่งขัน ไม่เหมือนกับตอนจบที่น่าเศร้าของนิทานพื้นบ้าน โปรแกรมเมอร์คนนี้รอดจากความพยายามมาราธอนของเขา แต่การแข่งขันในอนาคตอาจเล่าเรื่องที่แตกต่างออกไป

ไทม์ไลน์ความก้าวหน้าของ AI ในการเขียนโค้ด:

  • 2023: AI แก้ปัญหาการเขียนโค้ดได้ 4.4% ใน SWE-bench
  • 2024: AI แก้ปัญหาการเขียนโค้ดได้ 71.7% ใน SWE-bench
  • 2024: นักพัฒนาซอฟต์แวร์กว่า 90% ใช้เครื่องมือเขียนโค้ดด้วย AI
  • 2025: AI ได้อันดับ 3 อันดับแรกครั้งแรกในการแข่งขันเขียนโค้ดระดับพรีเมียร์

มองไปข้างหน้า

ชุมชนโปรแกรมเมอร์ดูเหมือนจะแบ่งออกระหว่างการเฉลิมฉลองความเฉลียวฉลาดของมนุษย์และการยอมรับความสามารถที่น่าประทับใจของ AI ในขณะที่บางคนเน้นไปที่ชัยชนะของมนุษย์ คนอื่นๆ เน้นว่าโมเดล AI ที่ได้อันดับสองในหมู่โปรแกรมเมอร์ชั้นนำ 12 คนของโลกแสดงถึงก้าวสำคัญ

ขณะที่โมเดล AI ยังคงปรับปรุงและการแข่งขันเช่น AtCoder ให้สนามทดสอบ ชุมชนเฝ้าดูด้วยทั้งความหลงใหลและความไม่แน่นอนเกี่ยวกับอนาคตของการแข่งขันระหว่างมนุษย์กับ AI ในการเขียนโปรแกรม

อ้างอิง: Exhausted man defeats AI model in world coding championship