ชุมชนโปรแกรมเมอร์กำลังเต็มไปด้วยการอฟอร์ดหลังจากโมเดล AI แบบกำหนดเองของ OpenAI ได้อันดับสองที่น่าประทับใจในการแข่งขัน AtCoder World Tour Finals 2025 โดยแพ้ให้กับคู่แข่งมนุษย์ที่เหนื่อยล้า Przemysław Dębiak เพียงแค่ 9.5 เปอร์เซ็นต์ ในขณะที่หัวข้อข่าวเน้นไปที่ชัยชนะของมนุษย์ สมาชิกในชุมชนชี้ให้เห็นว่าประสิทธิภาพของ AI อาจมีความสำคัญมากกว่าที่เห็นในตอนแรก
ผลการแข่งขัน:
- ผู้ชนะฝ่ายมนุษย์ ( Psyho ): 1,812,272,558,909 คะแนน
- โมเดล OpenAI : 1,654,675,725,406 คะแนน
- ช่วงห่าง: ต่างกัน 9.5%
- รางวัล: 500,000 เยน (~3,367 ดอลลาร์สหรัฐ)
- ระยะเวลา: 10 ชั่วโมง
- ผู้เข้าร่วม: โปรแกรมเมอร์ชั้นนำ 12 คนจากทั่วโลก + โมเดล AI 1 ตัว
ประสิทธิภาพของ AI ท้าทายสมมติฐานการแก้ปัญหาระยะยาว
รูปแบบมาราธอน 10 ชั่วโมงได้จุดประกายการอภิปรายทางเทคนิคที่น่าสนใจในหมู่โปรแกรมเมอร์ สมาชิกในชุมชนบางคนเริ่มต้นสมมติว่าโมเดล AI จะประสบปัญหากับเซสชันการแก้ปัญหาที่ยืดเยื้อ โดยคาดหวังว่าพวกมันจะถึงจุดคงที่หลังจากความพยายามเริ่มต้น อย่างไรก็ตาม คะแนนสุดท้ายที่ใกล้เคียงกันแสดงให้เห็นเป็นอย่างอื่น AI รักษาประสิทธิภาพการแข่งขันตลอดการประกวด โดยจบด้วยคะแนน 1,654,675,725,406 เมื่อเทียบกับ 1,812,272,558,909 คะแนนของผู้ชนะ
สิ่งนี้ท้าทายความเชื่อทั่วไปที่ว่าโมเดลภาษาขนาดใหญ่ไม่ได้ปรับปรุงด้วยเวลาคิดที่ยาวนานขึ้น การแข่งขันที่ค่อนข้างแน่นแสดงให้เห็นว่า AI ยังคงมีความก้าวหน้าที่มีความหมายตลอดกรอบเวลาที่ยืดเยื้อ แทนที่จะหยุดนิ่งหลังจากความพยายามในช่วงแรก
ชุมชนตั้งคำถามเกี่ยวกับการดำเนินงานและความยุติธรรมของ AI
รายละเอียดทางเทคนิคเกี่ยวกับวิธีการทำงานของโมเดล AI ในระหว่างการแข่งขันได้กลายเป็นจุดสำคัญของการอภิปรายในชุมชน โปรแกรมเมอร์สงสัยว่าโมเดลได้รับการกระตุ้นจากมนุษย์อย่างต่อเนื่องหรือทำงานอย่างอิสระจากการกระตุ้นเริ่มต้น คำถามการดำเนินงานนี้มีความสำคัญต่อการเข้าใจธรรมชาติที่แท้จริงของการเปรียบเทียบระหว่างมนุษย์กับ AI
การแข่งขันใช้ฮาร์ดแวร์เหมือนกันสำหรับผู้เข้าร่วมทุกคน เพื่อให้แน่ใจว่าเป็นการแข่งขันที่เป็นธรรม อย่างไรก็ตาม สมาชิกในชุมชนสังเกตว่าความแตกต่างพื้นฐานระหว่างแนวทางการแก้ปัญหาของมนุษย์และ AI ทำให้การเปรียบเทียบโดยตรงมีความซับซ้อน
การยอมรับมากกว่ารางวัลเงิน
ผู้ชนะได้รับ 500,000 เยนญี่ปุ่น (ประมาณ 3,367 ดอลลาร์สหรัฐ) ซึ่งผู้สังเกตการณ์ในชุมชนสังเกตว่าเป็นค่าตอบแทนที่เจียมเนื้อเจียมตัวสำหรับความพยายามที่เข้มข้นเช่นนี้ คุณค่าที่แท้จริงดูเหมือนจะอยู่ที่การยอมรับและความก้าวหน้าในอาชีพ Dębiak อดีตพนักงาน OpenAI ได้รับการมองเห็นอย่างมากในวงการเทคโนโลยีหลังจากชัยชนะของเขา
จำนวนเงินรางวัลเน้นให้เห็นว่าการเขียนโปรแกรมแข่งขันมักให้ความสำคัญกับเกียรติยศและการแสดงทักษะมากกว่ารางวัลทางการเงิน คล้ายกับการแข่งขันทางปัญญาอื่นๆ
ความก้าวหน้าอย่างรวดเร็วของ AI ทำให้เกิดคำถามในอนาคต
การอภิปรายในชุมชนเผยให้เห็นการตระหนักรู้ที่เพิ่มขึ้นเกี่ยวกับความสามารถที่เร่งตัวของ AI ในงานการเขียนโค้ด เกณฑ์มาตรฐานล่าสุดแสดงให้เห็นว่าการแก้ปัญหาการเขียนโค้ดของ AI เพิ่มขึ้นจาก 4.4% ความสำเร็จในปี 2023 เป็น 71.7% ในปี 2024 เส้นทางการปรับปรุงที่น่าทึ่งนี้ทำให้โปรแกรมเมอร์สงสัยว่าข้อได้เปรียบของมนุษย์จะคงอยู่ได้นานแค่ไหน
ตอนนี้ลองจินตนาการดูว่าเราจะอยู่ที่ไหนในอีก 10 ปี และเราอยู่ที่ไหนเมื่อ 10 ปีที่แล้ว สิ่งต่างๆ เคลื่อนไหวเร็วมาก
การเปรียบเทียบ John Henry ของการแข่งขันสะท้อนกับสมาชิกในชุมชนหลายคนที่เห็นสิ่งนี้เป็นชัยชนะของมนุษย์ที่ชัดเจนครั้งสุดท้ายในการเขียนโปรแกรมแข่งขัน ไม่เหมือนกับตอนจบที่น่าเศร้าของนิทานพื้นบ้าน โปรแกรมเมอร์คนนี้รอดจากความพยายามมาราธอนของเขา แต่การแข่งขันในอนาคตอาจเล่าเรื่องที่แตกต่างออกไป
ไทม์ไลน์ความก้าวหน้าของ AI ในการเขียนโค้ด:
- 2023: AI แก้ปัญหาการเขียนโค้ดได้ 4.4% ใน SWE-bench
- 2024: AI แก้ปัญหาการเขียนโค้ดได้ 71.7% ใน SWE-bench
- 2024: นักพัฒนาซอฟต์แวร์กว่า 90% ใช้เครื่องมือเขียนโค้ดด้วย AI
- 2025: AI ได้อันดับ 3 อันดับแรกครั้งแรกในการแข่งขันเขียนโค้ดระดับพรีเมียร์
มองไปข้างหน้า
ชุมชนโปรแกรมเมอร์ดูเหมือนจะแบ่งออกระหว่างการเฉลิมฉลองความเฉลียวฉลาดของมนุษย์และการยอมรับความสามารถที่น่าประทับใจของ AI ในขณะที่บางคนเน้นไปที่ชัยชนะของมนุษย์ คนอื่นๆ เน้นว่าโมเดล AI ที่ได้อันดับสองในหมู่โปรแกรมเมอร์ชั้นนำ 12 คนของโลกแสดงถึงก้าวสำคัญ
ขณะที่โมเดล AI ยังคงปรับปรุงและการแข่งขันเช่น AtCoder ให้สนามทดสอบ ชุมชนเฝ้าดูด้วยทั้งความหลงใหลและความไม่แน่นอนเกี่ยวกับอนาคตของการแข่งขันระหว่างมนุษย์กับ AI ในการเขียนโปรแกรม
อ้างอิง: Exhausted man defeats AI model in world coding championship