ทีมชุมชน BigGo
Claude 4 Sonnet เอาชนะ GPT-5 ในการทดสอบการเขียนโค้ดภายในของ Microsoft

Microsoft ได้ตัดสินใจอย่างน่าประหลาดใจในการอัปเดต Visual Studio Code ครั้งล่าสุด โดยให้ความสำคัญกับ Claude 4 Sonnet ของ Anthropic มากกว่าโมเดล GPT-5 ของ OpenAI สำหรับงานการเขียนโค้ด การตัดสินใจนี้เกิดขึ้นหลังจากการทดสอบภายในแสดงให้เห็นว่า Claude มีประสิทธิภาพที่เหนือกว่าในงานพัฒนา ซึ่งถือเป็นการเปลี่ยนแปลงที่สำคัญในกลยุทธ์ AI ของ Microsoft แม้จะมีความร่วมมืออย่างใกล้ชิดกับ OpenAI

การเลือกโมเดลใน Visual Studio Code :

  • ผู้ใช้ฟรี: การเลือกอัตโนมัติระหว่าง Claude Sonnet 4 , GPT-5 , GPT-5 mini
  • ผู้ใช้ที่จ่ายเงิน: ใช้ Claude Sonnet 4 เป็นหลัก
  • การเลือกขึ้นอยู่กับเกณฑ์ "ประสิทธิภาพที่เหมาะสมที่สุด"
การเลือกนี้สะท้อนให้เห็นการนำทางเชิงกลยุทธ์ของ Microsoft ผ่านความร่วมมือและการพิจารณาทางการเงินในเทคโนโลยี AI
การเลือกนี้สะท้อนให้เห็นการนำทางเชิงกลยุทธ์ของ Microsoft ผ่านความร่วมมือและการพิจารณาทางการเงินในเทคโนโลยี AI

การเปรียบเทียบประสิทธิภาพเผยให้เห็นผู้ชนะที่ชัดเจน

ชุมชนนักพัฒนาได้หารือกันอย่างกระตือรือร้นเกี่ยวกับความแตกต่างด้านประสิทธิภาพระหว่างโมเดล AI เหล่านี้ โดยได้ผลลัพธ์ที่หลากหลายแต่ชี้ให้เห็นแนวโน้มที่ชัดเจน แม้ว่าผู้ใช้บางคนจะรายงานความสำเร็จกับ GPT-5 แต่นักพัฒนาหลายคนพบว่า Claude 4 Sonnet ให้ความช่วยเหลือด้านการเขียนโค้ดที่ดีกว่าอย่างสม่ำเสมอ ช่องว่างด้านประสิทธิภาพดูเหมือนจะชัดเจนที่สุดในงานที่เน้นประสิทธิภาพ เช่น การเขียนโค้ด งานสเปรดชีต และการสร้างรายงาน ซึ่ง Claude ดูเหมือนจะเก่งกว่าแนวทางที่เน้นใช้งานทั่วไปของ GPT

อย่างไรก็ตาม การเปรียบเทียบไม่ได้เป็นไปในทิศทางเดียวทั้งหมด GPT-5 ยังคงมีข้อได้เปรียบในด้านความคุ้มค่าด้านต้นทุนและการจัดการ context window สำหรับงานวางแผนแบบ top-down ที่ซับซ้อน นักพัฒนาบางคนสังเกตว่า GPT-5 ได้รับการปรับปรุงอย่างมีนัยสำคัญและกลายเป็นตัวเลือกเริ่มต้นของพวกเขา ซึ่งบ่งบอกว่าการแข่งขันยังคงใกล้เคียงกัน

ด้านประสิทธิภาพที่ Claude โดดเด่น:

  • งานเขียนโค้ดและการพัฒนา
  • การรวมระบบ Excel และ PowerPoint
  • งานสเปรดชีต
  • การสร้างรายงาน
  • แอปพลิเคชันที่เน้นการเพิ่มประสิทธิภาพการทำงาน
การแข่งขันที่ดำเนินอยู่ระหว่างโมเดล AI สะท้อนถึงภูมิทัศน์ที่เปลี่ยนแปลงไปของการช่วยเหลือด้านการเขียนโค้ดและผลิตภาพของนักพัฒนา
การแข่งขันที่ดำเนินอยู่ระหว่างโมเดล AI สะท้อนถึงภูมิทัศน์ที่เปลี่ยนแปลงไปของการช่วยเหลือด้านการเขียนโค้ดและผลิตภาพของนักพัฒนา

ข้อกังวลเรื่องประสบการณ์ผู้ใช้และการเข้าถึง

นอกเหนือจากประสิทธิภาพดิบแล้ว ปัญหาการใช้งานจริงได้กลายเป็นปัจจัยสำคัญ ผู้ใช้บางคนประสบปัญหาในระบบการจัดการบัญชีของ Anthropic โดยเฉพาะการยืนยันหมายเลขโทรศัพท์ระหว่างบัญชีส่วนตัวและบัญชีธุรกิจ สิ่งนี้สร้างอุปสรรคสำหรับนักพัฒนาที่ต้องการใช้ Claude ในสภาพแวดล้อมการทำงานที่แตกต่างกัน แม้ว่าพวกเขาจะเต็มใจจ่ายเงินสำหรับบริการก็ตาม

ความท้าทายด้านการยืนยันตัวตนเน้นย้ำให้เห็นว่าความเหนือกว่าทางเทคนิคไม่ได้แปลเป็นการนำไปใช้ที่ราบรื่นเสมอไป โดยเฉพาะในสภาพแวดล้อมองค์กรที่นักพัฒนาต้องการการเข้าถึงที่ยืดหยุ่นในบริบทต่างๆ

ปัญหาการเข้าถึงและความเหนือกว่าทางเทคนิคของ AI นำเสนอความท้าทายในประสบการณ์ผู้ใช้และการยอมรับ
ปัญหาการเข้าถึงและความเหนือกว่าทางเทคนิคของ AI นำเสนอความท้าทายในประสบการณ์ผู้ใช้และการยอมรับ

ผลกระทบเชิงกลยุทธ์สำหรับ Microsoft

การเลือกของ Microsoft สะท้อนถึงแนวทางที่เน้นความเป็นจริงในการรวม AI มากกว่าความจงรักภักดีต่อพันธมิตรใดพันธมิตรหนึ่ง บริษัทดูเหมือนจะกระจายความเสี่ยงโดยพัฒนาโมเดล AI ของตัวเองในขณะที่เลือกตัวเลือกที่ดีที่สุดที่มีอยู่สำหรับกรณีการใช้งานเฉพาะ กลยุทธ์นี้สมเหตุสมผลทางธุรกิจสำหรับ Visual Studio Code ที่ประสิทธิภาพการเขียนโค้ดส่งผลโดยตรงต่อความพึงพอใจและประสิทธิภาพของผู้ใช้

Claude เอาชนะ GPT ทุกตัวใน GitHub Copilot อย่างถล่มทลาย (จากประสบการณ์ของผม)

การตัดสินใจนี้ยังบ่งบอกว่า Microsoft มอง Visual Studio Code เป็นแพลตฟอร์มที่ให้ความสำคัญกับประสบการณ์ผู้ใช้มากกว่าการเมืองความร่วมมือ โดยการเลือกโมเดลที่มีประสิทธิภาพดีที่สุดสำหรับแต่ละงานโดยอัตโนมัติ Microsoft รักษาความได้เปรียบในการแข่งขันในตลาดเครื่องมือนักพัฒนาในขณะที่เปิดตัวเลือกไว้สำหรับความร่วมมือ AI ในอนาคต

อ้างอิง: Microsoft favors Anthropic over OpenAl for Visual Studio Code