กลยุทธ์ชิป AI แบบกำหนดเองของ Microsoft เผชิญความสงสัยจากการเข้าสู่ตลาดช้าและความท้าทายด้านเทคนิค

ทีมชุมชน BigGo
กลยุทธ์ชิป AI แบบกำหนดเองของ Microsoft เผชิญความสงสัยจากการเข้าสู่ตลาดช้าและความท้าทายด้านเทคนิค

แผนการทะเยอทะยานของ Microsoft ที่จะเปลี่ยน GPU ส่วนใหญ่จาก AMD และ Nvidia ไปใช้ตัวเร่ง AI ที่พัฒนาเองนั้นได้รับปฏิกิริยาที่หลากหลายจากชุมชนเทคโนโลยี แม้ว่าบริษัทจะมีเป้าหมายที่จะเปลี่ยนภาระงานในดาต้าเซ็นเตอร์ส่วนใหญ่ไปใช้ซิลิคอนแบบกำหนดเองเพื่อให้ได้อัตราส่วนราคาต่อประสิทธิภาพที่ดีกว่า แต่ผู้สังเกตการณ์ในอุตสาหกรรมกำลังตั้งคำถามว่า Microsoft จะสามารถตามทันคู่แข่งที่เริ่มต้นการเดินทางนี้มาหลายปีก่อนหน้านี้ได้หรือไม่

การเข้าสู่ตลาดช้าในตลาดที่มีการแข่งขันสูง

ชุมชนเทคโนโลยีกำลังเน้นย้ำถึงข้อเสียเปรียบที่สำคัญของ Microsoft ในเรื่องเวลา Google ได้ใช้ TPU แบบกำหนดเองมาตั้งแต่ปี 2015 ในขณะที่ Amazon ได้นำ Trainium accelerator หลายหมื่นตัวมาใช้งานแล้ว Microsoft เพิ่งเปิดเผย Maia AI accelerator ตัวแรกในช่วงปลายปี 2023 ทำให้ล้าหลัง Google ประมาณแปดปี ความล่าช้านี้น่ากังวลเป็นพิเศษเนื่องจากการพัฒนาฮาร์ดแวร์โดยทั่วไปต้องใช้หลายรุ่นจึงจะมีความสามารถในการแข่งขันได้จริง

ความท้าทายนี้ไม่ได้จำกัดอยู่แค่การออกแบบชิปเท่านั้น การสร้างโครงสร้างพื้นฐาน AI ที่มีประสิทธิภาพต้องใช้ interconnect เฉพาะทางเพื่อสร้างคลัสเตอร์คอมพิวติ้งขนาดใหญ่ และวิศวกรที่มีความเชี่ยวชาญในด้านนี้มีอยู่อย่างจำกัดในอุตสาหกรรม ความสำเร็จของ Google กับ TPU อาศัยโซลูชัน interconnect แบบกำหนดเองเหล่านี้เป็นหลัก ซึ่งเป็นกำแพงทางเทคนิคที่สำคัญที่ Microsoft จะต้องเอาชนะ

การเปรียบเทียบไทม์ไลน์ชิป AI แบบกำหนดเอง:

  • Google TPUs: เริ่มต้นปี 2015 (การอนุมาน), 2017 (การฝึกอบรม)
  • Amazon Trainium: ได้ปรับใช้หลายหมื่นหน่วย
  • Microsoft Maia: เปิดเผยครั้งแรกในช่วงปลายปี 2023
  • ช่วงเวลาที่ห่าง: Microsoft ล้าหลัง Google ประมาณ 8 ปีจากการปรับใช้ครั้งแรก

ความสงสัยของชุมชนเกี่ยวกับการดำเนินการ

ผู้สังเกตการณ์ในอุตสาหกรรมเทคโนโลยีกำลังแสดงความสงสัยเกี่ยวกับความสามารถของ Microsoft ในการดำเนินการตามวิสัยทัศน์นี้ ประวัติการดำเนินงานของบริษัทในด้านฮาร์ดแวร์มีผลลัพธ์ที่หลากหลาย และสมาชิกบางคนในชุมชนมองว่าการประกาศนี้อาจจะเป็นเพียงคำพูดมากกว่าการเปลี่ยนแปลงเชิงกลยุทธ์ที่เป็นรูปธรรม ความท้าทายด้านสถาบันที่ Microsoft รวมถึงการตัดสินใจขององค์กรในอดีตที่อาจขัดขวางการพัฒนา AI กำลังถูกอ้างถึงเป็นอุปสรรคที่อาจเกิดขึ้น

ฮาร์ดแวร์ไม่ได้เปลี่ยนจากศูนย์ไปเป็นโครงสร้างพื้นฐานระดับกิกะวัตต์ด้วยการพูดเพียงอย่างเดียว แม้แต่ Apple ยังมีตำแหน่งที่ดีกว่าสำหรับสิ่งเช่นนี้

ข้อมูลจำเพาะของชิป Maia 100 รุ่นแรกสนับสนุนความกังวลเหล่านี้ ด้วยประสิทธิภาพ BF16 800 teraFLOPS และหน่วยความจำ HBM2e 64GB ซึ่งยังห่างไกลจากผลิตภัณฑ์คู่แข่งจาก Nvidia และ AMD ซึ่งบ่งบอกว่า Microsoft ยังมีระยะทางที่ต้องตามให้ทันมาก

ข้อมูลจำเพาะของ Microsoft Maia 100:

  • ประสิทธิภาพ: 800 teraFLOPS (BF16)
  • หน่วยความจำ: 64GB HBM2e
  • แบนด์วิดท์หน่วยความจำ: 1.8TB/s
  • สถานะ: ยังไม่เทียบเท่ากับ GPU คู่แข่งจาก Nvidia และ AMD

ความท้าทายด้านซอฟต์แวร์และการครอบงำของ CUDA

นอกเหนือจากประสิทธิภาพฮาร์ดแวร์แล้ว ชุมชนยังชี้ให้เห็นว่าซอฟต์แวร์เป็นสนามรบที่สำคัญ ระบบนิเวศ CUDA ของ Nvidia เป็นกำแพงการแข่งขันที่สำคัญซึ่งในอดีตทำให้ AMD อยู่ในสถานะเสียเปรียบแม้จะมีฮาร์ดแวร์ที่แข่งขันได้ Microsoft จะต้องพัฒนาไม่เพียงแค่ชิปที่มีประสิทธิภาพ แต่ยังรวมถึงเครื่องมือซอฟต์แวร์และเฟรมเวิร์กที่นักพัฒนาต้องการใช้

อย่างไรก็ตาม ผู้สังเกตการณ์บางคนสังเกตว่าภาระงาน AI สมัยใหม่ โดยเฉพาะโมเดลที่ใช้ transformer อาศัยชุดการคำนวณพื้นฐานที่จำกัดค่อนข้างมาก สิ่งนี้อาจทำให้ Microsoft บรรลุความเข้ากันได้ของซอฟต์แวร์ได้ง่ายขึ้นเมื่อเปรียบเทียบกับแอปพลิเคชันคอมพิวติ้งทั่วไป การนำ TPU ของ Google มาใช้งานอย่างสำเร็จแสดงให้เห็นว่ากำแพง CUDA ไม่ใช่สิ่งที่เอาชนะไม่ได้สำหรับบริษัทที่มีทรัพยากรและความมุ่งมั่นเพียงพอ

พลวัตตลาดและผลกระทบเชิงกลยุทธ์

การประกาศครั้งนี้เองมีจุดประสงค์เชิงกลยุทธ์ที่สำคัญโดยการสร้างแรงกดดันต่อราคา GPU การครอบงำตลาดในปัจจุบันของ Nvidia ทำให้สามารถมีอัตรากำไรที่สำคัญได้ และภัยคุกคามที่น่าเชื่อถือจากลูกค้ารายใหญ่อย่าง Microsoft อาจช่วยลดต้นทุนเหล่านี้ได้แม้ว่ากลยุทธ์ชิปแบบกำหนดเองจะใช้เวลาหลายปีจึงจะเกิดผลอย่างเต็มที่

แนวโน้มของอุตสาหกรรมในวงกว้างที่มุ่งสู่การรวมแนวตั้งในโครงสร้างพื้นฐาน AI สะท้อนถึงขนาดที่ใหญ่มากและข้อกำหนดเฉพาะของภาระงาน AI สมัยใหม่ บริษัทอย่าง Apple ได้ขยายแนวทางนี้ไปยังดาต้าเซ็นเตอร์ของตนเองแล้ว โดยใช้ซิลิคอนแบบกำหนดเองสำหรับบริการคลาวด์ สิ่งนี้บ่งบอกว่ากลยุทธ์ของ Microsoft แม้จะมาช้า แต่สอดคล้องกับวิวัฒนาการของอุตสาหกรรมในวงกว้างที่มุ่งสู่โซลูชันคอมพิวติ้งเฉพาะทางที่สร้างขึ้นเพื่อจุดประสงค์เฉพาะ

ความสำเร็จของโครงการชิปแบบกำหนดเองของ Microsoft จะขึ้นอยู่กับการดำเนินการในหลายมิติ: ประสิทธิภาพชิป การพัฒนาระบบนิเวศซอฟต์แวร์ ความร่วมมือด้านการผลิต และการบูรณาการกับโครงสร้างพื้นฐานที่มีอยู่ แม้ว่าบริษัทจะเผชิญความท้าทายที่สำคัญเนื่องจากการเริ่มต้นที่ช้า แต่ประโยชน์ที่อาจได้รับจากอัตราส่วนราคาต่อประสิทธิภาพที่เหมาะสมและการควบคุมโครงสร้างพื้นฐาน AI ของตนเองมากขึ้นทำให้สิ่งนี้เป็นความจำเป็นเชิงกลยุทธ์มากกว่าเป็นเพียงตัวเลือก

อ้างอิง: Microsoft CTO says he wants to swap most AMD and Nvidia GPUs for homemade chips