NVIDIA ประกาศการสนับสนุน CUDA สำหรับสถาปัตยกรรม RISC-V ทำลายการผูกขาดของ x86 และ ARM ในการคำนวณ AI

ทีมบรรณาธิการ BigGo
NVIDIA ประกาศการสนับสนุน CUDA สำหรับสถาปัตยกรรม RISC-V ทำลายการผูกขาดของ x86 และ ARM ในการคำนวณ AI

ภูมิทัศน์การคำนวณปัญญาประดิษฐ์กำลังเผชิญกับการเปลี่ยนแปลงครั้งสำคัญ เมื่อ NVIDIA ขยายแพลตฟอร์มซอฟต์แวร์ CUDA ของตนไปสู่สถาปัตยกรรมโปรเซสเซอร์แบบใหม่ การพัฒนานี้สัญญาว่าจะทำให้การคำนวณ AI เข้าถึงได้ง่ายขึ้น โดยการนำเสนอทางเลือกแบบโอเพนซอร์สที่อาจเปลี่ยนแปลงวิธีที่บริษัทต่างๆ เข้าถึงโซลูชันการคำนวณประสิทธิภาพสูง

ภาพระยะใกล้ของแผงวงจรเป็นสัญลักษณ์ของเทคโนโลยีที่ซับซ้อนเบื้องหลังการขยาย CUDA ของ NVIDIA สู่สถาปัตยกรรม RISC-V
ภาพระยะใกล้ของแผงวงจรเป็นสัญลักษณ์ของเทคโนโลยีที่ซับซ้อนเบื้องหลังการขยาย CUDA ของ NVIDIA สู่สถาปัตยกรรม RISC-V

ความมุ่งมั่นเชิงกลยุทธ์ของ NVIDIA ในการรวม RISC-V

ในงาน 2025 RISC-V China Summit ที่จัดขึ้นในย่าน Zhangjiang ของ Shanghai เมื่อวันที่ 17 กรกฎาคม Frans Sijstermanns รองประธาน NVIDIA ได้ประกาศข่าวสำคัญระหว่างการนำเสนอหัวข้อ Deploying RISC-V Application Processors on NVIDIA Computing Platforms บริษัทได้ยืนยันอย่างเป็นทางการว่าซอฟต์แวร์สแต็ก CUDA ที่เป็นผู้นำในอุตสาหกรรมจะได้รับการสนับสนุนอย่างครอบคลุมสำหรับสถาปัตยกรรม RISC-V ซึ่งถือเป็นจุดเปลี่ยนสำคัญสำหรับระบบนิเวศโปรเซสเซอร์แบบโอเพนซอร์ส

ความสัมพันธ์ของ NVIDIA กับ RISC-V มีความลึกซึ้งมากกว่าการประกาศครั้งล่าสุดนี้ บริษัทได้เลือก RISC-V เป็นสถาปัตยกรรมสืบทอดสำหรับไมโครคอนโทรลเลอร์ Falcon ของตนเองตั้งแต่ปี 2015 แสดงให้เห็นถึงความมุ่งมั่นต่อแพลตฟอร์มนี้เป็นเวลาหนึ่งทศวรรษ การตัดสินใจเชิงกลยุทธ์นี้ได้ให้ผลลัพธ์ที่สำคัญแล้ว โดย NVIDIA ได้จัดส่งโปรเซสเซอร์ RISC-V มากกว่าหนึ่งพันล้านตัวที่รวมอยู่ใน GPU, CPU, SoC และผลิตภัณฑ์อื่นๆ ตลอดปี 2024

ไทม์ไลน์และเหตุการณ์สำคัญของ NVIDIA กับ RISC-V

  • 2015: NVIDIA เลือก RISC-V เป็นตัวสืบทอด Falcon microcontrollers
  • 2024: มีการจัดส่งโปรเซสเซอร์ RISC-V มากกว่า 1 พันล้านตัวในผลิตภัณฑ์ของ NVIDIA
  • 2024 ตุลาคม: การเปิดเผยข้อมูลใน RISC-V North America Summit
  • 2025 กรกฎาคม 17: การประกาศการสนับสนุน CUDA RISC-V อย่างเป็นทางการใน China Summit

สถาปัตยกรรมทางเทคนิคและความท้าทายในการนำไปใช้

ระบบนิเวศซอฟต์แวร์ CUDA ประกอบด้วยองค์ประกอบพื้นฐานสองส่วนที่ต้องการการปรับแต่งอย่างระมัดระวังสำหรับระบบ RISC-V CUDA Toolkit ทำหน้าที่เป็นคอมไพเลอร์ที่ครอบคลุมพร้อมความสามารถในการคอมไพล์ที่กว้างขวางและองค์ประกอบที่รวมเข้าด้วยกันจำนวนมาก ในขณะที่ส่วนไดรเวอร์จัดการการสื่อสารฮาร์ดแวร์และการจัดสรรทรัพยากร Sijstermanns อธิบายว่า NVIDIA กำลังทำงานอย่างแข็งขันในการปรับแต่งส่วนที่เน้นสีเขียวของซอฟต์แวร์สแต็ก ซึ่งรวมถึงองค์ประกอบสำคัญเช่น CUDA Kernel Mode Driver (KMD) และ CUDA User Mode Driver (UMD)

กระบวนการปรับแต่งขยายไปเกินการควบคุมโดยตรงของ NVIDIA เนื่องจากแอปพลิเคชันของบุคคลที่สามและไลบรารีเฉพาะทางต้องผ่านการปรับตัวเพื่อความเข้ากันได้กับ RISC-V ด้วย NVIDIA ได้พัฒนาไลบรารีเฉพาะทางมากกว่า 900 ตัวในอุตสาหกรรมต่างๆ ระหว่างการพัฒนา CUDA เป็นเวลาสองทศวรรษ รวมถึงไลบรารีเร่งการอนุมาน เครื่องมือวิเคราะห์ข้อมูล และแพ็กเกจเร่งการผลิตเซมิคอนดักเตอร์ ไลบรารีเหล่านี้แสดงถึงระบบนิเวศขนาดใหญ่ที่จะค่อยๆ เปิดให้นักพัฒนา RISC-V ใช้งานได้

ส่วนประกอบของ CUDA Software Stack ที่ต้องการการพอร์ตไปยัง RISC-V

  • CUDA Toolkit (คอมไพเลอร์และเครื่องมือพัฒนา)
  • CUDA Kernel Mode Driver (KMD)
  • CUDA User Mode Driver (UMD)
  • ไลบรารีเฉพาะทางอุตสาหกรรมกว่า 900 ตัว
  • แอปพลิเคชันและเฟรมเวิร์กของบุคคลที่สาม (เช่น PyTorch )

ข้อกำหนดฮาร์ดแวร์และข้อจำกัดปัจจุบัน

ความท้าทายหลักที่การนำ CUDA ไปใช้กับ RISC-V เผชิญอยู่คือความพร้อมใช้งานและความเข้ากันได้ของฮาร์ดแวร์ Sijstermanns เน้นย้ำว่าการใช้งาน CUDA ที่ประสบความสำเร็จต้องการไม่เพียงแต่ CPU RISC-V เท่านั้น แต่ยังต้องการการกำหนดค่าฮาร์ดแวร์ GPU ที่เข้ากันได้ด้วย แม้ว่า NVIDIA จะทำงานกับโปรเซสเซอร์เช่น C920 RISC-V CPU ของ DAMO Academy ของ Alibaba เพื่อวัตถุประสงค์ในการพัฒนา แต่ระบบนิเวศปัจจุบันยังขาด SoC ที่สนับสนุนข้อกำหนด RVA23 ที่ได้รับการอนุมัติเมื่อเร็วๆ นี้อย่างเต็มที่

หน่วยความจำเสมือนแบบรวม (Unified virtual memory) เป็นข้อกำหนดสำคัญสำหรับประสิทธิภาพ CUDA ที่เหมาะสมในระบบ RISC-V เทคโนโลยีนี้ช่วยให้การแบ่งปันข้อมูลระหว่างพื้นที่หน่วยความจำ CPU และ GPU เป็นไปอย่างราบรื่น ทำให้สามารถคัดลอกข้อมูลและรักษาความสอดคล้องข้ามหน่วยประมวลผลได้อย่างมีประสิทธิภาพ หากไม่มีการสนับสนุนหน่วยความจำแบบรวมที่เหมาะสม ประสบการณ์ผู้ใช้และประโยชน์ด้านประสิทธิภาพที่กำหนดความน่าสนใจของ CUDA จะลดลงอย่างมีนัยสำคัญ

ผลกระทบต่ออุตสาหกรรมและความหมายทางตลาด

การขยายการสนับสนุน CUDA ไปยังโปรเซสเซอร์ RISC-V ก่อให้เกิดความท้าทายที่สำคัญต่อการผูกขาดของ x86 และ ARM ที่มีอยู่ในการคำนวณ AI Intel และ AMD ครองตลาดเซิร์ฟเวอร์ x86 ในขณะที่ NVIDIA และยักษ์ใหญ่ด้านเทคโนโลยีอื่นๆ ได้ลงทุนอย่างมากในโซลูชันที่ใช้ ARM สำหรับงาน AI เฉพาะทาง ลักษณะโอเพนซอร์สของ RISC-V ช่วยลดค่าใบอนุญาตและการจ่ายค่าลิขสิทธิ์ ทำให้น่าสนใจเป็นพิเศษสำหรับสตาร์ทอัพ นักพัฒนาขนาดเล็ก และองค์กรที่คำนึงถึงต้นทุน

ข้อได้เปรียบด้านการขยายขนาดของสถาปัตยกรรม RISC-V มีความเกี่ยวข้องเป็นพิเศษในแอปพลิเคชัน AI ขอบเขต ซึ่งการออกแบบชิปที่เรียบง่ายและกระบวนการตรวจสอบสามารถเร่งไทม์ไลน์การพัฒนาได้ บริษัทเช่น Tenstorrent ของ Jim Keller ได้เริ่มใช้ประโยชน์จาก RISC-V สำหรับการพัฒนาชิป AI แล้ว โดยโปรเซสเซอร์ Wormhole n150 และ n300 ของพวกเขาแสดงให้เห็นถึงศักยภาพของสถาปัตยกรรมในโซลูชัน AI ที่คุ้มค่า

การรวมในอนาคตกับระบบนิเวศของ NVIDIA

Sijstermanns ได้ให้นัยถึงความเป็นไปได้ในการรวมที่กว้างขึ้นภายในระบบนิเวศฮาร์ดแวร์ของ NVIDIA โดยเฉพาะอย่างยิ่งเกี่ยวกับเทคโนโลยี NVLink สถาปัตยกรรม NVLink Fusion ซึ่งช่วยให้การสื่อสารความเร็วสูงระหว่างโปรเซสเซอร์และตัวเร่งในสภาพแวดล้อมศูนย์ข้อมูล สามารถรวมโปรเซสเซอร์ RISC-V เป็นองค์ประกอบเส้นทางควบคุมได้ การรวมนี้จะทำให้ RISC-V เป็นองค์ประกอบพื้นฐานในการออกแบบสถาปัตยกรรมระดับแร็กของ NVIDIA

แนวทางที่ไม่ผูกติดกับฮาร์ดแวร์ของบริษัทสะท้อนถึงกลยุทธ์ทางธุรกิจที่เป็นจริงซึ่งเน้นไปที่การคำนวณแบบเร่งมากกว่าความภักดีต่อสถาปัตยกรรมโปรเซสเซอร์ ดังที่ Sijstermanns กล่าวไว้ ความกังวลหลักของ NVIDIA อยู่ที่การมอบความยืดหยุ่นสูงสุดให้กับนักพัฒนาและผู้ใช้ในการเลือกใช้งานคอมพิวติ้ง ไม่ว่าพวกเขาจะชอบโซลูชัน x86, ARM หรือ RISC-V

ความก้าวหน้าของระบบนิเวศ RISC-V ตั้งแต่ปี 2022

  • มีข้อกำหนดใหม่มากกว่า 10 รายการที่ได้รับการอนุมัติจาก RISC-V International Foundation
  • ข้อกำหนด RVA23 (สำคัญสำหรับแอปพลิเคชันเซิร์ฟเวอร์)
  • ข้อกำหนด Server SoC ได้รับการอนุมัติแล้ว
  • มีแพ็กเกจซอฟต์แวร์ที่แตกต่างกัน 75 รายการพร้อมใช้งานบน RISC-V
  • ระบบปฏิบัติการ Linux และการสนับสนุน toolchain เสร็จสมบูรณ์แล้ว

ไทม์ไลน์และการพัฒนาระบบนิเวศ

แม้ว่า NVIDIA ได้มุ่งมั่นต่อการสนับสนุน RISC-V ของ CUDA แต่บริษัทเน้นแนวทางการนำไปใช้อย่างเป็นระบบ ทีมพัฒนากำลังทำงานอย่างใกล้ชิดกับพันธมิตรในระบบนิเวศเพื่อแก้ไขปัญหาความเข้ากันได้และรับประกันการทำงานระดับระบบที่ครอบคลุมก่อนการเปิดตัวสู่สาธารณะ แนวทางที่ระมัดระวังนี้สะท้อนถึงความซับซ้อนของการปรับแต่งซอฟต์แวร์สแต็กที่ผ่านการพัฒนามาแล้วเช่น CUDA ไปสู่สถาปัตยกรรมโปรเซสเซอร์ที่ค่อนข้างใหม่

ความสำเร็จของความคิดริเริ่มนี้ขึ้นอยู่กับการร่วมมืออย่างต่อเนื่องภายในระบบนิเวศ RISC-V รวมถึงผู้ผลิตฮาร์ดแวร์ นักพัฒนาซอฟต์แวร์ และผู้รวมระบบ เมื่อ RISC-V International Foundation ยังคงอนุมัติข้อกำหนดใหม่และขยายความพร้อมใช้งานของแพ็กเกจซอฟต์แวร์ รากฐานสำหรับการรวม CUDA จะแข็งแกร่งขึ้นเรื่อยๆ สัญญาถึงภูมิทัศน์การคำนวณ AI ที่หลากหลายและแข่งขันได้มากขึ้น