ในท่าทีที่เน้นย้ำถึงการเปลี่ยนแปลงลำดับความสำคัญของอุตสาหกรรมปัญญาประดิษฐ์ Nvidia ได้บรรลุข้อตกลงสำคัญกับบริษัทสตาร์ทอัพชิป AI อย่าง Groq ตามรายงาน มูลค่าประมาณ 20,000 ล้านดอลลาร์สหรัฐ ข้อตกลงนี้มีโครงสร้างไม่ใช่การเข้าซื้อกิจการแบบดั้งเดิม แต่เป็นการอนุญาตให้ใช้เทคโนโลยีเชิงกลยุทธ์และการจ้างงานผู้มีความสามารถ โดยให้ Nvidia เข้าถึงทีมวิศวกรหลักของ Groq และเทคโนโลยีการอนุมานความหน่วงเวลาต่ำที่เป็นนวัตกรรม การทำธุรกรรมนี้ซึ่งเกิดขึ้นหลังช่วงวันหยุดคริสต์มาสของสหรัฐฯ ส่งสัญญาณถึงกลยุทธ์เชิงรุกของ Nvidia ในการเสริมสร้างตำแหน่งของตนในขณะที่ตลาด AI กำลังเปลี่ยนโฟกัสอย่างเด็ดขาดจากการฝึกอบรมโมเดลไปสู่การประยุกต์ใช้และกระบวนการอนุมานแบบเรียลไทม์
โครงสร้างข้อตกลงเชิงกลยุทธ์ที่ผิดแผกไปจากเดิม
จากรายงานหลายแหล่ง Nvidia ตกลงที่จะจ่ายเงินสดประมาณ 20,000 ล้านดอลลาร์สหรัฐ เพื่อขออนุญาตใช้เทคโนโลยีจาก Groq และจ้างบุคลากรวิศวกรหลักของบริษัท ซึ่งรวมถึงผู้ก่อตั้งและซีอีโอ Jonathan Ross และประธานบริษัท Sunny Madra เป็นที่น่าสังเกตว่าข้อตกลงนี้ถูกกำหนดให้เป็น "ข้อตกลงการอนุญาตใช้แบบไม่ผูกขาด" โดย Groq จะยังคงดำเนินงานเป็นบริษัทอิสระภายใต้การดูแลของเจ้าหน้าที่ฝ่ายการเงิน โครงสร้างเช่นนี้ซึ่งพบเห็นได้บ่อยขึ้นในหมู่ยักษ์ใหญ่ด้านเทคโนโลยี ช่วยให้สามารถเข้าถึงผู้มีความสามารถและทรัพย์สินทางปัญญาที่เป็นที่ต้องการได้อย่างรวดเร็ว ในขณะเดียวกันก็อาจช่วยลดการตรวจสอบด้านการแข่งขันที่เป็นธรรมที่ใช้เวลานาน ข้อตกลงนี้สรุปเสร็จสิ้นประมาณวันที่ 27 ธันวาคม 2025 หลังจากวันซื้อขายในสหรัฐฯ สั้นลงเนื่องมาจากวันหยุดคริสต์มาส โดย Nvidia เลือกที่จะไม่ออกข่าวประชาสัมพันธ์อย่างเป็นทางการ ซึ่งเป็นเครื่องยืนยันถึงขนาดและความมั่นใจของยักษ์ใหญ่ด้านชิปรายนี้
โครงสร้างข้อตกลง: สัญญาอนุญาตใช้เทคโนโลยีแบบไม่ผูกขาดและการเข้าซื้อตัวบุคลากร Groq ยังคงเป็นบริษัทอิสระ
การตอบสนองต่อจุดเปลี่ยน "Inference Inflection"
เวลาและมูลค่าการลงทุนมหาศาลมีความเชื่อมโยงโดยตรงกับการเปลี่ยนแปลงพื้นฐานของตลาด ข้อมูลอุตสาหกรรมจาก TrendForce และ MLCommons บ่งชี้ว่า ปี 2025 เป็นจุดเปลี่ยนทางประวัติศาสตร์ ซึ่งรายได้จากปริมาณงาน AI inference (52.3%) ได้แซงหน้ารายได้จากการฝึกอบรมเป็นครั้งแรก "จุดเปลี่ยนการอนุมาน" นี้สร้างความต้องการที่พุ่งสูงขึ้นสำหรับโปรเซสเซอร์ที่ปรับให้เหมาะสมไม่ใช่เพื่อพลังการประมวลผลแบบขนานขั้นสูงสุด แต่เพื่อความหน่วงเวลาต่ำ ประสิทธิภาพพลังงานสูง และเวลาในการตอบสนองที่แน่นอน ซึ่งเป็นพื้นที่ที่หน่วยประมวลผลภาษาเฉพาะทาง (LPU) ของ Groq ทำได้ดีเยี่ยม ในขณะที่ GPU ของ Nvidia ครองตลาดด้านการฝึกอบรม สถาปัตยกรรมของมันกลับเผชิญกับความท้าทายในขั้นตอนถอดรหัสของการอนุมาน ซึ่งการสร้างโทเค็นตามลำดับอาจถูกจำกัดด้วยแบนด์วิธของหน่วยความจำ
บริบทตลาด (2025): รายได้จากงาน AI inference (52.3%) แซงหน้ารายได้จากงาน training เป็นครั้งแรก (ที่มา: TrendForce/MLCommons)
LPU ของ Groq: ผู้เชี่ยวชาญด้านความเร็ว
ข้อเสนอหลักของ Groq อยู่ที่สถาปัตยกรรม LPU ซึ่งถูกออกแบบมาโดยเฉพาะสำหรับการอนุมานความเร็วสูงสุด แตกต่างจาก GPU ที่พึ่งพาหน่วยความจำแบนด์วิธสูง (HBM) ที่อยู่ภายนอกแผ่นชิปประมวลผลหลัก LPU ของ Groq ใช้หน่วยความจำ SRAM บนชิปเป็นจำนวนมาก การออกแบบนี้ขจัดความจำเป็นในการดึงข้อมูลจากหน่วยความจำภายนอกในแต่ละรอบการคำนวณระหว่างการสร้างโทเค็น ส่งผลให้ความหน่วงเวลาลดลงอย่างมาก ผลการทดสอบประสิทธิภาพแสดงให้เห็นว่า LPU ของ Groq สามารถสร้างโทเค็นได้ที่ความเร็ว 300-500 โทเค็นต่อวินาที ซึ่งแซงหน้า GPU รุ่นร่วมสมัยและ ASIC อื่นๆ อย่างมีนัยสำคัญในแง่ของปริมาณงานล้วนๆ สำหรับงานนี้ อย่างไรก็ตาม ความเร็วนี้มาพร้อมกับการแลกเปลี่ยน: ชิป LPU เดียวมีหน่วยความจำบนชิปเพียง 230MB ทำให้จำเป็นต้องใช้ชิปหลายร้อยชิปที่เชื่อมต่อถึงกันเพื่อรันโมเดลภาษาขนาดใหญ่ เช่น Llama-3 70B เมื่อเทียบกับการใช้ GPU ความจุสูงเพียงไม่กี่ตัว
ข้อมูลจำเพาะหลักของ Groq LPU (เทียบกับ Nvidia GPU):
- หน่วยความจำ: ~230 MB SRAM บนชิป (LPU) เทียบกับ 141 GB HBM3e (Nvidia H200 GPU)
- จุดเน้นสถาปัตยกรรม: ปรับให้เหมาะสมสำหรับการสร้างโทเค็นแบบลำดับที่มีความหน่วงต่ำ (ขั้นตอนถอดรหัส)
- ประสิทธิภาพที่รายงาน: ความเร็วในการสร้าง 300-500 โทเค็น/วินาที สำหรับการอนุมานผู้ใช้รายเดียว
การเล่นเกมรับและรุกของ Nvidia
นักวิเคราะห์มองว่าข้อตกลงนี้เป็นกลยุทธ์การแข่งขันที่ยอดเยี่ยม ในด้านหนึ่ง มันเป็นการเคลื่อนไหวเชิงรับเพื่อลดทอนภัยคุกคามที่อาจเกิดขึ้น ความสำเร็จของทางเลือกอื่นๆ เช่น Tensor Processing Unit (TPU) ของ Google ได้แสดงให้เห็นว่า GPU ไม่ใช่เส้นทางเดียวที่เป็นไปได้สำหรับการคำนวณ AI LPU ของ Groq ด้วยความเร็วในการอนุมานที่เหนือกว่า แสดงให้เห็นเส้นทางที่ชัดเจนสำหรับคู่แข่งในการกัดกร่อนความโดดเด่นของ Nvidia ในตลาดการอนุมานที่กำลังเติบโต ด้วยการนำทีมและเทคโนโลยีของ Groq เข้ามาเป็นส่วนหนึ่ง Nvidia จึงสร้างภูมิคุ้มกันให้กับตัวเองจากความเสี่ยงที่อาจก่อให้เกิดการเปลี่ยนแปลงนี้ได้อย่างมีประสิทธิภาพ ในอีกด้านหนึ่ง มันเป็นการขยายตัวอย่างรุกราน ข้อตกลงนี้ทำให้ Nvidia สามารถเสริมสร้างสแต็กการอนุมานของตนได้ทันที โดยนำเสนอผลิตภัณฑ์ในอนาคตที่อาจรวมพลังการประมวลผลแบบขนานของ GPU สำหรับขั้นตอน "เติมข้อมูลล่วงหน้า" (prefill) เข้ากับความสามารถในการถอดรหัสที่เร็วเหมือนสายฟ้าของการออกแบบที่ได้รับแรงบันดาลใจจาก LPU เพื่อสร้างระบบนิเวศฮาร์ดแวร์ AI ที่ครอบคลุมและไร้เทียมทานมากขึ้น
เศรษฐศาสตร์ใหม่ของฮาร์ดแวร์ AI
ข้อตกลงกับ Groq ยังเน้นย้ำถึงความเป็นจริงทางเศรษฐกิจที่กำลังพัฒนาขึ้นในโครงสร้างพื้นฐาน AI ธุรกิจ GPU ชั้นนำที่มีอัตรากำไรสูงซึ่งขับเคลื่อนความเฟื่องฟูด้านการฝึกอบรม กำลังถูกเสริมด้วยตลาดการอนุมาน ซึ่งนักวิเคราะห์อธิบายว่าเป็นกิจกรรมที่มีปริมาณสูงแต่มีอัตรากำไรต่ำกว่า ลูกค้าตอนนี้แสดงให้เห็นถึงความเต็มใจที่จะจ่ายเงินเพิ่มสำหรับความเร็วในการอนุมานและการรับประกันความหน่วงเวลา ซึ่งเป็นความต้องการที่ Groq ได้สร้างรายได้จากมันสำเร็จแล้ว สำหรับ Nvidia นี่แสดงถึงทั้งกระแสรายได้ใหม่และการปรับตัวที่จำเป็น เมื่อโฟกัสของ AI เปลี่ยนไปสู่การปรับใช้และแอปพลิเคชันที่ผู้ใช้สัมผัสได้ การชนะในสนามการอนุมานจึงกลายเป็นสิ่งสำคัญต่อการรักษาความเป็นผู้นำโดยรวม เงินสำรองมหาศาลของ Nvidia ซึ่งมีมูลค่า 60,600 ล้านดอลลาร์สหรัฐ ณ ตุลาคม 2025 ให้พลังในการลงทุนเชิงกลยุทธ์เช่นนี้ เพื่อให้มั่นใจว่าบริษัทสามารถกำหนดมาตรฐานโครงสร้างพื้นฐานสำหรับยุค AI แบบเรียลไทม์ที่กำลังดำเนินไปอย่างมั่นคง แทนที่จะถูกเปลี่ยนแปลงโดยมัน
สถานะเงินสดของ Nvidia (ตุลาคม 2025): เงินสดและเงินลงทุนระยะสั้นมูลค่า 60.6 พันล้านดอลลาร์สหรัฐ
หนทางข้างหน้าและคำถามที่ยังไม่มีคำตอบ
แม้เหตุผลเชิงกลยุทธ์จะชัดเจน แต่รายละเอียดหลายประเด็นยังคงไม่ได้รับการแก้ไข ลักษณะการอนุญาตใช้แบบไม่ผูกขาดของข้อตกลงทำให้เกิดคำถามว่าทรัพย์สินทางปัญญา LPU ของ Groq จะยังคงสามารถอนุญาตให้คู่แข่งของ Nvidia ใช้ได้หรือไม่ ยิ่งไปกว่านั้น ชะตากรรมของธุรกิจคลาวด์ที่เพิ่งเริ่มต้นของ Groq และวิธีการที่มันอาจมีปฏิสัมพันธ์กับบริการของ Nvidia เองก็ยังไม่แน่ชัด อุตสาหกรรมจะจับตาดูคำพูดจาก Jensen Huang ซีอีโอของ Nvidia อย่างใกล้ชิด ซึ่งอาจเกิดขึ้นในงาน CES ที่จะมาถึงในลาสเวกัส วันที่ 5 มกราคม 2026 สิ่งที่ปฏิเสธไม่ได้คือด้วยการเคลื่อนไหวมูลค่า 20,000 ล้านดอลลาร์สหรัฐนี้ Nvidia ไม่ได้เพียงแค่เข้าซื้อกิจการบริษัท แต่ได้ทำการลงทุนที่เด็ดขาดในการกำหนดมาตรฐานโครงสร้างพื้นฐานสำหรับยุค AI แบบเรียลไทม์ที่กำลังดำเนินไปอย่างมั่นคงแล้ว
