สตาร์ทอัพ AI จีน MiniMax ได้เข้าสู่เวทีการแข่งขันโมเดลเหตุผลด้วยการท้าชิงผู้นำอุตสาหกรรมอย่าง DeepSeek อย่างกล้าหาญ การประกาศครั้งล่าสุดของบริษัทเป็นจุดสำคัญในการแข่งขันที่ดำเนินอยู่ระหว่างบริษัท AI ใหญ่ 6 อันดับแรกของจีนในการพัฒนาความสามารถด้านการใช้เหตุผลขั้นสูงที่สามารถแข่งขันกับผู้นำระดับโลกได้
การพัฒนาด้านความยาวบริบทและประสิทธิภาพที่ปฏิวัติวงการ
โมเดล M1 ของ MiniMax นำเสนอความสามารถที่แปลกใหม่ด้วยการรองรับการป้อนข้อมูลบริบท 1 ล้านโทเค็น เทียบเท่ากับ Gemini 2.5 Pro ของ Google และแสดงให้เห็นถึงการปรับปรุงที่เพิ่มขึ้น 8 เท่าจากความสามารถของ DeepSeek R1 โมเดลนี้ยังรองรับโทเค็นสำหรับผลลัพธ์การใช้เหตุผลได้สูงสุด 80,000 โทเค็น ซึ่งกำหนดมาตรฐานใหม่ของอุตสาหกรรมสำหรับการประมวลผลบริบทยาว ความสำเร็จนี้เกิดจากกลไก Lightning Attention ที่เป็นกรรมสิทธิ์ของ MiniMax ซึ่งเป็นแนวทางใหม่ในการคำนวณเมทริกซ์ความสนใจที่ลดค่าใช้จ่ายในการคำนวณอย่างมีนัยสำคัญในระหว่างขั้นตอนการฝึกและการอนุมาน
ข้อมูลจำเพาะหลักของ MiniMax M1
- Context Input: 1,000,000 โทเค็น (มากกว่า DeepSeek R1 ถึง 8 เท่า)
- Reasoning Output: 80,000 โทเค็น
- ต้นทุนการฝึกอบรม: 534,700 ดอลลาร์สหรัฐ (ใช้ GPU H800 จำนวน 512 ตัว เป็นเวลา 3 สัปดาห์)
- สถาปัตยกรรม: Mixed MoE พร้อมกลไก Lightning Attention
- อัลกอริทึม: การเรียนรู้เสริมแรง CISPO (บรรจบเร็วกว่า DAPO ถึง 2 เท่า)
การฝึกที่คุ้มค่าผ่านนวัตกรรมทางเทคนิค
บริษัทบรรลุประสิทธิภาพด้านต้นทุนที่น่าทึ่งในการพัฒนาโมเดล โดยทำการฝึกในขั้นตอนการเรียนรู้เสริมแรงทั้งหมดให้เสร็จสิ้นโดยใช้ GPU H800 เพียง 512 ตัวในระยะเวลา 3 สัปดาห์ ด้วยต้นทุนการเช่าเพียง 534,700 ดอลลาร์สหรัฐ ซึ่งแสดงให้เห็นถึงการลดลงสิบเท่าจากการคาดการณ์เบื้องต้น และแสดงให้เห็นถึงประสิทธิผลของนวัตกรรมทางเทคนิคของ MiniMax การพัฒนานี้เกิดขึ้นผ่านอัลกอริทึมการเรียนรู้เสริมแรง CISPO ที่พัฒนาขึ้นใหม่ ซึ่งเพิ่มประสิทธิภาพน้ำหนักการสุ่มตัวอย่างความสำคัญแทนการอัปเดตโทเค็นแบบดั้งเดิม ส่งผลให้ความเร็วในการลู่เข้าเร็วกว่าแนวทางการแข่งขันสองเท่า รวมถึงอัลกอริทึม DAPO ล่าสุดของ ByteDance
ประสิทธิภาพการแข่งขันในมาตรฐานอุตสาหกรรม
การทดสอบอย่างครอบคลุมใน 17 ชุดข้อมูลการประเมินหลักเผยให้เห็นตำแหน่งการแข่งขันที่แข็งแกร่งของ M1 ในตลาด โมเดลแสดงประสิทธิภาพที่เทียบเคียงได้กับ DeepSeek R1 และ Qwen3 ในการทดสอบมาตรฐานหลายรายการ ขณะที่เข้าใกล้ความสามารถของโมเดล O3 ของ OpenAI ที่น่าสังเกตเป็นพิเศษคือประสิทธิภาพที่เหนือกว่าของ M1 ในสถานการณ์การใช้เครื่องมือตัวแทนผ่านการประเมิน TAU-bench ซึ่งมีประสิทธิภาพเหนือกว่า Gemini 2.5 Pro ของ Google แม้จะตามหลังเล็กน้อยในงานความเข้าใจบริบทยาวทั่วไป
เกณฑ์มาตรฐานประสิทธิภาพ
- ทดสอบกับชุดข้อมูลประเมินหลัก 17 ชุด
- ประสิทธิภาพเทียบเคียงได้กับ DeepSeek R1 และ Qwen3
- ใกล้เคียงความสามารถของ OpenAI O3
- มีประสิทธิภาพเหนือกว่า Gemini 2.5 Pro ใน TAU-bench (การใช้เครื่องมือของเอเจนต์)
- ตามหลัง Gemini 2.5 Pro เล็กน้อยในด้านความเข้าใจบริบทยาว
การกำหนดราคาเชิงกลยุทธ์เพื่อการเจาะตลาด
MiniMax ได้ใช้โครงสร้างราคาแบบหลายระดับที่ออกแบบมาเพื่อเพิ่มการเข้าถึงสูงสุดขณะรักษาข้อได้เปรียบในการแข่งขัน สำหรับความยาวบริบท 0-32k โทเค็น บริษัทเรียกเก็บ 0.8 หยวนจีนต่อล้านโทเค็นอินพุตและ 8 หยวนจีนต่อล้านโทเค็นเอาต์พุต ช่วง 32k-128k มีราคา 1.2 หยวนจีนสำหรับอินพุตและ 16 หยวนจีนสำหรับเอาต์พุตต่อล้านโทเค็น ขณะที่ช่วงสูงสุด 128k-1M มีราคา 2.4 หยวนจีนสำหรับอินพุตและ 24 หยวนจีนสำหรับเอาต์พุต กลยุทธ์การกำหนดราคานี้ทำให้ M1 มีความคุ้มค่ากว่า DeepSeek R1 ในสองระดับแรก ขณะที่เสนอความสามารถที่เป็นเอกลักษณ์ในระดับสูงสุดที่ DeepSeek ไม่สามารถเทียบได้
การเปรียบเทียบราคา (ต่อหนึ่งล้าน tokens)
ความยาว Context | ราคา Input (CNY) | ราคา Output (CNY) |
---|---|---|
0-32k | 0.8 | 8 |
32k-128k | 1.2 | 16 |
128k-1M | 2.4 | 24 |
หมายเหตุ: สองระดับแรกให้ความคุ้มค่าด้านราคาต่อประสิทธิภาพที่ดีกว่า DeepSeek R1 ; ระดับสูงสุดไม่มีให้บริการใน DeepSeek
ระบบนิเวศผลิตภัณฑ์ที่กว้างขวางและความมุ่งหวัง IPO
การเปิดตัว M1 เป็นเพียงส่วนหนึ่งของซีรีส์การประกาศผลิตภัณฑ์ครอบคลุม 5 วันของ MiniMax ซึ่งยังรวมถึงโมเดลการสร้างวิดีโอ Hailuo 02 และแพลตฟอร์ม MiniMax Agent การเปิดตัวผลิตภัณฑ์อย่างก้าวร้าวนี้เกิดขึ้นในขณะที่บริษัทรายงานว่ากำลังเตรียมตัวสำหรับ IPO ที่อาจเกิดขึ้นในฮ่องกง ตามหลัง Zhipu AI คู่แข่งที่ย้ายไปยื่นขอจดทะเบียนสาธารณะก่อนหน้านี้ ผู้สังเกตการณ์อุตสาหกรรมสังเกตว่า MiniMax เผชิญกับความท้าทายที่สำคัญในการตอบสนองความต้องการรายได้ IPO โดยรายได้ปัจจุบันขึ้นอยู่กับแอปพลิเคชันการเล่นบทบาทตัวละคร Talkie ที่ประสบความสำเร็จและแพลตฟอร์ม Hailuo AI วิดีโอใหม่เป็นหลัก
ตำแหน่งตลาดและแนวโน้มอนาคต
การวางตำแหน่งเชิงกลยุทธ์ของ MiniMax สะท้อนให้เห็นถึงการแข่งขันที่รุนแรงระหว่างสตาร์ทอัพ AI ของจีนในการรักษาความเกี่ยวข้องหลังจากการรบกวนตลาดของ DeepSeek การมุ่งเน้นของบริษัทในความสามารถแบบมัลติโมดัล โดยเฉพาะในการสร้างวิดีโอที่ Hailuo AI ได้บรรลุความเป็นผู้นำระดับโลกในการจัดอันดับผลิตภัณฑ์การสร้างวิดีโอ ให้แนวทางที่แตกต่างเมื่อเปรียบเทียบกับคู่แข่งที่มุ่งเน้นข้อความเพียงอย่างเดียว อย่างไรก็ตาม ความสำเร็จของ M1 และผลิตภัณฑ์ที่เกี่ยวข้องจะเป็นตัวกำหนดในที่สุดว่า MiniMax สามารถรักษาตำแหน่งในหมู่บริษัท AI จีนระดับแนวหน้าได้หรือไม่ ขณะที่สร้างรากฐานรายได้ที่จำเป็นสำหรับการเข้าสู่ตลาดสาธารณะอย่างประสบความสำเร็จ