MiniMax เปิดตัวโมเดลเหตุผล M1 ท้าชิง DeepSeek ด้วยบริบท 1 ล้านโทเค็นและต้นทุนการฝึกที่ต่ำมาก

ทีมบรรณาธิการ BigGo

MiniMax เปิดตัวโมเดลเหตุผล M1 ท้าชิง DeepSeek ด้วยบริบท 1 ล้านโทเค็นและต้นทุนการฝึกที่ต่ำมาก

สตาร์ทอัพ AI จีน MiniMax ได้เข้าสู่เวทีการแข่งขันโมเดลเหตุผลด้วยการท้าชิงผู้นำอุตสาหกรรมอย่าง DeepSeek อย่างกล้าหาญ การประกาศครั้งล่าสุดของบริษัทเป็นจุดสำคัญในการแข่งขันที่ดำเนินอยู่ระหว่างบริษัท AI ใหญ่ 6 อันดับแรกของจีนในการพัฒนาความสามารถด้านการใช้เหตุผลขั้นสูงที่สามารถแข่งขันกับผู้นำระดับโลกได้

การพัฒนาด้านความยาวบริบทและประสิทธิภาพที่ปฏิวัติวงการ

โมเดล M1 ของ MiniMax นำเสนอความสามารถที่แปลกใหม่ด้วยการรองรับการป้อนข้อมูลบริบท 1 ล้านโทเค็น เทียบเท่ากับ Gemini 2.5 Pro ของ Google และแสดงให้เห็นถึงการปรับปรุงที่เพิ่มขึ้น 8 เท่าจากความสามารถของ DeepSeek R1 โมเดลนี้ยังรองรับโทเค็นสำหรับผลลัพธ์การใช้เหตุผลได้สูงสุด 80,000 โทเค็น ซึ่งกำหนดมาตรฐานใหม่ของอุตสาหกรรมสำหรับการประมวลผลบริบทยาว ความสำเร็จนี้เกิดจากกลไก Lightning Attention ที่เป็นกรรมสิทธิ์ของ MiniMax ซึ่งเป็นแนวทางใหม่ในการคำนวณเมทริกซ์ความสนใจที่ลดค่าใช้จ่ายในการคำนวณอย่างมีนัยสำคัญในระหว่างขั้นตอนการฝึกและการอนุมาน

ข้อมูลจำเพาะหลักของ MiniMax M1

Context Input: 1,000,000 โทเค็น (มากกว่า DeepSeek R1 ถึง 8 เท่า)
Reasoning Output: 80,000 โทเค็น
ต้นทุนการฝึกอบรม: 534,700 ดอลลาร์สหรัฐ (ใช้ GPU H800 จำนวน 512 ตัว เป็นเวลา 3 สัปดาห์)
สถาปัตยกรรม: Mixed MoE พร้อมกลไก Lightning Attention
อัลกอริทึม: การเรียนรู้เสริมแรง CISPO (บรรจบเร็วกว่า DAPO ถึง 2 เท่า)

การฝึกที่คุ้มค่าผ่านนวัตกรรมทางเทคนิค

บริษัทบรรลุประสิทธิภาพด้านต้นทุนที่น่าทึ่งในการพัฒนาโมเดล โดยทำการฝึกในขั้นตอนการเรียนรู้เสริมแรงทั้งหมดให้เสร็จสิ้นโดยใช้ GPU H800 เพียง 512 ตัวในระยะเวลา 3 สัปดาห์ ด้วยต้นทุนการเช่าเพียง 534,700 ดอลลาร์สหรัฐ ซึ่งแสดงให้เห็นถึงการลดลงสิบเท่าจากการคาดการณ์เบื้องต้น และแสดงให้เห็นถึงประสิทธิผลของนวัตกรรมทางเทคนิคของ MiniMax การพัฒนานี้เกิดขึ้นผ่านอัลกอริทึมการเรียนรู้เสริมแรง CISPO ที่พัฒนาขึ้นใหม่ ซึ่งเพิ่มประสิทธิภาพน้ำหนักการสุ่มตัวอย่างความสำคัญแทนการอัปเดตโทเค็นแบบดั้งเดิม ส่งผลให้ความเร็วในการลู่เข้าเร็วกว่าแนวทางการแข่งขันสองเท่า รวมถึงอัลกอริทึม DAPO ล่าสุดของ ByteDance

ประสิทธิภาพการแข่งขันในมาตรฐานอุตสาหกรรม

การทดสอบอย่างครอบคลุมใน 17 ชุดข้อมูลการประเมินหลักเผยให้เห็นตำแหน่งการแข่งขันที่แข็งแกร่งของ M1 ในตลาด โมเดลแสดงประสิทธิภาพที่เทียบเคียงได้กับ DeepSeek R1 และ Qwen3 ในการทดสอบมาตรฐานหลายรายการ ขณะที่เข้าใกล้ความสามารถของโมเดล O3 ของ OpenAI ที่น่าสังเกตเป็นพิเศษคือประสิทธิภาพที่เหนือกว่าของ M1 ในสถานการณ์การใช้เครื่องมือตัวแทนผ่านการประเมิน TAU-bench ซึ่งมีประสิทธิภาพเหนือกว่า Gemini 2.5 Pro ของ Google แม้จะตามหลังเล็กน้อยในงานความเข้าใจบริบทยาวทั่วไป

เกณฑ์มาตรฐานประสิทธิภาพ

ทดสอบกับชุดข้อมูลประเมินหลัก 17 ชุด
ประสิทธิภาพเทียบเคียงได้กับ DeepSeek R1 และ Qwen3
ใกล้เคียงความสามารถของ OpenAI O3
มีประสิทธิภาพเหนือกว่า Gemini 2.5 Pro ใน TAU-bench (การใช้เครื่องมือของเอเจนต์)
ตามหลัง Gemini 2.5 Pro เล็กน้อยในด้านความเข้าใจบริบทยาว

การกำหนดราคาเชิงกลยุทธ์เพื่อการเจาะตลาด

MiniMax ได้ใช้โครงสร้างราคาแบบหลายระดับที่ออกแบบมาเพื่อเพิ่มการเข้าถึงสูงสุดขณะรักษาข้อได้เปรียบในการแข่งขัน สำหรับความยาวบริบท 0-32k โทเค็น บริษัทเรียกเก็บ 0.8 หยวนจีนต่อล้านโทเค็นอินพุตและ 8 หยวนจีนต่อล้านโทเค็นเอาต์พุต ช่วง 32k-128k มีราคา 1.2 หยวนจีนสำหรับอินพุตและ 16 หยวนจีนสำหรับเอาต์พุตต่อล้านโทเค็น ขณะที่ช่วงสูงสุด 128k-1M มีราคา 2.4 หยวนจีนสำหรับอินพุตและ 24 หยวนจีนสำหรับเอาต์พุต กลยุทธ์การกำหนดราคานี้ทำให้ M1 มีความคุ้มค่ากว่า DeepSeek R1 ในสองระดับแรก ขณะที่เสนอความสามารถที่เป็นเอกลักษณ์ในระดับสูงสุดที่ DeepSeek ไม่สามารถเทียบได้

การเปรียบเทียบราคา (ต่อหนึ่งล้าน tokens)

ความยาว Context	ราคา Input (CNY)	ราคา Output (CNY)
0-32k	0.8	8
32k-128k	1.2	16
128k-1M	2.4	24

หมายเหตุ: สองระดับแรกให้ความคุ้มค่าด้านราคาต่อประสิทธิภาพที่ดีกว่า DeepSeek R1 ; ระดับสูงสุดไม่มีให้บริการใน DeepSeek

ระบบนิเวศผลิตภัณฑ์ที่กว้างขวางและความมุ่งหวัง IPO

การเปิดตัว M1 เป็นเพียงส่วนหนึ่งของซีรีส์การประกาศผลิตภัณฑ์ครอบคลุม 5 วันของ MiniMax ซึ่งยังรวมถึงโมเดลการสร้างวิดีโอ Hailuo 02 และแพลตฟอร์ม MiniMax Agent การเปิดตัวผลิตภัณฑ์อย่างก้าวร้าวนี้เกิดขึ้นในขณะที่บริษัทรายงานว่ากำลังเตรียมตัวสำหรับ IPO ที่อาจเกิดขึ้นในฮ่องกง ตามหลัง Zhipu AI คู่แข่งที่ย้ายไปยื่นขอจดทะเบียนสาธารณะก่อนหน้านี้ ผู้สังเกตการณ์อุตสาหกรรมสังเกตว่า MiniMax เผชิญกับความท้าทายที่สำคัญในการตอบสนองความต้องการรายได้ IPO โดยรายได้ปัจจุบันขึ้นอยู่กับแอปพลิเคชันการเล่นบทบาทตัวละคร Talkie ที่ประสบความสำเร็จและแพลตฟอร์ม Hailuo AI วิดีโอใหม่เป็นหลัก

ตำแหน่งตลาดและแนวโน้มอนาคต

การวางตำแหน่งเชิงกลยุทธ์ของ MiniMax สะท้อนให้เห็นถึงการแข่งขันที่รุนแรงระหว่างสตาร์ทอัพ AI ของจีนในการรักษาความเกี่ยวข้องหลังจากการรบกวนตลาดของ DeepSeek การมุ่งเน้นของบริษัทในความสามารถแบบมัลติโมดัล โดยเฉพาะในการสร้างวิดีโอที่ Hailuo AI ได้บรรลุความเป็นผู้นำระดับโลกในการจัดอันดับผลิตภัณฑ์การสร้างวิดีโอ ให้แนวทางที่แตกต่างเมื่อเปรียบเทียบกับคู่แข่งที่มุ่งเน้นข้อความเพียงอย่างเดียว อย่างไรก็ตาม ความสำเร็จของ M1 และผลิตภัณฑ์ที่เกี่ยวข้องจะเป็นตัวกำหนดในที่สุดว่า MiniMax สามารถรักษาตำแหน่งในหมู่บริษัท AI จีนระดับแนวหน้าได้หรือไม่ ขณะที่สร้างรากฐานรายได้ที่จำเป็นสำหรับการเข้าสู่ตลาดสาธารณะอย่างประสบความสำเร็จ

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌