บริษัทวิจัย AI ของจีน DeepSeek ได้เปิดตัวโมเดลโอเพนซอร์สล่าสุดอย่างเป็นทางการ DeepSeek-V3.1 ซึ่งเป็นการก้าวหน้าอย่างมีนัยสำคัญในด้านความสามารถของปัญญาประดิษฐ์ พร้วมไปกับการประกาศเพิ่มราคาบริการ API อย่างมาก การเปิดตัวครั้งนี้มีความหมายมากกว่าการอัปเกรดพารามิเตอร์จาก 671 พันล้านเป็น 685 พันล้านพารามิเตอร์ โดยได้นำเสนอสถาปัตยกรรมการใช้เหตุผลแบบไฮบริดที่ก้าวล้ำ ซึ่งอาจเปลี่ยนแปลงวิธีที่ระบบ AI โต้ตอบกับผู้ใช้และจัดการงานที่ซับซ้อน
สถาปัตยกรรมการใช้เหตุผลแบบไฮบริดที่ปฏิวัติวงการ
DeepSeek-V3.1 นำเสนอสถาปัตยกรรมการใช้เหตุผลแบบไฮบริดที่เป็นครั้งแรกในอุตสาหกรรม ซึ่งช่วยให้โมเดลเดียวสามารถเปลี่ยนระหว่างโหมดการคิด (deepseek-reasoner) และโหมดไม่คิด (deepseek-chat) ได้อย่างราบรื่น ผู้ใช้สามารถสลับระหว่างโหมดเหล่านี้ผ่านแอปหรือเว็บอินเทอร์เฟซอย่างเป็นทางการโดยใช้ปุ่มการคิดเชิงลึก โหมดไม่คิดมุ่งเป้าไปที่คำถามง่าย ๆ เช่น สภาพอากาศหรือคำถามสารานุกรม โดยให้ผลลัพธ์ที่คล่องตัวพร้วมเวลาตอบสนองที่เร็วขึ้น 20% ในขณะที่โหมดการคิดจัดการกับปัญหาที่ซับซ้อน เช่น การพิสูจน์ทางคณิตศาสตร์และการดีบักโค้ด โดยการเปิดใช้งานห่วงโซ่การใช้เหตุผลเชิงลึกภายใน ผลิตตรรกะที่เข้มงวดมากขึ้นแต่ต้องแลกกับการตอบสนองที่ช้าลงเล็กน้อย
ประสิทธิภาพที่เพิ่มขึ้นผ่านการบีบอัด Chain-of-Thought
โมเดลใหม่แสดงให้เห็นการปรับปรุงประสิทธิภาพที่น่าทึ่งผ่านการฝึกอบรมการบีบอัด chain-of-thought ขั้นสูง DeepSeek-V3.1 รักษาระดับประสิทธิภาพที่เทียบเคียงกับรุ่นก่อนหน้า R1-0528 ในขณะที่ลดการสร้างโทเค็นเอาต์พุตลง 20-50% งานที่เคยต้องใช้ 1,000 โทเค็นตอนนี้สามารถทำให้เสร็จด้วยเพียง 500 โทเค็นในขณะที่ยังคงคุณภาพเอาต์พุตที่เทียบเท่า การเพิ่มประสิทธิภาพนี้แปลเป็นต้นทุนการคำนวณที่ลดลงอย่างมากและความล่าช้าในการตอบสนองที่ลดลง ทำให้เทคโนโลยีนี้เข้าถึงได้มากขึ้นสำหรับการนำไปใช้อย่างแพร่หลาย
เกณฑ์มาตรฐานประสิทธิภาพ
การทดสอบ | คะแนน DeepSeek-V3.1 | คะแนนโมเดลก่อนหน้า |
---|---|---|
คณิตศาสตร์ AIME 2015 | 87.5/100 | 88.4/100 |
วิทยาศาสตร์ GPQA | 81/100 | 80.1/100 |
liveCodeBench | 73.3/100 | 74.8/100 |
การลดจำนวน Token | น้อยกว่า 20-50% | พื้นฐาน |
ข้อมูลจำเพาะทางเทคนิคและเกณฑ์มาตรฐานประสิทธิภาพ
สร้างบนสถาปัตยกรรม Mixture-of-Experts (MoE) พารามิเตอร์ 685 พันล้านของ DeepSeek-V3.1 เปิดใช้งานเพียง 37 พันล้านพารามิเตอร์ต่อโทเค็น บรรลุสมดุลที่เหมาะสมระหว่างประสิทธิภาพและประสิทธิผล โมเดลรองรับรูปแบบเทนเซอร์หลายแบบรวมถึง BF16, FP8 (F8_E4M3) และ F32 ให้นักพัฒนามีความยืดหยุ่นในการปรับแต่งฮาร์ดแวร์ โมเดลพื้นฐานได้รับการฝึกอบรมเพิ่มเติมด้วย 840 พันล้านโทเค็นเกินจากพื้นฐาน V3 ขยายความสามารถในการประมวลผลบริบทยาวไปที่ 128K โทเค็น ซึ่งเทียบเท่ากับประมาณ 130,000 อักขระจีนหรือ 80 บทแรกของ Dream of the Red Chamber
การเปรียบเทียบข้อมูลจำเพาะของโมเดล
คุณสมบัติ | DeepSeek-V3 | DeepSeek-V3.1 |
---|---|---|
พารามิเตอร์ทั้งหมด | 671 พันล้าน | 685 พันล้าน |
พารามิเตอร์ที่ใช้งานต่อโทเค็น | 37 พันล้าน | 37 พันล้าน |
หน้าต่างบริบท | 128K โทเค็น | 128K โทเค็น |
การฝึกอบรมเพิ่มเติม | - | 840B โทเค็น |
มาตรฐานความแม่นยำ | Standard FP8 | UE8M0 FP8 |
สถาปัตยกรรม | MoE | Hybrid MoE |
การนำมาตรฐาน UE8M0 FP8 มาใช้อย่างเป็นกลยุทธ์
บางทีสิ่งที่สำคัญที่สุดสำหรับภูมิทัศน์ AI ทั่วโลก DeepSeek-V3.1 นำมาตรฐานความแม่นยำ UE8M0 FP8 มาใช้ ซึ่งออกแบบมาโดยเฉพาะสำหรับชิปจีนในประเทศรุ่นใหม่ การตัดสินใจทางเทคนิคนี้แสดงถึงการเบี่ยงเบนเชิงกลยุทธ์จากมาตรฐาน E4M3/E5M2 FP8 ของ NVIDIA ซึ่งอาจสร้างเส้นทางระบบนิเวศ AI ที่แตกต่างกันสองแบบ รูปแบบ UE8M0 ให้ความสำคัญกับการใช้พลังงานที่ต่ำกว่าและการคำนวณที่เร็วกว่าความแม่นยำสูงที่เสนอโดยมาตรฐานของ NVIDIA ทำให้เหมาะสมกว่าสำหรับสถาปัตยกรรมชิปในประเทศที่มีปรัชญาการออกแบบที่แตกต่างกน
การปรับราคา API อย่างมาก
ควบคู่ไปกับการประกาศทางเทคนิค DeepSeek เปิดเผยการเปลี่ยนแปลงราคาที่สำคัญซึ่งมีผลตั้งแต่วันที่ 6 กันยายน ราคาอินพุตสำหรับ cache miss จะเพิ่มขึ้นจากหยวนจีน 2 เป็น 4 หยวนต่อล้านโทเค็น ในขณะที่ราคาเอาต์พุตเพิ่มขึ้นจาก 8 เป็น 12 หยวนต่อล้านโทเค็น บริษัทยังยกเลิกส่วนลดราคาช่วงกลางคืนด้วย การปรับเปลี่ยนเหล่านี้สะท้อนถึงการลงทุนด้านการวิจัยและพัฒนาที่มากมายที่จำเป็นสำหรับการอัปเกรด V3.1 รวมถึงการฝึกอบรม 840 พันล้านโทเค็นเพิ่มเติมและการปรับความแม่นยำ UE8M0 FP8 เพื่อความเข้ากันได้กับชิปในประเทศ
การเปลี่ยนแปลงราคา API (มีผลตั้งแต่วันที่ 6 กันยายน 2568)
ประเภทบริการ | ราคาเดิม | ราคาใหม่ | การเปลี่ยนแปลง |
---|---|---|---|
Input (cache miss) | ¥2/ล้าน tokens | ¥4/ล้าน tokens | +100% |
Input (cache hit) | ¥0.5/ล้าน tokens | ¥0.5/ล้าน tokens | ไม่เปลี่ยนแปลง |
Output | ¥8/ล้าน tokens | ¥12/ล้าน tokens | +50% |
ส่วนลดเวลากลางคืน | มีให้บริการ | ยกเลิกแล้ว | ถูกลบออก |
ผลกระทบต่อตลาดและผลกระทบต่ออุตสาหกรรม
การเปิดตัวได้สร้างการตอบสนองจากตลาดอย่างมีนัยสำคัญแล้ว โดยหุ้นที่เกี่ยวข้องกับ AI มีกำไรที่น่าสังเกต บริษัทอย่าง Cambricon ซึ่งผลิตชิป AI ที่เข้ากันได้กับเทคโนโลยีของ DeepSeek เห็นการเพิ่มขึ้นในช่วงวันเกือบ 14% ใบอนุญาต MIT โอเพนซอร์สของโมเดลและการปรับแต่ง API คาดว่าจะเร่งการนำ AI agent ไปใช้ในภาคการเงิน การแพทย์ และระบบอัตโนมัติสำนักงาน นักวิเคราะห์อุตสาหกรรมคาดการณ์ว่าตลาด AI agent อาจถึงหยวนจีน 852 พันล้านภายในปี 2028 ด้วยอัตราการเติบโตเฉลี่ยต่อปี 72.7%
ผลกระทบต่อตลาดหุ้น (วันที่ประกาศ)
- Cambricon (688256.SH): กำไรระหว่างวัน +14%
- Kunlun Wanwei (300418.SZ): กำไร +10%
- Hanvon Ugee (300170.SZ): การซื้อขายที่คึกคักในแนวคิด AI agent
- iFlytek (002230.SZ): ผลงาน +35% นับตั้งแต่ต้นปี
- Wondershare (300624.SZ): กำไรรายปี +80%, การเติบโตของกำไร +42%
อนาคตของการแข่งขันระบบนิเวศ AI
ตัวเลือกเชิงกลยุทธ์ของ DeepSeek กับ V3.1 ส่งสัญญาณการเปลี่ยนแปลงที่กว้างขึ้นในภูมิทัศน์ AI ทั่วโลก โดยการนำมาตรฐานทางเทคนิคในประเทศมาใช้และแสดงให้เห็นว่าความสามารถ AI ขั้นสูงไม่จำเป็นต้องใช้ทรัพยากรการคำนวณขนาดใหญ่ บริษัทกำลังวางตำแหน่งตัวเองเป็นผู้นำในเส้นทางการพัฒนาประสิทธิภาพสูงแบบน้ำหนักเบา แนวทางนี้ให้โอกาสสำหรับนักพัฒนารายเล็กทั่วโลกในการมีส่วนร่วมในนวัตกรรม AI ในขณะที่อาจสร้างระบบนิเวศ AI แบบขนานที่อิงตามพื้นฐานทางเทคนิคที่แตกต่างกันและข้อพิจารณาทางภูมิรัฐศาสตร์