DeepSeek เปิดตัวโมเดล AI V3.1 พร้วมสถาปัตยกรรมการใช้เหตุผลแบบไฮบริดและการปรับขึ้นราคา

ทีมบรรณาธิการ BigGo
DeepSeek เปิดตัวโมเดล AI V3.1 พร้วมสถาปัตยกรรมการใช้เหตุผลแบบไฮบริดและการปรับขึ้นราคา

บริษัทวิจัย AI ของจีน DeepSeek ได้เปิดตัวโมเดลโอเพนซอร์สล่าสุดอย่างเป็นทางการ DeepSeek-V3.1 ซึ่งเป็นการก้าวหน้าอย่างมีนัยสำคัญในด้านความสามารถของปัญญาประดิษฐ์ พร้วมไปกับการประกาศเพิ่มราคาบริการ API อย่างมาก การเปิดตัวครั้งนี้มีความหมายมากกว่าการอัปเกรดพารามิเตอร์จาก 671 พันล้านเป็น 685 พันล้านพารามิเตอร์ โดยได้นำเสนอสถาปัตยกรรมการใช้เหตุผลแบบไฮบริดที่ก้าวล้ำ ซึ่งอาจเปลี่ยนแปลงวิธีที่ระบบ AI โต้ตอบกับผู้ใช้และจัดการงานที่ซับซ้อน

สถาปัตยกรรมการใช้เหตุผลแบบไฮบริดที่ปฏิวัติวงการ

DeepSeek-V3.1 นำเสนอสถาปัตยกรรมการใช้เหตุผลแบบไฮบริดที่เป็นครั้งแรกในอุตสาหกรรม ซึ่งช่วยให้โมเดลเดียวสามารถเปลี่ยนระหว่างโหมดการคิด (deepseek-reasoner) และโหมดไม่คิด (deepseek-chat) ได้อย่างราบรื่น ผู้ใช้สามารถสลับระหว่างโหมดเหล่านี้ผ่านแอปหรือเว็บอินเทอร์เฟซอย่างเป็นทางการโดยใช้ปุ่มการคิดเชิงลึก โหมดไม่คิดมุ่งเป้าไปที่คำถามง่าย ๆ เช่น สภาพอากาศหรือคำถามสารานุกรม โดยให้ผลลัพธ์ที่คล่องตัวพร้วมเวลาตอบสนองที่เร็วขึ้น 20% ในขณะที่โหมดการคิดจัดการกับปัญหาที่ซับซ้อน เช่น การพิสูจน์ทางคณิตศาสตร์และการดีบักโค้ด โดยการเปิดใช้งานห่วงโซ่การใช้เหตุผลเชิงลึกภายใน ผลิตตรรกะที่เข้มงวดมากขึ้นแต่ต้องแลกกับการตอบสนองที่ช้าลงเล็กน้อย

ประสิทธิภาพที่เพิ่มขึ้นผ่านการบีบอัด Chain-of-Thought

โมเดลใหม่แสดงให้เห็นการปรับปรุงประสิทธิภาพที่น่าทึ่งผ่านการฝึกอบรมการบีบอัด chain-of-thought ขั้นสูง DeepSeek-V3.1 รักษาระดับประสิทธิภาพที่เทียบเคียงกับรุ่นก่อนหน้า R1-0528 ในขณะที่ลดการสร้างโทเค็นเอาต์พุตลง 20-50% งานที่เคยต้องใช้ 1,000 โทเค็นตอนนี้สามารถทำให้เสร็จด้วยเพียง 500 โทเค็นในขณะที่ยังคงคุณภาพเอาต์พุตที่เทียบเท่า การเพิ่มประสิทธิภาพนี้แปลเป็นต้นทุนการคำนวณที่ลดลงอย่างมากและความล่าช้าในการตอบสนองที่ลดลง ทำให้เทคโนโลยีนี้เข้าถึงได้มากขึ้นสำหรับการนำไปใช้อย่างแพร่หลาย

เกณฑ์มาตรฐานประสิทธิภาพ

การทดสอบ คะแนน DeepSeek-V3.1 คะแนนโมเดลก่อนหน้า
คณิตศาสตร์ AIME 2015 87.5/100 88.4/100
วิทยาศาสตร์ GPQA 81/100 80.1/100
liveCodeBench 73.3/100 74.8/100
การลดจำนวน Token น้อยกว่า 20-50% พื้นฐาน

ข้อมูลจำเพาะทางเทคนิคและเกณฑ์มาตรฐานประสิทธิภาพ

สร้างบนสถาปัตยกรรม Mixture-of-Experts (MoE) พารามิเตอร์ 685 พันล้านของ DeepSeek-V3.1 เปิดใช้งานเพียง 37 พันล้านพารามิเตอร์ต่อโทเค็น บรรลุสมดุลที่เหมาะสมระหว่างประสิทธิภาพและประสิทธิผล โมเดลรองรับรูปแบบเทนเซอร์หลายแบบรวมถึง BF16, FP8 (F8_E4M3) และ F32 ให้นักพัฒนามีความยืดหยุ่นในการปรับแต่งฮาร์ดแวร์ โมเดลพื้นฐานได้รับการฝึกอบรมเพิ่มเติมด้วย 840 พันล้านโทเค็นเกินจากพื้นฐาน V3 ขยายความสามารถในการประมวลผลบริบทยาวไปที่ 128K โทเค็น ซึ่งเทียบเท่ากับประมาณ 130,000 อักขระจีนหรือ 80 บทแรกของ Dream of the Red Chamber

การเปรียบเทียบข้อมูลจำเพาะของโมเดล

คุณสมบัติ DeepSeek-V3 DeepSeek-V3.1
พารามิเตอร์ทั้งหมด 671 พันล้าน 685 พันล้าน
พารามิเตอร์ที่ใช้งานต่อโทเค็น 37 พันล้าน 37 พันล้าน
หน้าต่างบริบท 128K โทเค็น 128K โทเค็น
การฝึกอบรมเพิ่มเติม - 840B โทเค็น
มาตรฐานความแม่นยำ Standard FP8 UE8M0 FP8
สถาปัตยกรรม MoE Hybrid MoE

การนำมาตรฐาน UE8M0 FP8 มาใช้อย่างเป็นกลยุทธ์

บางทีสิ่งที่สำคัญที่สุดสำหรับภูมิทัศน์ AI ทั่วโลก DeepSeek-V3.1 นำมาตรฐานความแม่นยำ UE8M0 FP8 มาใช้ ซึ่งออกแบบมาโดยเฉพาะสำหรับชิปจีนในประเทศรุ่นใหม่ การตัดสินใจทางเทคนิคนี้แสดงถึงการเบี่ยงเบนเชิงกลยุทธ์จากมาตรฐาน E4M3/E5M2 FP8 ของ NVIDIA ซึ่งอาจสร้างเส้นทางระบบนิเวศ AI ที่แตกต่างกันสองแบบ รูปแบบ UE8M0 ให้ความสำคัญกับการใช้พลังงานที่ต่ำกว่าและการคำนวณที่เร็วกว่าความแม่นยำสูงที่เสนอโดยมาตรฐานของ NVIDIA ทำให้เหมาะสมกว่าสำหรับสถาปัตยกรรมชิปในประเทศที่มีปรัชญาการออกแบบที่แตกต่างกน

การปรับราคา API อย่างมาก

ควบคู่ไปกับการประกาศทางเทคนิค DeepSeek เปิดเผยการเปลี่ยนแปลงราคาที่สำคัญซึ่งมีผลตั้งแต่วันที่ 6 กันยายน ราคาอินพุตสำหรับ cache miss จะเพิ่มขึ้นจากหยวนจีน 2 เป็น 4 หยวนต่อล้านโทเค็น ในขณะที่ราคาเอาต์พุตเพิ่มขึ้นจาก 8 เป็น 12 หยวนต่อล้านโทเค็น บริษัทยังยกเลิกส่วนลดราคาช่วงกลางคืนด้วย การปรับเปลี่ยนเหล่านี้สะท้อนถึงการลงทุนด้านการวิจัยและพัฒนาที่มากมายที่จำเป็นสำหรับการอัปเกรด V3.1 รวมถึงการฝึกอบรม 840 พันล้านโทเค็นเพิ่มเติมและการปรับความแม่นยำ UE8M0 FP8 เพื่อความเข้ากันได้กับชิปในประเทศ

การเปลี่ยนแปลงราคา API (มีผลตั้งแต่วันที่ 6 กันยายน 2568)

ประเภทบริการ ราคาเดิม ราคาใหม่ การเปลี่ยนแปลง
Input (cache miss) ¥2/ล้าน tokens ¥4/ล้าน tokens +100%
Input (cache hit) ¥0.5/ล้าน tokens ¥0.5/ล้าน tokens ไม่เปลี่ยนแปลง
Output ¥8/ล้าน tokens ¥12/ล้าน tokens +50%
ส่วนลดเวลากลางคืน มีให้บริการ ยกเลิกแล้ว ถูกลบออก

ผลกระทบต่อตลาดและผลกระทบต่ออุตสาหกรรม

การเปิดตัวได้สร้างการตอบสนองจากตลาดอย่างมีนัยสำคัญแล้ว โดยหุ้นที่เกี่ยวข้องกับ AI มีกำไรที่น่าสังเกต บริษัทอย่าง Cambricon ซึ่งผลิตชิป AI ที่เข้ากันได้กับเทคโนโลยีของ DeepSeek เห็นการเพิ่มขึ้นในช่วงวันเกือบ 14% ใบอนุญาต MIT โอเพนซอร์สของโมเดลและการปรับแต่ง API คาดว่าจะเร่งการนำ AI agent ไปใช้ในภาคการเงิน การแพทย์ และระบบอัตโนมัติสำนักงาน นักวิเคราะห์อุตสาหกรรมคาดการณ์ว่าตลาด AI agent อาจถึงหยวนจีน 852 พันล้านภายในปี 2028 ด้วยอัตราการเติบโตเฉลี่ยต่อปี 72.7%

ผลกระทบต่อตลาดหุ้น (วันที่ประกาศ)

  • Cambricon (688256.SH): กำไรระหว่างวัน +14%
  • Kunlun Wanwei (300418.SZ): กำไร +10%
  • Hanvon Ugee (300170.SZ): การซื้อขายที่คึกคักในแนวคิด AI agent
  • iFlytek (002230.SZ): ผลงาน +35% นับตั้งแต่ต้นปี
  • Wondershare (300624.SZ): กำไรรายปี +80%, การเติบโตของกำไร +42%

อนาคตของการแข่งขันระบบนิเวศ AI

ตัวเลือกเชิงกลยุทธ์ของ DeepSeek กับ V3.1 ส่งสัญญาณการเปลี่ยนแปลงที่กว้างขึ้นในภูมิทัศน์ AI ทั่วโลก โดยการนำมาตรฐานทางเทคนิคในประเทศมาใช้และแสดงให้เห็นว่าความสามารถ AI ขั้นสูงไม่จำเป็นต้องใช้ทรัพยากรการคำนวณขนาดใหญ่ บริษัทกำลังวางตำแหน่งตัวเองเป็นผู้นำในเส้นทางการพัฒนาประสิทธิภาพสูงแบบน้ำหนักเบา แนวทางนี้ให้โอกาสสำหรับนักพัฒนารายเล็กทั่วโลกในการมีส่วนร่วมในนวัตกรรม AI ในขณะที่อาจสร้างระบบนิเวศ AI แบบขนานที่อิงตามพื้นฐานทางเทคนิคที่แตกต่างกันและข้อพิจารณาทางภูมิรัฐศาสตร์