DeepSeek V3.2 ท้าทายยักษ์ใหญ่ AI: โมเดลโอเพ่นซอร์สแข่งกับ GPT-5 ได้ในราคาส่วนเสี้ยว

ทีมบรรณาธิการ BigGo
DeepSeek V3.2 ท้าทายยักษ์ใหญ่ AI: โมเดลโอเพ่นซอร์สแข่งกับ GPT-5 ได้ในราคาส่วนเสี้ยว

ในการเคลื่อนไหวที่อาจปรับเปลี่ยนภูมิทัศน์การแข่งขันของปัญญาประดิษฐ์ บริษัท AI สัญชาติจีน DeepSeek ได้เปิดตัวชุดโมเดล V3.2 อย่างเป็นทางการแล้ว การเปิดตัวครั้งนี้แสดงถึงการยกระดับที่สำคัญในสมรภูมิการต่อสู้ระหว่าง AI แบบโอเพ่นซอร์สและแบบปิด โดยนำเสนอความสามารถด้านการให้เหตุผลและเอเจนต์ขั้นสูงในระดับราคาที่ต่ำกว่าผู้นำในอุตสาหกรรมอย่างมาก การเปิดตัวนี้ตามหลังเวอร์ชันทดลองที่ประกาศในเดือนตุลาคม และเกิดขึ้นในขณะที่ชุมชน AI เริ่มตั้งคำถามมากขึ้นว่าช่องว่างด้านประสิทธิภาพระหว่างโมเดลที่เข้าถึงได้ฟรีกับโมเดลปิดนั้นเป็นสิ่งที่เอาชนะไม่ได้จริงหรือไม่

การเปิดตัวอย่างเป็นทางการและรุ่นย่อยของโมเดล

DeepSeek ได้เปิดตัวสองเวอร์ชันที่แตกต่างกันของโมเดล V3.2 ได้แก่ DeepSeek-V3.2 มาตรฐาน และ DeepSeek-V3.2-Speciale ที่ทรงพลังกว่า รุ่นมาตรฐานตอนนี้พร้อมให้บริการผ่านทุกช่องทางอย่างเป็นทางการแล้ว ซึ่งรวมถึงอินเทอร์เฟซเว็บของบริษัท แอปพลิเคชันมือถือ และบริการ API นี่เป็นโมเดล DeepSeek รุ่นแรกที่ผนวก "กระบวนการคิด" เข้าไปในความสามารถในการใช้เครื่องมือโดยตรง โดยรองรับทั้งโหมดที่มีการคิดและไม่คิดสำหรับการเรียกใช้เครื่องมือ ส่วนรุ่น Speciale นั้น ปัจจุบันเปิดให้บริการเป็นบริการ API ชั่วคราวเท่านั้น โดยมีจุดมุ่งหมายชัดเจนเพื่อการประเมินและการวิจัยของชุมชน กลยุทธ์การเปิดตัวแบบเป็นขั้นตอนนี้ทำให้ DeepSeek สามารถรวบรวมข้อเสนอแนะจากโลกจริงสำหรับโมเดลขั้นสูงที่สุดของตน ในขณะเดียวกันก็ทำให้เทคโนโลยีหลักเข้าถึงได้ทันทีสำหรับนักพัฒนา

Model Variants & Availability

  • DeepSeek-V3.2 (Standard): Generally available on official web, App, and API.
  • DeepSeek-V3.2-Speciale: Available only as a temporary API for community evaluation/research.

Claimed Performance vs. Proprietary Models

  • Outperforms on some benchmarks: OpenAI GPT-5 High, Anthropic Claude 4.5 Sonnet, Google Gemini 3.0 Pro.
  • Academic Achievements: Gold-level performance in International Math Olympiad (IMO) and International Olympiad in Informatics.

Pricing Comparison (per 1 million tokens)

Model API Cost
DeepSeek V3.2 Speciale USD 0.028
Google Gemini 3 Up to USD 4.00

Technical Innovations

  • Core Problem Identified: Open-source models relied on slow, compute-hungry "vanilla attention."
  • Solution: DeepSeek Sparse Attention (DSA) uses a two-phase "lightning indexer" to find relevant tokens before applying full computation, drastically improving efficiency.
  • Training: Used specialist "tutor" models for post-training across writing, math, programming, and agentic tasks.

Acknowledged Limitations More limited "world knowledge" compared to frontier proprietary models. Requires more tokens to match output quality.

  • Struggles with more complex tasks.

ประสิทธิภาพที่ทัดเทียมโมเดลแนวหน้า

ข้ออ้างเกี่ยวกับประสิทธิภาพของ V3.2 โดยเฉพาะรุ่น Speciale นั้นถือว่าท้าทายอย่างมาก จากข้อมูลที่ DeepSeek เผยแพร่ โมเดลนี้แข่งขันโดยตรงกับระบบปิดระดับสูงสุดในรุ่นปัจจุบัน บริษัทระบุว่า V3.2 Speciale มีประสิทธิภาพเหนือกว่าโมเดลอย่าง GPT-5 High ของ OpenAI, Claude 4.5 Sonnet ของ Anthropic และ Gemini 3.0 Pro ของ Google ในบางเกณฑ์วัดด้านการให้เหตุผล นอกจากนี้ยังทำผลงานได้ในระดับเหรียญทองในการแข่งขันวิชาการที่มีชื่อเสียง เช่น การแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ (IMO) และการแข่งขันโอลิมปิกวิชาการสารสนเทศระหว่างประเทศ ความสำเร็จเหล่านี้ต่อยอดจากชื่อเสียงที่ DeepSeek สร้างไว้ก่อนหน้านี้ในปีนี้ด้วยโมเดล R1 ซึ่งเป็น AI ให้เหตุผลแบบโอเพ่นซอร์สที่แซงหน้า o1 ของ OpenAI ในหลายเกณฑ์วัดสำคัญ แนวโน้มของประสิทธิภาพที่สามารถแข่งขันได้อย่างต่อเนื่องนี้ ท้าทายแนวคิดที่ว่าโมเดลปิดมีข้อได้เปรียบด้านความสามารถที่ไม่มีใครเทียบได้

ข้อได้เปรียบด้านต้นทุนที่แตกต่างอย่างมหาศาล

บางทีด้านที่สร้างการเปลี่ยนแปลงมากที่สุดของการเปิดตัว V3.2 คือราคาของมัน DeepSeek ได้รักษากลยุทธ์ในการลดต้นทุนลงอย่างมากในแต่ละรุ่นของโมเดล การเข้าถึงโมเดล V3.2 Speciale ผ่าน API มีค่าใช้จ่ายเพียง 0.028 ดอลลาร์สหรัฐ ต่อโทเค็น 1 ล้านตัว เพื่อให้เห็นภาพชัดเจน การใช้ Gemini 3 ของ Google ผ่าน API อาจมีค่าใช้จ่ายสูงถึง 4.00 ดอลลาร์สหรัฐ สำหรับปริมาณโทเค็นเท่ากัน นี่แสดงถึงความแตกต่างของต้นทุนที่มากกว่า 140 เท่า ในเอกสารงานวิจัย DeepSeek ได้วางตำแหน่ง V3.2 ว่าเป็น "ทางเลือกที่มีประสิทธิภาพด้านต้นทุนสูงในสถานการณ์เอเจนต์" โดยให้เหตุผลว่ามัน "ลดช่องว่างด้านประสิทธิภาพระหว่างโมเดลโอเพ่นซอร์สและโมเดลปิดแนวหน้าลงอย่างมีนัยสำคัญ ในขณะที่ก่อให้เกิดต้นทุนที่ต่ำกว่ามาก" ราคาที่ก้าวร้าวเช่นนี้คุกคามตรรกะทางเศรษฐกิจเบื้องหลังการลงทุนมหาศาลของแล็บ AI แบบปิดโดยตรง และอาจบ่อนทำลายข้อเสนอมูลค่าพื้นฐานของพวกเขาต่อนักพัฒนาและองค์กรธุรกิจ

นวัตกรรมทางเทคนิค: ทำงานอย่างชาญฉลาด ไม่ใช่ทำงานหนัก

แนวทางทางเทคนิคของ DeepSeek ในการปิดช่องว่างด้านประสิทธิภาพมุ่งเน้นไปที่การวินิจฉัยจุดอ่อนเฉพาะในสถาปัตยกรรมโอเพ่นซอร์ส บริษัทระบุปัญหาหลักสามประการ ได้แก่ การพึ่งพากลไก "ความสนใจแบบธรรมดา" ที่ไม่มีประสิทธิภาพ ขีดจำกัดด้านพลังคำนวณในขั้นตอนหลังการฝึก และความยากลำบากในการทำให้งานทั่วไปและปฏิบัติตามคำสั่งยาวๆ ได้ เพื่อตอบสนอง พวกเขาจึงพัฒนา DeepSeek Sparse Attention (DSA) กลไกใหม่นี้ทำงานในสองขั้นตอนเพื่อลดความซับซ้อนในการคำนวณ ขั้นแรก "ตัวจัดทำดัชนีสายฟ้า" จะทำการสแกนระดับสูงเพื่อระบุโทเค็นที่เกี่ยวข้องที่สุดจากข้อมูลการฝึกสำหรับคำถามที่ได้รับ จากนั้นจึงใช้พลังการคำนวณเต็มที่เฉพาะกับกลุ่มย่อยที่คัดสรรแล้วนี้ บริษัทเปรียบเทียบกระบวนการนี้เหมือนกับการเปลี่ยนจากการค้นหาประโยคในกองหนังสือขนาดยักษ์ที่กระจัดกระจาย ไปเป็นการหามันในห้องสมุดที่จัดเรียงอย่างเป็นระเบียบ ซึ่งเป็นกระบวนการที่มีประสิทธิภาพกว่ามาก เพื่อแก้ไขข้อจำกัดในขั้นตอนหลังการฝึก DeepSeek ได้สร้างชุดโมเดล "ผู้เชี่ยวชาญเฉพาะด้าน" ขึ้นมาเพื่อสอนและปรับแต่งความสามารถของ V3.2 ให้ดีขึ้นในหลากหลายโดเมน เช่น การเขียน คณิตศาสตร์ การเขียนโปรแกรม และงานเอเจนต์

ข้อจำกัดที่ยอมรับและเส้นทางข้างหน้า

แม้จะมีความสำเร็จ DeepSeek ก็เปิดเผยข้อบกพร่องในปัจจุบันของ V3.2 อย่างโปร่งใส "ความรู้เกี่ยวกับโลก" ของโมเดล ซึ่งคือความเข้าใจเชิงปฏิบัติที่อนุมานจากข้อมูลการฝึก ถูกระบุว่ามีจำกัดมากกว่าเมื่อเทียบกับโมเดลปิดชั้นนำ นอกจากนี้ยังต้องการโทเค็นจำนวนมากขึ้นเพื่อสร้างผลลัพธ์ที่มีคุณภาพเทียบเท่า และยังมีปัญหากับงานที่ซับซ้อนสูง บริษัทยอมรับช่องว่างเหล่านี้และร่างเส้นทางข้างหน้าที่มุ่งเน้นการขยายพลังการคำนวณระหว่างการฝึกก่อน และการปรับปรุง "สูตรหลังการฝึก" ข้อจำกัดเหล่านี้ชี้ให้เห็นว่าการแข่งขันยังไม่จบ แต่ก็ยังวางกรอบช่องว่างด้านประสิทธิภาพให้เป็นความท้าทายทางเทคนิคที่ต้องแก้ไข ไม่ใช่ลักษณะถาวรของภูมิทัศน์ AI การกระทำที่ระบุและเผชิญหน้ากับจุดอ่อนเหล่านี้ต่อสาธารณะ เป็นส่วนหนึ่งของปรัชญาการพัฒนาแบบวนซ้ำของโมเดลโอเพ่นซอร์ส

ผลกระทบต่ออนาคตของอุตสาหกรรม AI

การเปิดตัว DeepSeek V3.2 ก่อให้เกิดผลกระทบอันลึกซึ้งที่ขยายออกไปไกลกว่าการเปิดตัวผลิตภัณฑ์เดียว มันให้หลักฐานที่เพิ่มขึ้นว่าความแตกต่างระหว่าง AI แบบโอเพ่นซอร์สและแบบปิดนั้นไม่ใช่กฎตายตัว แต่เป็นความแตกต่างที่สามารถเชื่อมโยงได้ผ่านนวัตกรรมในด้านต่างๆ เช่น กลไกความสนใจและวิธีการฝึก ที่สำคัญกว่านั้น การนำเสนอโมเดลที่มีความสามารถด้านการให้เหตุผลที่สามารถแข่งขันได้ในราคาเกือบศูนย์สำหรับนักพัฒนาในการเข้าถึงและสร้างสรรค์ต่อ DeepSeek ได้ท้าทายโมเดลธุรกิจหลักของ AI แบบปิด หากแนวโน้มยังคงเป็นเช่นนี้และโมเดลโอเพ่นซอร์สเริ่มแซงหน้าโมเดลปิดในด้านสำคัญ เหตุผลในการจ่ายเงินราคาสูงสำหรับเครื่องมือแบบปิดก็จะลดลงอย่างมีนัยสำคัญ การเปิดตัวครั้งนี้ทำให้การแข่งขันร้อนแรงขึ้น บังคับให้อุตสาหกรรมทั้งหมดต้องทบทวนสมดุลระหว่างความเปิดกว้าง ประสิทธิภาพ และต้นทุน ในยุคต่อไปของปัญญาประดิษฐ์