NVIDIA ได้บรรลุเป้าหมายสำคัญในการพัฒนากราฟิกด้วย AI ด้วยการเปิดตัวโมเดล DLSS Transformer ที่ได้รับการปรับปรุงแล้ว ซึ่งลดการใช้หน่วยความจำลง 20% ในขณะที่ยังคงรักษาความสามารถในการขยายภาพที่เหนือกว่าไว้ การพัฒนานี้ตอบสนองต่อข้อกังวลหลักประการหนึ่งเกี่ยวกับการเปลี่ยนผ่านจากโมเดลแบบ CNN แบบดั้งเดิมไปสู่สถาปัตยกรรม transformer ที่ทันสมัยกว่า
ข้อมูลจำเพาะหลักของ DLSS Transformer Model:
- พารามิเตอร์: มากกว่าโมเดล CNN ถึง 2 เท่า
- การประมวลผลการเรนเดอร์: เพิ่มขึ้น 4 เท่าเมื่อเทียบกับ CNN
- การเพิ่มประสิทธิภาพหน่วยความจำ: ลดการใช้ VRAM ลง 20%
- เวอร์ชัน SDK: 310.3.0
- สถาปัตยกรรม: Vision transformer พร้อมการประเมินพิกเซลแบบหลายเฟรม
- สถานะ: ออกจากช่วงเบต้าแล้วตั้งแต่การเปิดตัว DLSS 4
![]() |
---|
การวิเคราะห์เปรียบเทียบประสิทธิภาพของ DLSS เวอร์ชันต่างๆ แสดงให้เห็นความก้าวหน้าที่เกิดขึ้นกับโมเดล Transformer ใหม่ |
การปรับปรุงหน่วยความจำอย่างมีนัยสำคัญในทุกความละเอียด
DLSS SDK เวอร์ชันล่าสุด 310.3.0 นำเสนอการปรับปรุง VRAM อย่างมีนัยสำคัญที่ทำให้การใช้หน่วยความจำของโมเดล transformer เข้าใกล้รุ่นก่อนหน้าแบบ CNN มากขึ้น ก่อนหน้านี้ โมเดล transformer ใช้หน่วยความจำเกือบสองเท่าของสถาปัตยกรรม CNN รุ่นเก่า ด้วยการปรับปรุงใหม่เหล่านี้ ช่องว่างได้แคบลงอย่างมีนัยสำคัญ โดยโมเดล transformer ตอนนี้ต้องการหน่วยความจำเพิ่มขึ้นเพียง 40% เมื่อเทียบกับเวอร์ชัน CNN ที่ความละเอียด 1080p การใช้หน่วยความจำลดลงจาก 106.9MB เหลือ 85.77MB เมื่อเทียบกับความต้องการ 60.83MB ของโมเดล CNN
การเปรียบเทียบการใช้ VRAM ตามโมเดลและความละเอียด:
ประเภทโมเดล | 1080p | 4K | การปรับปรุง |
---|---|---|---|
โมเดล CNN | 60.83MB | ~213MB | พื้นฐาน |
Transformer เก่า | 106.9MB | ~387MB | มากกว่า CNN 76% |
Transformer ใหม่ | 85.77MB | 307.37MB | มากกว่า CNN 40% |
การลดลง | 21.13MB (20%) | ~80MB (20%) | ลดลง 20% ในทุกความละเอียด |
ประโยชน์ด้านประสิทธิภาพที่ปรับขนาดตามความละเอียดต่างๆ
การปรับปรุงหน่วยความจำปรับขนาดตามสัดส่วนของความละเอียด โดยรักษาการลดลง 20% อย่างสม่ำเสมอในทุกรูปแบบการแสดงผล ที่ความละเอียด 4K โมเดล transformer ที่ปรับปรุงแล้วใช้ VRAM 307.37MB ซึ่งแสดงถึงการลดลง 80MB จากเวอร์ชันก่อนหน้า แม้ว่าการปรับปรุงนี้อาจดูเล็กน้อยสำหรับการ์ดกราฟิกสมัยใหม่ที่มีความจุ VRAM มาก แต่จะมีความสำคัญมากขึ้นที่ความละเอียดสูงกว่าเช่น 8K ซึ่ง DLSS สามารถใช้หน่วยความจำมากกว่าหนึ่งกิกะไบต์แม้จะมีการปรับปรุงแล้ว
ความสามารถที่เพิ่มขึ้นผ่านสถาปัตยกรรมขั้นสูง
โมเดล transformer แสดงถึงการเปลี่ยนแปลงพื้นฐานในเทคโนโลยี DLSS โดยใช้ vision transformers ที่ประเมินพิกเซลทั้งหมดภายในเฟรมเพื่อเข้าใจความสำคัญของพิกเซลแต่ละตัว วิธีการนี้ประมวลผลหลายเฟรมพร้อมกันเพื่อสร้างพิกเซลที่มีรายละเอียดสำหรับคุณภาพภาพที่เพิ่มขึ้น สถาปัตยกรรมใหม่มีพารามิเตอร์เป็นสองเท่าเมื่อเทียบกับรุ่นก่อนหน้าแบบ CNN ทำให้เกิดคุณภาพภาพเหมือนต้นฉบับในขณะที่เพิ่มความต้องการการประมวลผลการเรนเดอร์เป็นสี่เท่า
ผลกระทบที่กว้างขึ้นต่อประสิทธิภาพการเล่นเกม
การปรับปรุง VRAM เหล่านี้เป็นประโยชน์อย่างยิ่งสำหรับผู้ใช้ที่มีการ์ดกราฟิกที่มีความจุหน่วยความจำ 8GB หรือต่ำกว่า ทำให้คุณสมบัติ DLSS ขั้นสูงเข้าถึงได้มากขึ้นสำหรับฮาร์ดแวร์ระดับกลาง การปรับปรุงเหล่านี้เสริมการปรับปรุงการสร้างเฟรมของ DLSS 4 ซึ่งแยกต่างหากบรรลุการลดลงของการใช้ VRAM 30% การสร้างเฟรมโดยทั่วไปต้องการหน่วยความจำมากกว่าการขยายภาพอย่างมีนัยสำคัญ โดยเกมบางเกมเช่น Warhammer 40,000: Darktide แสดงการใช้ VRAM น้อยลง 400MB ที่ความละเอียด 4K ด้วย DLSS 4 เมื่อเทียบกับ DLSS 3
ผลกระทบต่อ VRAM ระหว่าง Frame Generation กับ Upscaling:
- DLSS 4 Frame Generation: ลด VRAM ได้ 30% เมื่อเปรียบเทียบกับ DLSS 3
- ตัวอย่างกรณีศึกษา ( Warhammer 40,000: Darktide ที่ความละเอียด 4K): ใช้ VRAM น้อยลง 400MB
- Frame generation โดยทั่วไปจะใช้ VRAM มากกว่า upscaling อย่างมีนัยสำคัญ
- การปรับปรุงประสิทธิภาพจะใช้แยกกันระหว่างส่วนประกอบของ upscaling และ frame generation
การพัฒนาในอนาคตและความพร้อมใช้งาน
เมื่อโมเดล transformer ออกจากสถานะเบต้าแล้ว NVIDIA คาดว่าจะปรับใช้การอัปเดตอย่างเป็นทางการที่รวมเทคโนโลยีนี้ในอีกไม่กี่เดือนข้างหน้า ประวัติของบริษัทในการปรับปรุงอย่างต่อเนื่องชี้ให้เห็นว่าการปรับแต่งเพิ่มเติมอาจตามมา คล้ายกับการทำซ้ำ DLSS ก่อนหน้าที่ได้รับการลดการใช้หน่วยความจำเพิ่มเติมเมื่อเวลาผ่านไป การพัฒนาเหล่านี้วางตำแหน่ง DLSS เป็นโซลูชันที่มีประสิทธิภาพมากขึ้นสำหรับประสบการณ์การเล่นเกมคุณภาพสูงในการกำหนดค่าฮาร์ดแวร์ที่หลากหลายมากขึ้น