โมเดล NVIDIA DLSS Transformer ลดการใช้ VRAM ลง 20% พร้อมส่งมอบคุณภาพภาพที่เหนือกว่า

ทีมบรรณาธิการ BigGo
โมเดล NVIDIA DLSS Transformer ลดการใช้ VRAM ลง 20% พร้อมส่งมอบคุณภาพภาพที่เหนือกว่า

NVIDIA ได้บรรลุเป้าหมายสำคัญในการพัฒนากราฟิกด้วย AI ด้วยการเปิดตัวโมเดล DLSS Transformer ที่ได้รับการปรับปรุงแล้ว ซึ่งลดการใช้หน่วยความจำลง 20% ในขณะที่ยังคงรักษาความสามารถในการขยายภาพที่เหนือกว่าไว้ การพัฒนานี้ตอบสนองต่อข้อกังวลหลักประการหนึ่งเกี่ยวกับการเปลี่ยนผ่านจากโมเดลแบบ CNN แบบดั้งเดิมไปสู่สถาปัตยกรรม transformer ที่ทันสมัยกว่า

ข้อมูลจำเพาะหลักของ DLSS Transformer Model:

  • พารามิเตอร์: มากกว่าโมเดล CNN ถึง 2 เท่า
  • การประมวลผลการเรนเดอร์: เพิ่มขึ้น 4 เท่าเมื่อเทียบกับ CNN
  • การเพิ่มประสิทธิภาพหน่วยความจำ: ลดการใช้ VRAM ลง 20%
  • เวอร์ชัน SDK: 310.3.0
  • สถาปัตยกรรม: Vision transformer พร้อมการประเมินพิกเซลแบบหลายเฟรม
  • สถานะ: ออกจากช่วงเบต้าแล้วตั้งแต่การเปิดตัว DLSS 4
การวิเคราะห์เปรียบเทียบประสิทธิภาพของ DLSS เวอร์ชันต่างๆ แสดงให้เห็นความก้าวหน้าที่เกิดขึ้นกับโมเดล Transformer ใหม่
การวิเคราะห์เปรียบเทียบประสิทธิภาพของ DLSS เวอร์ชันต่างๆ แสดงให้เห็นความก้าวหน้าที่เกิดขึ้นกับโมเดล Transformer ใหม่

การปรับปรุงหน่วยความจำอย่างมีนัยสำคัญในทุกความละเอียด

DLSS SDK เวอร์ชันล่าสุด 310.3.0 นำเสนอการปรับปรุง VRAM อย่างมีนัยสำคัญที่ทำให้การใช้หน่วยความจำของโมเดล transformer เข้าใกล้รุ่นก่อนหน้าแบบ CNN มากขึ้น ก่อนหน้านี้ โมเดล transformer ใช้หน่วยความจำเกือบสองเท่าของสถาปัตยกรรม CNN รุ่นเก่า ด้วยการปรับปรุงใหม่เหล่านี้ ช่องว่างได้แคบลงอย่างมีนัยสำคัญ โดยโมเดล transformer ตอนนี้ต้องการหน่วยความจำเพิ่มขึ้นเพียง 40% เมื่อเทียบกับเวอร์ชัน CNN ที่ความละเอียด 1080p การใช้หน่วยความจำลดลงจาก 106.9MB เหลือ 85.77MB เมื่อเทียบกับความต้องการ 60.83MB ของโมเดล CNN

การเปรียบเทียบการใช้ VRAM ตามโมเดลและความละเอียด:

ประเภทโมเดล 1080p 4K การปรับปรุง
โมเดล CNN 60.83MB ~213MB พื้นฐาน
Transformer เก่า 106.9MB ~387MB มากกว่า CNN 76%
Transformer ใหม่ 85.77MB 307.37MB มากกว่า CNN 40%
การลดลง 21.13MB (20%) ~80MB (20%) ลดลง 20% ในทุกความละเอียด

ประโยชน์ด้านประสิทธิภาพที่ปรับขนาดตามความละเอียดต่างๆ

การปรับปรุงหน่วยความจำปรับขนาดตามสัดส่วนของความละเอียด โดยรักษาการลดลง 20% อย่างสม่ำเสมอในทุกรูปแบบการแสดงผล ที่ความละเอียด 4K โมเดล transformer ที่ปรับปรุงแล้วใช้ VRAM 307.37MB ซึ่งแสดงถึงการลดลง 80MB จากเวอร์ชันก่อนหน้า แม้ว่าการปรับปรุงนี้อาจดูเล็กน้อยสำหรับการ์ดกราฟิกสมัยใหม่ที่มีความจุ VRAM มาก แต่จะมีความสำคัญมากขึ้นที่ความละเอียดสูงกว่าเช่น 8K ซึ่ง DLSS สามารถใช้หน่วยความจำมากกว่าหนึ่งกิกะไบต์แม้จะมีการปรับปรุงแล้ว

ความสามารถที่เพิ่มขึ้นผ่านสถาปัตยกรรมขั้นสูง

โมเดล transformer แสดงถึงการเปลี่ยนแปลงพื้นฐานในเทคโนโลยี DLSS โดยใช้ vision transformers ที่ประเมินพิกเซลทั้งหมดภายในเฟรมเพื่อเข้าใจความสำคัญของพิกเซลแต่ละตัว วิธีการนี้ประมวลผลหลายเฟรมพร้อมกันเพื่อสร้างพิกเซลที่มีรายละเอียดสำหรับคุณภาพภาพที่เพิ่มขึ้น สถาปัตยกรรมใหม่มีพารามิเตอร์เป็นสองเท่าเมื่อเทียบกับรุ่นก่อนหน้าแบบ CNN ทำให้เกิดคุณภาพภาพเหมือนต้นฉบับในขณะที่เพิ่มความต้องการการประมวลผลการเรนเดอร์เป็นสี่เท่า

ผลกระทบที่กว้างขึ้นต่อประสิทธิภาพการเล่นเกม

การปรับปรุง VRAM เหล่านี้เป็นประโยชน์อย่างยิ่งสำหรับผู้ใช้ที่มีการ์ดกราฟิกที่มีความจุหน่วยความจำ 8GB หรือต่ำกว่า ทำให้คุณสมบัติ DLSS ขั้นสูงเข้าถึงได้มากขึ้นสำหรับฮาร์ดแวร์ระดับกลาง การปรับปรุงเหล่านี้เสริมการปรับปรุงการสร้างเฟรมของ DLSS 4 ซึ่งแยกต่างหากบรรลุการลดลงของการใช้ VRAM 30% การสร้างเฟรมโดยทั่วไปต้องการหน่วยความจำมากกว่าการขยายภาพอย่างมีนัยสำคัญ โดยเกมบางเกมเช่น Warhammer 40,000: Darktide แสดงการใช้ VRAM น้อยลง 400MB ที่ความละเอียด 4K ด้วย DLSS 4 เมื่อเทียบกับ DLSS 3

ผลกระทบต่อ VRAM ระหว่าง Frame Generation กับ Upscaling:

  • DLSS 4 Frame Generation: ลด VRAM ได้ 30% เมื่อเปรียบเทียบกับ DLSS 3
  • ตัวอย่างกรณีศึกษา ( Warhammer 40,000: Darktide ที่ความละเอียด 4K): ใช้ VRAM น้อยลง 400MB
  • Frame generation โดยทั่วไปจะใช้ VRAM มากกว่า upscaling อย่างมีนัยสำคัญ
  • การปรับปรุงประสิทธิภาพจะใช้แยกกันระหว่างส่วนประกอบของ upscaling และ frame generation

การพัฒนาในอนาคตและความพร้อมใช้งาน

เมื่อโมเดล transformer ออกจากสถานะเบต้าแล้ว NVIDIA คาดว่าจะปรับใช้การอัปเดตอย่างเป็นทางการที่รวมเทคโนโลยีนี้ในอีกไม่กี่เดือนข้างหน้า ประวัติของบริษัทในการปรับปรุงอย่างต่อเนื่องชี้ให้เห็นว่าการปรับแต่งเพิ่มเติมอาจตามมา คล้ายกับการทำซ้ำ DLSS ก่อนหน้าที่ได้รับการลดการใช้หน่วยความจำเพิ่มเติมเมื่อเวลาผ่านไป การพัฒนาเหล่านี้วางตำแหน่ง DLSS เป็นโซลูชันที่มีประสิทธิภาพมากขึ้นสำหรับประสบการณ์การเล่นเกมคุณภาพสูงในการกำหนดค่าฮาร์ดแวร์ที่หลากหลายมากขึ้น