โมเดล NVIDIA DLSS Transformer ลดการใช้ VRAM ลง 20% พร้อมส่งมอบคุณภาพภาพที่เหนือกว่า

ทีมบรรณาธิการ BigGo

โมเดล NVIDIA DLSS Transformer ลดการใช้ VRAM ลง 20% พร้อมส่งมอบคุณภาพภาพที่เหนือกว่า

NVIDIA ได้บรรลุเป้าหมายสำคัญในการพัฒนากราฟิกด้วย AI ด้วยการเปิดตัวโมเดล DLSS Transformer ที่ได้รับการปรับปรุงแล้ว ซึ่งลดการใช้หน่วยความจำลง 20% ในขณะที่ยังคงรักษาความสามารถในการขยายภาพที่เหนือกว่าไว้ การพัฒนานี้ตอบสนองต่อข้อกังวลหลักประการหนึ่งเกี่ยวกับการเปลี่ยนผ่านจากโมเดลแบบ CNN แบบดั้งเดิมไปสู่สถาปัตยกรรม transformer ที่ทันสมัยกว่า

ข้อมูลจำเพาะหลักของ DLSS Transformer Model:

พารามิเตอร์: มากกว่าโมเดล CNN ถึง 2 เท่า
การประมวลผลการเรนเดอร์: เพิ่มขึ้น 4 เท่าเมื่อเทียบกับ CNN
การเพิ่มประสิทธิภาพหน่วยความจำ: ลดการใช้ VRAM ลง 20%
เวอร์ชัน SDK: 310.3.0
สถาปัตยกรรม: Vision transformer พร้อมการประเมินพิกเซลแบบหลายเฟรม
สถานะ: ออกจากช่วงเบต้าแล้วตั้งแต่การเปิดตัว DLSS 4


การวิเคราะห์เปรียบเทียบประสิทธิภาพของ DLSS เวอร์ชันต่างๆ แสดงให้เห็นความก้าวหน้าที่เกิดขึ้นกับโมเดล Transformer ใหม่

การปรับปรุงหน่วยความจำอย่างมีนัยสำคัญในทุกความละเอียด

DLSS SDK เวอร์ชันล่าสุด 310.3.0 นำเสนอการปรับปรุง VRAM อย่างมีนัยสำคัญที่ทำให้การใช้หน่วยความจำของโมเดล transformer เข้าใกล้รุ่นก่อนหน้าแบบ CNN มากขึ้น ก่อนหน้านี้ โมเดล transformer ใช้หน่วยความจำเกือบสองเท่าของสถาปัตยกรรม CNN รุ่นเก่า ด้วยการปรับปรุงใหม่เหล่านี้ ช่องว่างได้แคบลงอย่างมีนัยสำคัญ โดยโมเดล transformer ตอนนี้ต้องการหน่วยความจำเพิ่มขึ้นเพียง 40% เมื่อเทียบกับเวอร์ชัน CNN ที่ความละเอียด 1080p การใช้หน่วยความจำลดลงจาก 106.9MB เหลือ 85.77MB เมื่อเทียบกับความต้องการ 60.83MB ของโมเดล CNN

การเปรียบเทียบการใช้ VRAM ตามโมเดลและความละเอียด:

ประเภทโมเดล	1080p	4K	การปรับปรุง
โมเดล CNN	60.83MB	~213MB	พื้นฐาน
Transformer เก่า	106.9MB	~387MB	มากกว่า CNN 76%
Transformer ใหม่	85.77MB	307.37MB	มากกว่า CNN 40%
การลดลง	21.13MB (20%)	~80MB (20%)	ลดลง 20% ในทุกความละเอียด

ประโยชน์ด้านประสิทธิภาพที่ปรับขนาดตามความละเอียดต่างๆ

การปรับปรุงหน่วยความจำปรับขนาดตามสัดส่วนของความละเอียด โดยรักษาการลดลง 20% อย่างสม่ำเสมอในทุกรูปแบบการแสดงผล ที่ความละเอียด 4K โมเดล transformer ที่ปรับปรุงแล้วใช้ VRAM 307.37MB ซึ่งแสดงถึงการลดลง 80MB จากเวอร์ชันก่อนหน้า แม้ว่าการปรับปรุงนี้อาจดูเล็กน้อยสำหรับการ์ดกราฟิกสมัยใหม่ที่มีความจุ VRAM มาก แต่จะมีความสำคัญมากขึ้นที่ความละเอียดสูงกว่าเช่น 8K ซึ่ง DLSS สามารถใช้หน่วยความจำมากกว่าหนึ่งกิกะไบต์แม้จะมีการปรับปรุงแล้ว

ความสามารถที่เพิ่มขึ้นผ่านสถาปัตยกรรมขั้นสูง

โมเดล transformer แสดงถึงการเปลี่ยนแปลงพื้นฐานในเทคโนโลยี DLSS โดยใช้ vision transformers ที่ประเมินพิกเซลทั้งหมดภายในเฟรมเพื่อเข้าใจความสำคัญของพิกเซลแต่ละตัว วิธีการนี้ประมวลผลหลายเฟรมพร้อมกันเพื่อสร้างพิกเซลที่มีรายละเอียดสำหรับคุณภาพภาพที่เพิ่มขึ้น สถาปัตยกรรมใหม่มีพารามิเตอร์เป็นสองเท่าเมื่อเทียบกับรุ่นก่อนหน้าแบบ CNN ทำให้เกิดคุณภาพภาพเหมือนต้นฉบับในขณะที่เพิ่มความต้องการการประมวลผลการเรนเดอร์เป็นสี่เท่า

ผลกระทบที่กว้างขึ้นต่อประสิทธิภาพการเล่นเกม

การปรับปรุง VRAM เหล่านี้เป็นประโยชน์อย่างยิ่งสำหรับผู้ใช้ที่มีการ์ดกราฟิกที่มีความจุหน่วยความจำ 8GB หรือต่ำกว่า ทำให้คุณสมบัติ DLSS ขั้นสูงเข้าถึงได้มากขึ้นสำหรับฮาร์ดแวร์ระดับกลาง การปรับปรุงเหล่านี้เสริมการปรับปรุงการสร้างเฟรมของ DLSS 4 ซึ่งแยกต่างหากบรรลุการลดลงของการใช้ VRAM 30% การสร้างเฟรมโดยทั่วไปต้องการหน่วยความจำมากกว่าการขยายภาพอย่างมีนัยสำคัญ โดยเกมบางเกมเช่น Warhammer 40,000: Darktide แสดงการใช้ VRAM น้อยลง 400MB ที่ความละเอียด 4K ด้วย DLSS 4 เมื่อเทียบกับ DLSS 3

ผลกระทบต่อ VRAM ระหว่าง Frame Generation กับ Upscaling:

DLSS 4 Frame Generation: ลด VRAM ได้ 30% เมื่อเปรียบเทียบกับ DLSS 3
ตัวอย่างกรณีศึกษา ( Warhammer 40,000: Darktide ที่ความละเอียด 4K): ใช้ VRAM น้อยลง 400MB
Frame generation โดยทั่วไปจะใช้ VRAM มากกว่า upscaling อย่างมีนัยสำคัญ
การปรับปรุงประสิทธิภาพจะใช้แยกกันระหว่างส่วนประกอบของ upscaling และ frame generation

การพัฒนาในอนาคตและความพร้อมใช้งาน

เมื่อโมเดล transformer ออกจากสถานะเบต้าแล้ว NVIDIA คาดว่าจะปรับใช้การอัปเดตอย่างเป็นทางการที่รวมเทคโนโลยีนี้ในอีกไม่กี่เดือนข้างหน้า ประวัติของบริษัทในการปรับปรุงอย่างต่อเนื่องชี้ให้เห็นว่าการปรับแต่งเพิ่มเติมอาจตามมา คล้ายกับการทำซ้ำ DLSS ก่อนหน้าที่ได้รับการลดการใช้หน่วยความจำเพิ่มเติมเมื่อเวลาผ่านไป การพัฒนาเหล่านี้วางตำแหน่ง DLSS เป็นโซลูชันที่มีประสิทธิภาพมากขึ้นสำหรับประสบการณ์การเล่นเกมคุณภาพสูงในการกำหนดค่าฮาร์ดแวร์ที่หลากหลายมากขึ้น

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌