Mesh Optimizer เอาชนะ JPEG-XL และ OpenEXR ในการทดสอบการบีบอัดภาพแบบ Floating Point

ทีมชุมชน BigGo
Mesh Optimizer เอาชนะ JPEG-XL และ OpenEXR ในการทดสอบการบีบอัดภาพแบบ Floating Point

การวิเคราะห์ที่ครอบคลุมเมื่อเร็วๆ นี้เกี่ยวกับการบีบอัดภาพแบบ floating point แบบไม่สูญเสียข้อมูลได้เผยให้เห็นผลลัพธ์ที่น่าประหลาดใจซึ่งท้าทายความเชื่อดั้งเดิมในสาขานี้ การศึกษาได้ตรวจสอบวิธีการบีบอัดต่างๆ สำหรับภาพหลายชั้นที่ใช้กันทั่วไปในเวิร์กโฟลว์ของภาพยนตร์และ VFX ซึ่งพิกเซลเดียวสามารถมีข้อมูลหลายสิบช่องสัญญาณนอกเหนือจากข้อมูล RGB แบบดั้งเดิม

ข้อกำหนดของชุดข้อมูลทดสอบ

  • ขนาดรวม: 31.22 เมกะพิกเซลใน 10 ไฟล์
  • ช่วงความละเอียด: 2048x4096 ถึง 8192x4096 พิกเซล
  • จำนวนช่องสัญญาณ: 3 ถึง 21 ช่องสัญญาณต่อภาพ
  • ประเภทข้อมูล: FP16 (ความแม่นยำครึ่งหนึ่ง) และ FP32 (ความแม่นยำเดี่ยว) จุดทศนิยมลอยตัว
  • แหล่งที่มา: การเรนเดอร์จาก Blender , ภาพ HDR จาก Polyhaven
  • ไฟล์ที่ใหญ่ที่สุด: 664.5MB แบบไม่บีบอัด (21 ช่องสัญญาณ, FP32)
  • กรณีการใช้งาน: การประกอบภาพยนตร์, เวิร์กโฟลว์ VFX , การเรนเดอร์หลายเลเยอร์

JPEG-XL แสดงให้เห็นความหวังแต่ยังคงมีปัญหาด้านประสิทธิภาพ

การประเมินพบว่า JPEG-XL แม้จะเป็นรูปแบบที่ทันสมัยที่ออกแบบมาเพื่อแทนที่มาตรฐานเก่า แต่ก็ยังประสบปัญหาด้านประสิทธิภาพการบีบอัดข้อมูล floating point การอพยพในชุมชนเน้นย้ำถึงความกังวลที่ยังคงมีอยู่เกี่ยวกับความเร็วการบีบอัดแบบไม่สูญเสียข้อมูลของ JPEG-XL ที่ช้าโดยธรรมชาติ ทำให้เกิดคำถามว่านี่เป็นข้อจำกัดพื้นฐานของข้อกำหนดหรือเป็นปัญหาการใช้งานที่สามารถแก้ไขได้ในเวอร์ชันอนาคต

ในระดับความพยายามการบีบอัดที่สูงขึ้น (4+) JPEG-XL สามารถบรรลุอัตราส่วนการบีบอัดที่ดีกว่ารูปแบบ OpenEXR แบบดั้งเดิม โดยระดับ 8 สามารถบรรลุอัตราส่วนการบีบอัด 2.4 เท่า อย่างไรก็ตาม สิ่งนี้มาพร้อมกับต้นทุนที่สูงมาก - ความเร็วการบีบอัดช้ากว่า OpenEXR ถึง 100 เท่า ทำให้ไม่เหมาะสมสำหรับเวิร์กโฟลว์ในโลกแห่งความเป็นจริงหลายๆ แห่งที่เวลาเป็นสิ่งสำคัญ

การเปรียบเทียบประสิทธิภาพการบีบอัด

วิธีการ อัตราส่วนการบีบอัด ความเร็วการบีบอัด ความเร็วการคลายการบีบอัด กรณีการใช้งาน
OpenEXR ZIP ~2.0x พื้นฐาน พื้นฐาน มาตรฐานอุตสาหกรรม
OpenEXR HTZJK ~2.1x ช้ากว่า ZIP ช้ากว่า ZIP การปรับปรุงที่กำลังจะมา
JPEG-XL Level 4 ~2.0x ช้ากว่า 10 เท่า ช้ากว่า 1-7 เท่า รูปแบบสมัยใหม่
JPEG-XL Level 8 ~2.4x ช้ากว่า 100 เท่า ช้ากว่า 1-15 เท่า การบีบอัดสูงสุด
Mesh Optimizer + LZ4 ~2.3x เร็วกว่า 30-100 เท่า เร็วกว่า 20 เท่า แนวทางทดลอง

แชมเปียนที่ไม่คาดคิดโผล่มาจากอุตสาหกรรมเกม

การค้นพบที่น่าประหลาดใจที่สุดมาจากการทดสอบ Mesh Optimizer ซึ่งเป็นเครื่องมือที่ออกแบบมาเดิมสำหรับการบีบอัดข้อมูล vertex ของกราฟิก 3D ในแอปพลิเคชันเกม เมื่อนำมาปรับใช้สำหรับการบีบอัดภาพและรวมกับ LZ4 วิธีการที่แปลกใหม่นี้ให้ผลลัพธ์ที่ยอดเยี่ยมซึ่งดึงดูดความสนใจของชุมชนเทคนิค

ประสิทธิภาพของ Mesh optimizer ที่นี่เป็นการเตือนใจที่ดี: สถานะล่าสุดของการบีบอัดทั่วไปยากที่จะเอาชนะ แต่การใช้งานเฉพาะทางยังมีพื้นที่สำหรับการปรับปรุง

วิธีการ Mesh Optimizer บรรลุอัตราส่วนการบีบอัดที่เทียบเคียงได้กับ JPEG-XL ระดับ 7-8 ในขณะที่เร็วกว่าในการบีบอัด 30-100 เท่าและเร็วกว่าในการคลายการบีบอัด 20 เท่า ข้อได้เปรียบด้านประสิทธิภาพที่โดดเด่นนี้เกิดจากวิธีการเฉพาะทางในการจัดการข้อมูลที่มีโครงสร้าง ซึ่งเดิมได้รับการปรับให้เหมาะสมสำหรับ vertex ของ mesh 3D แต่กลับมีประสิทธิภาพที่น่าประหลาดใจสำหรับข้อมูลภาพหลายช่องสัญญาณ

รายละเอียดการใช้งานทางเทคนิค

แนวทาง Mesh Optimizer:

  • แบ่งภาพออกเป็นส่วนย่อยขนาด 128x128 พิกเซล
  • บีบอัดแต่ละส่วนแยกกันและประมวลผลแบบขนาน
  • ขนาด Vertex จะถูกเติมให้เป็นจำนวนคู่ของ 4 ไบต์เมื่อจำเป็น
  • การประมวลผลเพิ่มเติมด้วย LZ4 แบบเสริมเพื่อการบีบอัดเพิ่มเติม
  • ผลกระทบต่อขนาดไฟล์ปฏิบัติการ: 26KB ( Mesh Optimizer ) + 48KB ( LZ4 )

ข้อจำกัดของ JPEG-XL:

  • ต้องการช่องสีแบบ interleaved และช่องอื่นๆ แบบ planar
  • ค่า FP16 subnormal ไม่สามารถ lossless ได้อย่างสมบูรณ์ (ปัญหา 1381)
  • ค่าที่ไม่มีขอบเขต (infinity/NaN) อาจไม่สามารถ roundtrip ได้อย่างถูกต้อง
  • ผลกระทบต่อขนาดไฟล์ปฏิบัติการ: 6,017KB
  • ความซับซ้อนของ API: 550 บรรทัด เทียบกับ 150 บรรทัดสำหรับ OpenEXR
ภาพนี้แสดงเว็บเพจที่กล่าวถึงเทคนิคการบีบอัดภาพที่ล้ำสมัยซึ่งเกี่ยวข้องกับผลการวิจัยล่าสุด รวมถึงเครื่องมือ Mesh Optimizer ที่เป็นนวัตกรรม
ภาพนี้แสดงเว็บเพจที่กล่าวถึงเทคนิคการบีบอัดภาพที่ล้ำสมัยซึ่งเกี่ยวข้องกับผลการวิจัยล่าสุด รวมถึงเครื่องมือ Mesh Optimizer ที่เป็นนวัตกรรม

OpenEXR ยังคงเป็นมาตรฐานอุตสาหกรรมแม้จะมีทางเลือกใหม่

OpenEXR ยังคงรักษาตำแหน่งเป็นรูปแบบที่ต้องการสำหรับเวิร์กโฟลว์มืออาชีพ โดยโหมดการบีบอัด HTZJK ที่กำลังจะมาถึงเสนอการปรับปรุงเล็กน้อย โหมดใหม่ให้อัตราส่วนการบีบอัดที่ดีขึ้นเล็กน้อยแต่มาพร้อมกับต้นทุนของประสิทธิภาพที่ลดลง ทำให้เกิดการแลกเปลี่ยนที่อาจจำกัดการยอมรับในสภาพแวดล้อมการผลิตที่มีเวลาจำกัด

วิธีการทดสอบเกี่ยวข้องกับชุดข้อมูลที่หลากหลายของไฟล์ 10 ไฟล์รวม 31.22 ล้านพิกเซล รวมถึงการเรนเดอร์หลายชั้นที่ซับซ้อนด้วยช่องสัญญาณสูงสุด 21 ช่องต่อพิกเซล วิธีการที่ครอบคลุมนี้ให้ข้อมูลเชิงลึกที่มีค่าสำหรับผู้เชี่ยวชาญที่ทำงานกับภาพ high dynamic range และภาพหลายช่องสัญญาณในไปป์ไลน์การพัฒนาภาพยนตร์ VFX และเกม

ผลลัพธ์แสดงให้เห็นว่าในขณะที่รูปแบบที่จัดตั้งขึ้นแล้วเช่น OpenEXR ยังคงเป็นตัวเลือกที่เชื่อถือได้ วิธีการที่เป็นนวัตกรรมจากสาขาที่เกี่ยวข้องสามารถเสนอโซลูชันที่ไม่คาดคิดสำหรับความท้าทายการบีบอัดที่มีมายาวนาน ความสำเร็จของ Mesh Optimizer แสดงให้เห็นว่าการผสมผสานข้ามโดเมนเทคนิคที่แตกต่างกันสามารถนำไปสู่การปรับปรุงประสิทธิภาพที่ก้าวล้ำ

อ้างอิง: Lossless Float Image Compression