การวิเคราะห์ที่ครอบคลุมเมื่อเร็วๆ นี้เกี่ยวกับการบีบอัดภาพแบบ floating point แบบไม่สูญเสียข้อมูลได้เผยให้เห็นผลลัพธ์ที่น่าประหลาดใจซึ่งท้าทายความเชื่อดั้งเดิมในสาขานี้ การศึกษาได้ตรวจสอบวิธีการบีบอัดต่างๆ สำหรับภาพหลายชั้นที่ใช้กันทั่วไปในเวิร์กโฟลว์ของภาพยนตร์และ VFX ซึ่งพิกเซลเดียวสามารถมีข้อมูลหลายสิบช่องสัญญาณนอกเหนือจากข้อมูล RGB แบบดั้งเดิม
ข้อกำหนดของชุดข้อมูลทดสอบ
- ขนาดรวม: 31.22 เมกะพิกเซลใน 10 ไฟล์
- ช่วงความละเอียด: 2048x4096 ถึง 8192x4096 พิกเซล
- จำนวนช่องสัญญาณ: 3 ถึง 21 ช่องสัญญาณต่อภาพ
- ประเภทข้อมูล: FP16 (ความแม่นยำครึ่งหนึ่ง) และ FP32 (ความแม่นยำเดี่ยว) จุดทศนิยมลอยตัว
- แหล่งที่มา: การเรนเดอร์จาก Blender , ภาพ HDR จาก Polyhaven
- ไฟล์ที่ใหญ่ที่สุด: 664.5MB แบบไม่บีบอัด (21 ช่องสัญญาณ, FP32)
- กรณีการใช้งาน: การประกอบภาพยนตร์, เวิร์กโฟลว์ VFX , การเรนเดอร์หลายเลเยอร์
JPEG-XL แสดงให้เห็นความหวังแต่ยังคงมีปัญหาด้านประสิทธิภาพ
การประเมินพบว่า JPEG-XL แม้จะเป็นรูปแบบที่ทันสมัยที่ออกแบบมาเพื่อแทนที่มาตรฐานเก่า แต่ก็ยังประสบปัญหาด้านประสิทธิภาพการบีบอัดข้อมูล floating point การอพยพในชุมชนเน้นย้ำถึงความกังวลที่ยังคงมีอยู่เกี่ยวกับความเร็วการบีบอัดแบบไม่สูญเสียข้อมูลของ JPEG-XL ที่ช้าโดยธรรมชาติ ทำให้เกิดคำถามว่านี่เป็นข้อจำกัดพื้นฐานของข้อกำหนดหรือเป็นปัญหาการใช้งานที่สามารถแก้ไขได้ในเวอร์ชันอนาคต
ในระดับความพยายามการบีบอัดที่สูงขึ้น (4+) JPEG-XL สามารถบรรลุอัตราส่วนการบีบอัดที่ดีกว่ารูปแบบ OpenEXR แบบดั้งเดิม โดยระดับ 8 สามารถบรรลุอัตราส่วนการบีบอัด 2.4 เท่า อย่างไรก็ตาม สิ่งนี้มาพร้อมกับต้นทุนที่สูงมาก - ความเร็วการบีบอัดช้ากว่า OpenEXR ถึง 100 เท่า ทำให้ไม่เหมาะสมสำหรับเวิร์กโฟลว์ในโลกแห่งความเป็นจริงหลายๆ แห่งที่เวลาเป็นสิ่งสำคัญ
การเปรียบเทียบประสิทธิภาพการบีบอัด
| วิธีการ | อัตราส่วนการบีบอัด | ความเร็วการบีบอัด | ความเร็วการคลายการบีบอัด | กรณีการใช้งาน |
|---|---|---|---|---|
| OpenEXR ZIP | ~2.0x | พื้นฐาน | พื้นฐาน | มาตรฐานอุตสาหกรรม |
| OpenEXR HTZJK | ~2.1x | ช้ากว่า ZIP | ช้ากว่า ZIP | การปรับปรุงที่กำลังจะมา |
| JPEG-XL Level 4 | ~2.0x | ช้ากว่า 10 เท่า | ช้ากว่า 1-7 เท่า | รูปแบบสมัยใหม่ |
| JPEG-XL Level 8 | ~2.4x | ช้ากว่า 100 เท่า | ช้ากว่า 1-15 เท่า | การบีบอัดสูงสุด |
| Mesh Optimizer + LZ4 | ~2.3x | เร็วกว่า 30-100 เท่า | เร็วกว่า 20 เท่า | แนวทางทดลอง |
แชมเปียนที่ไม่คาดคิดโผล่มาจากอุตสาหกรรมเกม
การค้นพบที่น่าประหลาดใจที่สุดมาจากการทดสอบ Mesh Optimizer ซึ่งเป็นเครื่องมือที่ออกแบบมาเดิมสำหรับการบีบอัดข้อมูล vertex ของกราฟิก 3D ในแอปพลิเคชันเกม เมื่อนำมาปรับใช้สำหรับการบีบอัดภาพและรวมกับ LZ4 วิธีการที่แปลกใหม่นี้ให้ผลลัพธ์ที่ยอดเยี่ยมซึ่งดึงดูดความสนใจของชุมชนเทคนิค
ประสิทธิภาพของ Mesh optimizer ที่นี่เป็นการเตือนใจที่ดี: สถานะล่าสุดของการบีบอัดทั่วไปยากที่จะเอาชนะ แต่การใช้งานเฉพาะทางยังมีพื้นที่สำหรับการปรับปรุง
วิธีการ Mesh Optimizer บรรลุอัตราส่วนการบีบอัดที่เทียบเคียงได้กับ JPEG-XL ระดับ 7-8 ในขณะที่เร็วกว่าในการบีบอัด 30-100 เท่าและเร็วกว่าในการคลายการบีบอัด 20 เท่า ข้อได้เปรียบด้านประสิทธิภาพที่โดดเด่นนี้เกิดจากวิธีการเฉพาะทางในการจัดการข้อมูลที่มีโครงสร้าง ซึ่งเดิมได้รับการปรับให้เหมาะสมสำหรับ vertex ของ mesh 3D แต่กลับมีประสิทธิภาพที่น่าประหลาดใจสำหรับข้อมูลภาพหลายช่องสัญญาณ
รายละเอียดการใช้งานทางเทคนิค
แนวทาง Mesh Optimizer:
- แบ่งภาพออกเป็นส่วนย่อยขนาด 128x128 พิกเซล
- บีบอัดแต่ละส่วนแยกกันและประมวลผลแบบขนาน
- ขนาด Vertex จะถูกเติมให้เป็นจำนวนคู่ของ 4 ไบต์เมื่อจำเป็น
- การประมวลผลเพิ่มเติมด้วย LZ4 แบบเสริมเพื่อการบีบอัดเพิ่มเติม
- ผลกระทบต่อขนาดไฟล์ปฏิบัติการ: 26KB ( Mesh Optimizer ) + 48KB ( LZ4 )
ข้อจำกัดของ JPEG-XL:
- ต้องการช่องสีแบบ interleaved และช่องอื่นๆ แบบ planar
- ค่า FP16 subnormal ไม่สามารถ lossless ได้อย่างสมบูรณ์ (ปัญหา 1381)
- ค่าที่ไม่มีขอบเขต (infinity/NaN) อาจไม่สามารถ roundtrip ได้อย่างถูกต้อง
- ผลกระทบต่อขนาดไฟล์ปฏิบัติการ: 6,017KB
- ความซับซ้อนของ API: 550 บรรทัด เทียบกับ 150 บรรทัดสำหรับ OpenEXR
![]() |
|---|
| ภาพนี้แสดงเว็บเพจที่กล่าวถึงเทคนิคการบีบอัดภาพที่ล้ำสมัยซึ่งเกี่ยวข้องกับผลการวิจัยล่าสุด รวมถึงเครื่องมือ Mesh Optimizer ที่เป็นนวัตกรรม |
OpenEXR ยังคงเป็นมาตรฐานอุตสาหกรรมแม้จะมีทางเลือกใหม่
OpenEXR ยังคงรักษาตำแหน่งเป็นรูปแบบที่ต้องการสำหรับเวิร์กโฟลว์มืออาชีพ โดยโหมดการบีบอัด HTZJK ที่กำลังจะมาถึงเสนอการปรับปรุงเล็กน้อย โหมดใหม่ให้อัตราส่วนการบีบอัดที่ดีขึ้นเล็กน้อยแต่มาพร้อมกับต้นทุนของประสิทธิภาพที่ลดลง ทำให้เกิดการแลกเปลี่ยนที่อาจจำกัดการยอมรับในสภาพแวดล้อมการผลิตที่มีเวลาจำกัด
วิธีการทดสอบเกี่ยวข้องกับชุดข้อมูลที่หลากหลายของไฟล์ 10 ไฟล์รวม 31.22 ล้านพิกเซล รวมถึงการเรนเดอร์หลายชั้นที่ซับซ้อนด้วยช่องสัญญาณสูงสุด 21 ช่องต่อพิกเซล วิธีการที่ครอบคลุมนี้ให้ข้อมูลเชิงลึกที่มีค่าสำหรับผู้เชี่ยวชาญที่ทำงานกับภาพ high dynamic range และภาพหลายช่องสัญญาณในไปป์ไลน์การพัฒนาภาพยนตร์ VFX และเกม
ผลลัพธ์แสดงให้เห็นว่าในขณะที่รูปแบบที่จัดตั้งขึ้นแล้วเช่น OpenEXR ยังคงเป็นตัวเลือกที่เชื่อถือได้ วิธีการที่เป็นนวัตกรรมจากสาขาที่เกี่ยวข้องสามารถเสนอโซลูชันที่ไม่คาดคิดสำหรับความท้าทายการบีบอัดที่มีมายาวนาน ความสำเร็จของ Mesh Optimizer แสดงให้เห็นว่าการผสมผสานข้ามโดเมนเทคนิคที่แตกต่างกันสามารถนำไปสู่การปรับปรุงประสิทธิภาพที่ก้าวล้ำ
อ้างอิง: Lossless Float Image Compression

