ในโลกของการประมวลผลภาพดิจิทัล อัลกอริทึมการปรับขนาดคือฮีโร่ที่ไม่ได้รับคำชื่นชมที่กำหนดว่าภาพจะดูอย่างไรเมื่อถูกเปลี่ยนขนาด ในขณะที่ผู้ใช้ส่วนใหญ่เพียงแค่เลือกการปรับตัวอย่างมีคุณภาพสูงในโปรแกรมแก้ไขภาพที่พวกเขาชื่นชอบ แต่ก็มีการอภิปรายทางเทคนิคที่คึกคักเกิดขึ้นเกี่ยวกับรากฐานทางคณิตศาสตร์ของอัลกอริทึมเหล่านี้—โดยเฉพาะอย่างยิ่งการปรับขนาดแบบ Lanczos—และสิ่งผิดปกติทางภาพที่พวกมันสามารถสร้างได้
การค้นหาการปรับขนาดที่สมบูรณ์แบบ
ความท้าทายพื้นฐานในการปรับขนาดภาพคือการสร้างสัญญาณต่อเนื่องจากตัวอย่างที่ไม่ต่อเนื่อง วิธีแก้ปัญหาทางคณิตศาสตร์ในอุดมคติเกี่ยวข้องกับฟังก์ชัน sinc ซึ่งสามารถสร้างสัญญาณขึ้นใหม่ได้อย่างสมบูรณ์ภายใต้เงื่อนไขเฉพาะ ดังที่ผู้แสดงความคิดเห็นหนึ่งคนระบุไว้:
วิธีหนึ่งที่จะคิดเกี่ยวกับฟังก์ชัน sinc คือการมองมันเป็น reproducing kernel สำหรับพื้นที่ของฟังก์ชัน bandlimited
ความสมบูรณ์แบบทางคณิตศาสตร์นี้มาพร้อมกับต้นทุน—ฟังก์ชัน sinc ต้องพิจารณาจุดตัวอย่างทุกจุดเมื่อคำนวณพิกเซลใหม่แต่ละพิกเซล ทำให้มันไม่สามารถนำไปใช้ได้ในทางปฏิบัติเนื่องจากใช้ทรัพยากรการคำนวณสูง การปรับขนาดแบบ Lanczos แก้ไขปัญหานี้โดยการกำหนดหน้าต่างให้กับฟังก์ชัน sinc โดยใช้เพียงตัวอย่างที่อยู่ใกล้เคียงเท่านั้น ขณะที่พยายามรักษาคุณสมบัติที่น่าพอใจของมันไว้
ฟังก์ชันทางคณิตศาสตร์หลักในการประมาณค่าแบบอินเทอร์โพเลชัน
- ฟังก์ชัน Sinc: sin(πx)/(πx) - เคอร์เนลการประมาณค่าในอุดมคติสำหรับสัญญาณที่มีแบนด์วิดท์จำกัด
- หน้าต่าง Lanczos: sinc(x) × sinc(x/a) สำหรับ |x| < a, 0 กรณีอื่นๆ - การประมาณค่าแบบ sinc ในทางปฏิบัติ
- ฟังก์ชัน Jinc: 2J₁(πr)/(πr) โดยที่ J₁ คือฟังก์ชัน Bessel - ฟังก์ชันที่เทียบเท่ากับ sinc ในมิติ 2 มิติ
- ปรากฏการณ์ Gibbs: การสั่นแบบออสซิลเลชันที่เกิดขึ้นเมื่อสร้างสัญญาณที่ไม่ต่อเนื่องด้วยความถี่ที่จำกัด
ความขัดแย้งเรื่องริ่งกิ้ง
บางทีประเด็นที่ถูกพูดถึงมากที่สุดในชุมชนคือสิ่งผิดปกติแบบริ่งกิ้งที่ปรากฏรอบขอบคมในภาพที่ถูกปรับขนาด ลวดลายเป็นคลื่นเหล่านี้คล้ายคลึงกับสิ่งผิดปกติที่เห็นในการบีบอัดภาพ JPEG และมีต้นกำเนิดจากปรากฏการณ์ทางคณิตศาสตร์เดียวกัน
มันเป็นปรากฏการณ์เดียวกันเป๊ะ ผู้สังเกตการณ์หนึ่งระบุ ความถี่สูงถูกตัดขาดอย่างกะทันหันในทั้งสองกรณี
ปรากฏการณ์กิบส์นี้เกิดขึ้นเมื่อสร้างสัญญาณที่มีความไม่ต่อเนื่องอย่างรวดเร็วโดยใช้ส่วนประกอบความถี่จำนวนจำกัด ผลลัพธ์ที่ได้คือการแกว่งกวัดที่เป็นลักษณะเฉพาะ ซึ่งหลายคนพบว่าก่อให้เกิดการรบกวนทางสายตา โดยเฉพาะอย่างยิ่งในภาพที่มีขอบความคมชัดสูง
ก้าวข้าม Lanczos แบบง่ายๆ
การอภิปรายเปิดเผยว่าการนำการปรับขนาดแบบ Lanczos ที่ใช้กันทั่วไป—เพียงแค่ใช้ตัวกรอง 1D แยกกันในแนวตั้งและแนวนอน—อาจไม่ใช่ทางเลือกที่ดีที่สุด ผู้เชี่ยวชาญบางคนแนะนำว่าวิธีการ 2D ที่เหมาะสมโดยใช้ฟังก์ชัน jinc (ซึ่งเทียบเท่ากับ sinc ใน 2 มิติ) อาจให้ผลลัพธ์ที่ดีกว่าด้วยริ่งกิ้งที่ลดลง
ฟังก์ชัน jinc ซึ่งมีความสัมพันธ์ทางคณิตศาสตร์กับลวดลายแอร์รีในเลนส์ทัศนศาสตร์ ก่อให้เกิดเคอร์เนลทรงกลมที่อาจจัดการกับคุณลักษณะของภาพได้อย่างเป็นธรรมชาติมากกว่าวิธีการสี่เหลี่ยมผืนผ้าของตัวกรอง 1D ที่แยกจากกัน
การพิจารณาในทางปฏิบัติและทางเลือกอื่นๆ
ในขณะที่ Lanczos ยังคงเป็นที่นิยมสำหรับการผลิตภาพที่คมชัดด้วยสิ่งผิดปกติแบบบล็อกกิ้งน้อยที่สุด ชุมชนก็ยอมรับการแลกเปลี่ยน ตัวกรองการปรับขนาดแบบ Cubic มักให้คุณภาพที่คล้ายคลึงกันด้วยริ่งกิ้งที่อาจน้อยกว่า แม้ว่าพวกมันอาจจะเสียความคมชัดไปบ้าง การเลือกระหว่างอัลกอริทึมมักขึ้นอยู่กับเนื้อหาภาพเฉพาะที่กำลังถูกปรับขนาดและความพึงพอใจทางสายตาของผู้ใช้
การสนทนายังขยายไปไกลกว่าภาพดิจิทัล โดยบางคนวาดเส้นขนานไปยังเทคนิคการวัดโทรทัศน์อนาล็อก ระบบ K-factor ที่ใช้ในโทรทัศน์กระจายเสียงให้วิธีการเชิงวัตถุเพื่อประเมินคุณภาพภาพโดยการวัดผลิตภัณฑ์ความบิดเบี้ยว—ซึ่งเป็นแนวทางที่สามารถให้ข้อมูลสำหรับการประเมินคุณภาพการปรับขนาดภาพดิจิทัล
การเปรียบเทียบวิธีการ Interpolation ของภาพที่ใช้กันทั่วไป
วิธีการ | ความคมชัด | Ringing Artifacts | ต้นทุนการประมวลผล |
---|---|---|---|
Nearest Neighbor | ต่ำ | ไม่มี | ต่ำมาก |
Linear/Bilinear | ปานกลาง | ต่ำ | ต่ำ |
Cubic/Bicubic | ปานกลาง-สูง | ปานกลาง | ปานกลาง |
Lanczos | สูง | สูง | สูง |
Ideal Sinc | สมบูรณ์แบบ | รุนแรงมาก (Gibbs) | ไม่เป็นไปได้ในทางปฏิบัติ |
ปัจจัยมนุษย์ในการเลือกทางเทคนิค
สิ่งที่ปรากฏจากการอภิปรายคือการเลือกอัลกอริทึมการปรับขนาดเกี่ยวข้องกับการสร้างสมดุลระหว่างความบริสุทธิ์ทางคณิตศาสตร์กับการพิจารณาในทางปฏิบัติและการรับรู้ของมนุษย์ ในขณะที่ฟังก์ชัน sinc แทนความสมบูรณ์แบบทางคณิตศาสตร์สำหรับสัญญาณ bandlimited แต่อิมเมจในโลกแห่งความจริงแทบจะไม่เคยเป็นไปตามเงื่อนไขในอุดมคติที่จำเป็นสำหรับการสร้างใหม่ที่สมบูรณ์แบบ
การสำรวจทางเลือกอย่างต่อเนื่อง—ตั้งแต่แนวทางที่ใช้ jinc ไปจนถึงตัวกรอง Cubic ที่ได้รับการปรับให้เหมาะสม—แสดงให้เห็นว่าการค้นหาวิธีการปรับขนาดที่ดีกว่ายังคงดึงดูดทั้งนักวิจัยและผู้ปฏิบัติงาน เมื่อเทคโนโลยีการสร้างภาพก้าวหน้าและความละเอียดของจอแสดงผลเพิ่มขึ้น รากฐานทางคณิตศาสตร์เหล่านี้ก็มีความเกี่ยวข้องมากขึ้นเรื่อยๆ กับประสบการณ์ทางสายตาในชีวิตประจำวัน
ความหลงใหลในรายละเอียดทางเทคนิคของชุมชนนี้เน้นย้ำให้เห็นว่าการดำเนินการที่ดูเหมือนง่ายๆ เช่น การเปลี่ยนขนาดภาพ เกี่ยวข้องกับหลักการทางคณิตศาสตร์อันลึกซึ้งซึ่งยังคงวิวัฒนาการและสร้างแรงบันดาลใจให้กับแนวทางใหม่ๆ ในการประมวลผลภาพดิจิทัล
อ้างอิง: Lánczos interpolation explained