เหนือกว่า Lanczos: คณิตศาสตร์เบื้องหลังการปรับขนาดภาพและสาเหตุที่เกิดริ่งกิ้ง

ทีมชุมชน BigGo
เหนือกว่า Lanczos: คณิตศาสตร์เบื้องหลังการปรับขนาดภาพและสาเหตุที่เกิดริ่งกิ้ง

ในโลกของการประมวลผลภาพดิจิทัล อัลกอริทึมการปรับขนาดคือฮีโร่ที่ไม่ได้รับคำชื่นชมที่กำหนดว่าภาพจะดูอย่างไรเมื่อถูกเปลี่ยนขนาด ในขณะที่ผู้ใช้ส่วนใหญ่เพียงแค่เลือกการปรับตัวอย่างมีคุณภาพสูงในโปรแกรมแก้ไขภาพที่พวกเขาชื่นชอบ แต่ก็มีการอภิปรายทางเทคนิคที่คึกคักเกิดขึ้นเกี่ยวกับรากฐานทางคณิตศาสตร์ของอัลกอริทึมเหล่านี้—โดยเฉพาะอย่างยิ่งการปรับขนาดแบบ Lanczos—และสิ่งผิดปกติทางภาพที่พวกมันสามารถสร้างได้

การค้นหาการปรับขนาดที่สมบูรณ์แบบ

ความท้าทายพื้นฐานในการปรับขนาดภาพคือการสร้างสัญญาณต่อเนื่องจากตัวอย่างที่ไม่ต่อเนื่อง วิธีแก้ปัญหาทางคณิตศาสตร์ในอุดมคติเกี่ยวข้องกับฟังก์ชัน sinc ซึ่งสามารถสร้างสัญญาณขึ้นใหม่ได้อย่างสมบูรณ์ภายใต้เงื่อนไขเฉพาะ ดังที่ผู้แสดงความคิดเห็นหนึ่งคนระบุไว้:

วิธีหนึ่งที่จะคิดเกี่ยวกับฟังก์ชัน sinc คือการมองมันเป็น reproducing kernel สำหรับพื้นที่ของฟังก์ชัน bandlimited

ความสมบูรณ์แบบทางคณิตศาสตร์นี้มาพร้อมกับต้นทุน—ฟังก์ชัน sinc ต้องพิจารณาจุดตัวอย่างทุกจุดเมื่อคำนวณพิกเซลใหม่แต่ละพิกเซล ทำให้มันไม่สามารถนำไปใช้ได้ในทางปฏิบัติเนื่องจากใช้ทรัพยากรการคำนวณสูง การปรับขนาดแบบ Lanczos แก้ไขปัญหานี้โดยการกำหนดหน้าต่างให้กับฟังก์ชัน sinc โดยใช้เพียงตัวอย่างที่อยู่ใกล้เคียงเท่านั้น ขณะที่พยายามรักษาคุณสมบัติที่น่าพอใจของมันไว้

ฟังก์ชันทางคณิตศาสตร์หลักในการประมาณค่าแบบอินเทอร์โพเลชัน

  • ฟังก์ชัน Sinc: sin(πx)/(πx) - เคอร์เนลการประมาณค่าในอุดมคติสำหรับสัญญาณที่มีแบนด์วิดท์จำกัด
  • หน้าต่าง Lanczos: sinc(x) × sinc(x/a) สำหรับ |x| < a, 0 กรณีอื่นๆ - การประมาณค่าแบบ sinc ในทางปฏิบัติ
  • ฟังก์ชัน Jinc: 2J₁(πr)/(πr) โดยที่ J₁ คือฟังก์ชัน Bessel - ฟังก์ชันที่เทียบเท่ากับ sinc ในมิติ 2 มิติ
  • ปรากฏการณ์ Gibbs: การสั่นแบบออสซิลเลชันที่เกิดขึ้นเมื่อสร้างสัญญาณที่ไม่ต่อเนื่องด้วยความถี่ที่จำกัด

ความขัดแย้งเรื่องริ่งกิ้ง

บางทีประเด็นที่ถูกพูดถึงมากที่สุดในชุมชนคือสิ่งผิดปกติแบบริ่งกิ้งที่ปรากฏรอบขอบคมในภาพที่ถูกปรับขนาด ลวดลายเป็นคลื่นเหล่านี้คล้ายคลึงกับสิ่งผิดปกติที่เห็นในการบีบอัดภาพ JPEG และมีต้นกำเนิดจากปรากฏการณ์ทางคณิตศาสตร์เดียวกัน

มันเป็นปรากฏการณ์เดียวกันเป๊ะ ผู้สังเกตการณ์หนึ่งระบุ ความถี่สูงถูกตัดขาดอย่างกะทันหันในทั้งสองกรณี

ปรากฏการณ์กิบส์นี้เกิดขึ้นเมื่อสร้างสัญญาณที่มีความไม่ต่อเนื่องอย่างรวดเร็วโดยใช้ส่วนประกอบความถี่จำนวนจำกัด ผลลัพธ์ที่ได้คือการแกว่งกวัดที่เป็นลักษณะเฉพาะ ซึ่งหลายคนพบว่าก่อให้เกิดการรบกวนทางสายตา โดยเฉพาะอย่างยิ่งในภาพที่มีขอบความคมชัดสูง

ก้าวข้าม Lanczos แบบง่ายๆ

การอภิปรายเปิดเผยว่าการนำการปรับขนาดแบบ Lanczos ที่ใช้กันทั่วไป—เพียงแค่ใช้ตัวกรอง 1D แยกกันในแนวตั้งและแนวนอน—อาจไม่ใช่ทางเลือกที่ดีที่สุด ผู้เชี่ยวชาญบางคนแนะนำว่าวิธีการ 2D ที่เหมาะสมโดยใช้ฟังก์ชัน jinc (ซึ่งเทียบเท่ากับ sinc ใน 2 มิติ) อาจให้ผลลัพธ์ที่ดีกว่าด้วยริ่งกิ้งที่ลดลง

ฟังก์ชัน jinc ซึ่งมีความสัมพันธ์ทางคณิตศาสตร์กับลวดลายแอร์รีในเลนส์ทัศนศาสตร์ ก่อให้เกิดเคอร์เนลทรงกลมที่อาจจัดการกับคุณลักษณะของภาพได้อย่างเป็นธรรมชาติมากกว่าวิธีการสี่เหลี่ยมผืนผ้าของตัวกรอง 1D ที่แยกจากกัน

การพิจารณาในทางปฏิบัติและทางเลือกอื่นๆ

ในขณะที่ Lanczos ยังคงเป็นที่นิยมสำหรับการผลิตภาพที่คมชัดด้วยสิ่งผิดปกติแบบบล็อกกิ้งน้อยที่สุด ชุมชนก็ยอมรับการแลกเปลี่ยน ตัวกรองการปรับขนาดแบบ Cubic มักให้คุณภาพที่คล้ายคลึงกันด้วยริ่งกิ้งที่อาจน้อยกว่า แม้ว่าพวกมันอาจจะเสียความคมชัดไปบ้าง การเลือกระหว่างอัลกอริทึมมักขึ้นอยู่กับเนื้อหาภาพเฉพาะที่กำลังถูกปรับขนาดและความพึงพอใจทางสายตาของผู้ใช้

การสนทนายังขยายไปไกลกว่าภาพดิจิทัล โดยบางคนวาดเส้นขนานไปยังเทคนิคการวัดโทรทัศน์อนาล็อก ระบบ K-factor ที่ใช้ในโทรทัศน์กระจายเสียงให้วิธีการเชิงวัตถุเพื่อประเมินคุณภาพภาพโดยการวัดผลิตภัณฑ์ความบิดเบี้ยว—ซึ่งเป็นแนวทางที่สามารถให้ข้อมูลสำหรับการประเมินคุณภาพการปรับขนาดภาพดิจิทัล

การเปรียบเทียบวิธีการ Interpolation ของภาพที่ใช้กันทั่วไป

วิธีการ ความคมชัด Ringing Artifacts ต้นทุนการประมวลผล
Nearest Neighbor ต่ำ ไม่มี ต่ำมาก
Linear/Bilinear ปานกลาง ต่ำ ต่ำ
Cubic/Bicubic ปานกลาง-สูง ปานกลาง ปานกลาง
Lanczos สูง สูง สูง
Ideal Sinc สมบูรณ์แบบ รุนแรงมาก (Gibbs) ไม่เป็นไปได้ในทางปฏิบัติ

ปัจจัยมนุษย์ในการเลือกทางเทคนิค

สิ่งที่ปรากฏจากการอภิปรายคือการเลือกอัลกอริทึมการปรับขนาดเกี่ยวข้องกับการสร้างสมดุลระหว่างความบริสุทธิ์ทางคณิตศาสตร์กับการพิจารณาในทางปฏิบัติและการรับรู้ของมนุษย์ ในขณะที่ฟังก์ชัน sinc แทนความสมบูรณ์แบบทางคณิตศาสตร์สำหรับสัญญาณ bandlimited แต่อิมเมจในโลกแห่งความจริงแทบจะไม่เคยเป็นไปตามเงื่อนไขในอุดมคติที่จำเป็นสำหรับการสร้างใหม่ที่สมบูรณ์แบบ

การสำรวจทางเลือกอย่างต่อเนื่อง—ตั้งแต่แนวทางที่ใช้ jinc ไปจนถึงตัวกรอง Cubic ที่ได้รับการปรับให้เหมาะสม—แสดงให้เห็นว่าการค้นหาวิธีการปรับขนาดที่ดีกว่ายังคงดึงดูดทั้งนักวิจัยและผู้ปฏิบัติงาน เมื่อเทคโนโลยีการสร้างภาพก้าวหน้าและความละเอียดของจอแสดงผลเพิ่มขึ้น รากฐานทางคณิตศาสตร์เหล่านี้ก็มีความเกี่ยวข้องมากขึ้นเรื่อยๆ กับประสบการณ์ทางสายตาในชีวิตประจำวัน

ความหลงใหลในรายละเอียดทางเทคนิคของชุมชนนี้เน้นย้ำให้เห็นว่าการดำเนินการที่ดูเหมือนง่ายๆ เช่น การเปลี่ยนขนาดภาพ เกี่ยวข้องกับหลักการทางคณิตศาสตร์อันลึกซึ้งซึ่งยังคงวิวัฒนาการและสร้างแรงบันดาลใจให้กับแนวทางใหม่ๆ ในการประมวลผลภาพดิจิทัล

อ้างอิง: Lánczos interpolation explained