Disney Research ได้เปิดตัว LookingGlass ระบบปฏิวัติที่ใช้ปัญญาประดิษฐ์สร้างภาพลวงตาแบบใหม่จากเทคนิคเก่าแก่หลายศตวรรษที่เรียกว่า anamorphoses ภาพพิเศษเหล่านี้จะดูผิดรูปผิดร่างเมื่อมองแบบปกติ แต่จะเผยให้เห็นภาพที่ซ่อนอยู่เมื่อมองผ่านกระจกหรือเลนส์พิเศษ
![]() |
---|
คอลลาจที่แสดงการตีความทางศิลปะ เน้นย้ำศักยภาพในการสร้างสรรค์ของภาพลวงตาที่ทันสมัยผ่านระบบ LookingGlass |
เทคโนโลยีการมองเห็นแบบคู่ที่ปฏิวัติวงการ
ศิลปะ anamorphic แบบดั้งเดิมมีข้อจำกัดสำคัญ คือสามารถเข้าใจได้เฉพาะเมื่อมองจากมุมเฉพาะหรือผ่านอุปกรณ์เฉพาะเท่านั้น แนวทางใหม่ของ Disney แก้ปัญหานี้ด้วยการสร้างภาพที่มีความหมายทั้งเมื่อมองโดยตรงและเมื่อแปลงผ่านอุปกรณ์ออปติคัล ระบบนี้ใช้โมเดล AI ขั้นสูงที่เรียกว่า latent rectified flow models ร่วมกับเทคนิคที่เรียกว่า Laplacian Pyramid Warping ที่ประมวลผลความถี่ต่างๆ ของภาพเพื่อรักษาคุณภาพภาพให้อยู่ในระดับสูง
เทคโนโลยีนี้พัฒนาต่อยอดจากงานวิจัยก่อนหน้าเรื่อง visual anagrams โดยขยายแนวคิดเหล่านี้ไปสู่เนื้อหาที่สร้างด้วย AI ที่ซับซ้อนมากขึ้น ทำให้ศิลปินและนักวิจัยสามารถสร้างภาพลวงตาที่ซับซ้อนซึ่งเป็นไปไม่ได้ที่จะทำด้วยมือ
องค์ประกอบทางเทคนิคหลัก:
- โมเดล latent rectified flow สำหรับการสร้างภาพ AI
- Laplacian Pyramid Warping สำหรับการประมวลผลภาพที่ตระหนักถึงความถี่
- การขยายระเบียบวิธี Visual Anagrams ไปยังโมเดลพื้นที่แฝง
- รองรับการแปลงเชิงพื้นที่ในช่วงที่กว้างขึ้นเมื่อเทียบกับวิธีการก่อนหน้า
การประยุกต์ใช้ในชุมชนและศักยภาพด้านความคิดสร้างสรรค์
การประกาศนี้ได้จุดประกายความสนใจในหมู่ศิลปินดิจิทัลและนักวิจัยที่เห็นศักยภาพการประยุกต์ใช้นอกเหนือจากความบันเทิง สมาชิกในชุมชนบางคนได้สังเกตเห็นความคล้ายคลึงกับโปรเจกต์การจัดการพิกเซลของตนเอง ซึ่งพิกเซลที่อยู่ติดกันในลำดับวิดีโอจะถูกสลับอย่างเป็นระบบเพื่อสร้างเอฟเฟกต์การเปลี่ยนรูประหว่างภาพต่างๆ
คนอื่นๆ ได้เชื่อมโยงกับการพัฒนาล่าสุดใน steganography ศิลปะการซ่อนข้อมูลให้มองเห็นได้ชัดเจน ความต้องการการมองแบบคู่อาจทำหน้าที่เป็นการเข้ารหัสภาพ โดยกุญแจคือการรู้การกำหนดค่ากระจกหรือเลนส์ที่ถูกต้องที่จำเป็นในการเผยเนื้อหาที่ซ่อนอยู่
โครงการที่เกี่ยวข้องในด้าน AI Optical Illusions:
- Visual Anagrams: สร้างภาพที่เปลี่ยนแปลงเมื่อพลิกหรือหมุน
- Diffusion Illusions: สร้างภาพปริศนาที่มีการตีความได้หลายแบบ
- QRMonster และ Illusion Diffusion: ภาพที่ซ่อนอยู่จะปรากฏเมื่อหรี่ตาหรือดูจากระยะไกล
- Control Net และ img2img: ใช้โมเดล diffusion ที่ปรับแต่งแล้วสำหรับการสร้างภาพแบบมีโครงสร้าง
สาขาที่เติบโตของภาพลวงตาที่เสริมด้วย AI
LookingGlass เป็นส่วนหนึ่งของแนวโน้มที่กว้างขึ้นในการใช้ generative AI เพื่อสร้างเอฟเฟกต์ออปติคัลคลาสสิกใหม่ โปรเจกต์ที่คล้ายกันเช่น Diffusion Illusions และ Visual Anagrams ได้เกิดขึ้นในช่วงปีที่ผ่านมา แต่ละโปรเจกต์สำรวจวิธีการต่างๆ ในการสร้างภาพที่เปลี่ยนความหมายตามวิธีการมอง ไม่ว่าจะผ่านการหมุน การกลับสี หรือระยะการมอง
เทคโนโลยีนี้แสดงให้เห็นว่า AI สมัยใหม่สามารถสร้างชีวิตใหม่ให้กับแนวคิดทางคณิตศาสตร์และศิลปะที่มีมาตั้งแต่ศตวรรษที่ 17 เปิดโอกาสสำหรับการติดตั้งศิลปะแบบโต้ตอบ เครื่องมือการศึกษา และรูปแบบใหม่ของสื่อดิจิทัลที่ดึงดูดผู้ชมในรูปแบบที่คาดไม่ถึง
อ้างอิง: LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
![]() |
---|
ภาพหน้าจอเชิงวิชาการที่แสดงเอกสารวิจัยเกี่ยวกับ LookingGlass ซึ่งแสดงให้เห็นการผสานรวม generative AI ในการสร้างภาพลวงตาใหม่ |