การทดลอง AI Upscaling ของ YouTube เปลี่ยนภาพคอนเสิร์ตจริงให้กลายเป็นฝันร้ายดิจิทัลที่น่าขนลุก

ทีมชุมชน BigGo
การทดลอง AI Upscaling ของ YouTube เปลี่ยนภาพคอนเสิร์ตจริงให้กลายเป็นฝันร้ายดิจิทัลที่น่าขนลุก

YouTube ได้ดำเนินการทดลองอย่างเงียบ ๆ ที่ทำให้ผู้ชมรู้สึกเหมือนกำลังดูเนื้อหาผ่านกระจกเงาในบ้านผีสิง แพลตฟอร์มได้ใช้ AI เพื่อปรับปรุงวิดีโอที่อัปโหลดไปยัง YouTube Shorts แต่ผลลัพธ์ที่ได้ทำให้ผู้ใช้รู้สึกไม่สบายใจอย่างแพร่หลาย โดยพวกเขาบรรยายภาพที่ผ่านการประมวลผลแล้วว่าน่าขนลุกอย่างมาก

ความขัดแย้งเกิดขึ้นเมื่อวิดีโอคอนเสิร์ตของ Will Smith ถูกกล่าวหาว่าใช้ฝูงชนปลอมที่สร้างด้วย AI แม้ว่าฝูงชนจะเป็นของจริง แต่วิดีโอเหล่านั้นได้ผ่านการประมวลผลด้วย AI หลายชั้นที่ทำให้ดูเทียมและน่าขนลุก

การสื่อสารอย่างเป็นทางการของ YouTube เกี่ยวกับการทดลองใช้การปรับปรุงการประมวลผลวิดีโอด้วย AI
การสื่อสารอย่างเป็นทางการของ YouTube เกี่ยวกับการทดลองใช้การปรับปรุงการประมวลผลวิดีโอด้วย AI

การประมวลผล AI สองชั้น

ภาพคอนเสิร์ตของ Will Smith ผ่านการปรับแต่งด้วย AI สองครั้งแยกจากกัน ครั้งแรก ทีมของ Smith ใช้เครื่องมือ AI เพื่อแปลงภาพนิ่งของผู้ชมคอนเสิร์ตจริงให้เป็นคลิปวิดีโอสั้น ๆ สำหรับเนื้อหาโปรโมต เทคนิคนี้เรียกว่า image-to-video generation ซึ่งนำภาพนิ่งมาสร้างภาพลวงตาของการเคลื่อนไหว

ชั้นที่สองมาจาก YouTube เอง แพลตฟอร์มได้ทดลองใช้การประมวลผลหลังอัตโนมัติกับวิดีโอ YouTube Shorts บางเรื่อง โดยใช้สิ่งที่พวกเขาเรียกว่าเทคโนโลยี machine learning แบบดั้งเดิมเพื่อลดสัญญาณรบกวนและความเบลอ อย่างไรก็ตาม ผลลัพธ์ที่ได้ไม่ได้ดั้งเดิมเลย

Image-to-video generation: เทคโนโลยี AI ที่สร้างคลิปวิดีโอเคลื่อนไหวจากภาพถ่ายนิ่งโดยการทำนายและสร้างเฟรมกลาง

การประมวลผลวิดีโอคอนเสิร์ต Will Smith :

  • ชั้นที่ 1: ทีมของ Smith ใช้โมเดล AI แปลงรูปภาพเป็นวิดีโอเพื่อทำให้ภาพนิ่งของผู้ชมเคลื่อนไหว
  • ชั้นที่ 2: การประมวลผลหลังอัตโนมัติของ YouTube บน Shorts
  • ภาพต้นฉบับ: คอนเสิร์ตจริงที่เทศกาลในยุโรป ( Fiestas Lenders Festival , Paleo Festival , Ronquières Festival )
  • ผลลัพธ์: เนื้อหาที่แท้จริงดูเหมือนปลอมเนื่องจากการปรับปรุงด้วย AI หลายชั้น

ปรากฏการณ์ Uncanny Valley

ผู้ใช้รายงานปฏิกิริยาทางกายภาพต่อวิดีโอที่ผ่านการประมวลผล โดยบางคนประสบกับอาการคลื่นไส้และเวียนหัว การประมวลผลด้วย AI สร้างสิ่งที่หลายคนบรรยายว่าเป็นปรากฏการณ์ uncanny valley - ที่ซึ่งบางสิ่งดูเกือบจะเหมือนจริงแต่รู้สึกผิดปกติโดยพื้นฐาน

ฉันรู้สึกไม่สบายใจอย่างจริงจัง เหมือนกับว่าฉันกำลังเมายาหลอนประสาทและไม่สามารถเชื่อใจการรับรู้ของตัวเองได้

ปัญหานี้เห็นได้ชัดเจนเป็นพิเศษในภาพคอนเสิร์ต ที่ซึ่ง AI พยายามปรับปรุงภาพที่เบลอหรือมีลักษณะศิลปะโดยเจตนา ในตัวอย่างหนึ่ง วิดีโอคอนเสิร์ตของ David Bowie ถูกประมวลผลจนนักดนตรีผู้โด่งดังกลายเป็นคนที่แทบจำไม่ได้ โดย AI สร้างใบหน้าใหม่เมื่อไม่สามารถตีความภาพต้นฉบับได้อย่างชัดเจน

Uncanny valley: ความรู้สึกไม่สบายใจที่ผู้คนประสบเมื่อพบเจอสิ่งที่ดูเกือบจะเป็น แต่ไม่ใช่ มนุษย์หรือของจริง

แฟนๆ ที่มีส่วนร่วมทางอารมณ์ในช่วงเวลานั้น สะท้อนถึงเอฟเฟกต์แปลกๆ ของการประมวลผลวิดีโอด้วย AI
แฟนๆ ที่มีส่วนร่วมทางอารมณ์ในช่วงเวลานั้น สะท้อนถึงเอฟเฟกต์แปลกๆ ของการประมวลผลวิดีโอด้วย AI

ปัญหา TV Smoothing ที่เกิดขึ้นอีกครั้ง

สถานการณ์นี้สะท้อนการต่อสู้ที่ยังคงดำเนินอยู่กับ motion smoothing บนโทรทัศน์สมัยใหม่ - ฟีเจอร์ที่แทรกเฟรมเพื่อทำให้เนื้อหาดูเรียบขึ้น แต่มักจะทำลายเจตนาทางศิลปะของผู้สร้างภาพยนตร์ ผู้ใช้หลายคนรายงานว่าการประมวลผลด้วย AI ทำให้เนื้อหาระดับมืออาชีพดูถูกและเทียม คล้ายกับที่ละครโทรทัศน์ดูแตกต่างจากภาพยนตร์เนื่องจากอัตราเฟรมที่สูงกว่า

เทคโนโลยีนี้ดูเหมือนออกแบบมาสำหรับการทำให้การสาธิตการขายดูน่าประทับใจมากกว่าการปรับปรุงประสบการณ์การรับชมจริง ๆ เช่นเดียวกับที่โทรทัศน์ในร้านค้าใช้ motion smoothing เพื่อให้ดูคมชัดกว่าคู่แข่ง การประมวลผลของ YouTube อาจมุ่งเป้าไปที่การทำให้เนื้อหาดูขัดเกลามากขึ้นบนหน้าจอมือถือขนาดเล็ก

รายละเอียดการประมวลผล AI ของ YouTube:

  • ใช้เฉพาะกับ YouTube Shorts เท่านั้น ไม่ใช่วิดีโอปกติ
  • ใช้ "machine learning แบบดั้งเดิม" สำหรับการลดสัญญาณรบกวนและการลดความเบลอ
  • โฆษก Google ชี้แจงว่าเป็น "ไม่ใช่ generative AI" แต่เป็น computational photography
  • การประมวลผลเกิดขึ้นโดยอัตโนมัติในวิดีโอที่เลือกโดยไม่ได้รับความยินยอมจากผู้อัปโหลด
  • ส่งผลให้ได้ภาพที่ดูเทียมและแตกต่างจากการอัปโหลดต้นฉบับบนแพลตฟอร์มอื่นๆ
แฟนๆ แสดงการสนับสนุนระหว่างคอนเสิร์ต ท่ามกลางการถกเถียงเรื่องการปรับปรุงด้วยเทคโนโลยีประดิษฐ์ในเนื้อหาวิดีโอ
แฟนๆ แสดงการสนับสนุนระหว่างคอนเสิร์ต ท่ามกลางการถกเถียงเรื่องการปรับปรุงด้วยเทคโนโลยีประดิษฐ์ในเนื้อหาวิดีโอ

แนวโน้มที่น่ากังวลสำหรับความเป็นจริง

นอกเหนือจากปัญหาภาพที่เกิดขึ้นทันทีแล้ว การพัฒนานี้ยังทำให้เกิดคำถามที่ลึกซึ้งกว่าเกี่ยวกับความสัมพันธ์ของเรากับเนื้อหาที่แท้จริง เมื่อการประมวลผลด้วย AI กลายเป็นเรื่องธรรมดาและตรวจจับได้ยากขึ้น เส้นแบ่งระหว่างเนื้อหาจริงและเทียมยังคงเบลอมากขึ้น สิ่งนี้น่ากังวลเป็นพิเศษสำหรับภาพประวัติศาสตร์ เนื้อหาข่าว และสื่อสารคดีที่ความถูกต้องมีความสำคัญ

สถานการณ์นี้เน้นย้ำปัญหาที่กว้างขึ้นในอุตสาหกรรมเทคโนโลยี: การผลักดันให้นำโซลูชัน AI มาใช้แม้ว่าผู้บริโภคจะไม่ได้ขอมา ตั้งแต่แชทบอทที่ไม่ต้องการไปจนถึงการปรับปรุงภาพอัตโนมัติ บริษัทต่าง ๆ ดูเหมือนมุ่งมั่นที่จะแทรก AI เข้าไปในทุกด้านของชีวิตดิจิทัล ซึ่งมักจะทำให้ประสบการณ์แย่ลงแทนที่จะดีขึ้น

การทดลองของ YouTube เป็นเพียงตัวอย่างล่าสุดของเทคโนโลยีที่ถูกนำมาใช้ไม่ใช่เพราะมันปรับปรุงประสบการณ์ผู้ใช้ แต่เพราะมันแสดงความสามารถที่ล้ำสมัย เมื่อ AI ซับซ้อนมากขึ้น การแยกแยะระหว่างเนื้อหาแท้จริงและที่ผ่านการประมวลผลจะยากขึ้นเท่านั้น ซึ่งอาจทำลายความไว้วางใจในสื่อดิจิทัลโดยรวม

อ้างอิง: Will Smith's concert crowds are real, but AI is blurring the lines