YouTube ได้ดำเนินการทดลองอย่างเงียบ ๆ ที่ทำให้ผู้ชมรู้สึกเหมือนกำลังดูเนื้อหาผ่านกระจกเงาในบ้านผีสิง แพลตฟอร์มได้ใช้ AI เพื่อปรับปรุงวิดีโอที่อัปโหลดไปยัง YouTube Shorts แต่ผลลัพธ์ที่ได้ทำให้ผู้ใช้รู้สึกไม่สบายใจอย่างแพร่หลาย โดยพวกเขาบรรยายภาพที่ผ่านการประมวลผลแล้วว่าน่าขนลุกอย่างมาก
ความขัดแย้งเกิดขึ้นเมื่อวิดีโอคอนเสิร์ตของ Will Smith ถูกกล่าวหาว่าใช้ฝูงชนปลอมที่สร้างด้วย AI แม้ว่าฝูงชนจะเป็นของจริง แต่วิดีโอเหล่านั้นได้ผ่านการประมวลผลด้วย AI หลายชั้นที่ทำให้ดูเทียมและน่าขนลุก
![]() |
---|
การสื่อสารอย่างเป็นทางการของ YouTube เกี่ยวกับการทดลองใช้การปรับปรุงการประมวลผลวิดีโอด้วย AI |
การประมวลผล AI สองชั้น
ภาพคอนเสิร์ตของ Will Smith ผ่านการปรับแต่งด้วย AI สองครั้งแยกจากกัน ครั้งแรก ทีมของ Smith ใช้เครื่องมือ AI เพื่อแปลงภาพนิ่งของผู้ชมคอนเสิร์ตจริงให้เป็นคลิปวิดีโอสั้น ๆ สำหรับเนื้อหาโปรโมต เทคนิคนี้เรียกว่า image-to-video generation ซึ่งนำภาพนิ่งมาสร้างภาพลวงตาของการเคลื่อนไหว
ชั้นที่สองมาจาก YouTube เอง แพลตฟอร์มได้ทดลองใช้การประมวลผลหลังอัตโนมัติกับวิดีโอ YouTube Shorts บางเรื่อง โดยใช้สิ่งที่พวกเขาเรียกว่าเทคโนโลยี machine learning แบบดั้งเดิมเพื่อลดสัญญาณรบกวนและความเบลอ อย่างไรก็ตาม ผลลัพธ์ที่ได้ไม่ได้ดั้งเดิมเลย
Image-to-video generation: เทคโนโลยี AI ที่สร้างคลิปวิดีโอเคลื่อนไหวจากภาพถ่ายนิ่งโดยการทำนายและสร้างเฟรมกลาง
การประมวลผลวิดีโอคอนเสิร์ต Will Smith :
- ชั้นที่ 1: ทีมของ Smith ใช้โมเดล AI แปลงรูปภาพเป็นวิดีโอเพื่อทำให้ภาพนิ่งของผู้ชมเคลื่อนไหว
- ชั้นที่ 2: การประมวลผลหลังอัตโนมัติของ YouTube บน Shorts
- ภาพต้นฉบับ: คอนเสิร์ตจริงที่เทศกาลในยุโรป ( Fiestas Lenders Festival , Paleo Festival , Ronquières Festival )
- ผลลัพธ์: เนื้อหาที่แท้จริงดูเหมือนปลอมเนื่องจากการปรับปรุงด้วย AI หลายชั้น
ปรากฏการณ์ Uncanny Valley
ผู้ใช้รายงานปฏิกิริยาทางกายภาพต่อวิดีโอที่ผ่านการประมวลผล โดยบางคนประสบกับอาการคลื่นไส้และเวียนหัว การประมวลผลด้วย AI สร้างสิ่งที่หลายคนบรรยายว่าเป็นปรากฏการณ์ uncanny valley - ที่ซึ่งบางสิ่งดูเกือบจะเหมือนจริงแต่รู้สึกผิดปกติโดยพื้นฐาน
ฉันรู้สึกไม่สบายใจอย่างจริงจัง เหมือนกับว่าฉันกำลังเมายาหลอนประสาทและไม่สามารถเชื่อใจการรับรู้ของตัวเองได้
ปัญหานี้เห็นได้ชัดเจนเป็นพิเศษในภาพคอนเสิร์ต ที่ซึ่ง AI พยายามปรับปรุงภาพที่เบลอหรือมีลักษณะศิลปะโดยเจตนา ในตัวอย่างหนึ่ง วิดีโอคอนเสิร์ตของ David Bowie ถูกประมวลผลจนนักดนตรีผู้โด่งดังกลายเป็นคนที่แทบจำไม่ได้ โดย AI สร้างใบหน้าใหม่เมื่อไม่สามารถตีความภาพต้นฉบับได้อย่างชัดเจน
Uncanny valley: ความรู้สึกไม่สบายใจที่ผู้คนประสบเมื่อพบเจอสิ่งที่ดูเกือบจะเป็น แต่ไม่ใช่ มนุษย์หรือของจริง
![]() |
---|
แฟนๆ ที่มีส่วนร่วมทางอารมณ์ในช่วงเวลานั้น สะท้อนถึงเอฟเฟกต์แปลกๆ ของการประมวลผลวิดีโอด้วย AI |
ปัญหา TV Smoothing ที่เกิดขึ้นอีกครั้ง
สถานการณ์นี้สะท้อนการต่อสู้ที่ยังคงดำเนินอยู่กับ motion smoothing บนโทรทัศน์สมัยใหม่ - ฟีเจอร์ที่แทรกเฟรมเพื่อทำให้เนื้อหาดูเรียบขึ้น แต่มักจะทำลายเจตนาทางศิลปะของผู้สร้างภาพยนตร์ ผู้ใช้หลายคนรายงานว่าการประมวลผลด้วย AI ทำให้เนื้อหาระดับมืออาชีพดูถูกและเทียม คล้ายกับที่ละครโทรทัศน์ดูแตกต่างจากภาพยนตร์เนื่องจากอัตราเฟรมที่สูงกว่า
เทคโนโลยีนี้ดูเหมือนออกแบบมาสำหรับการทำให้การสาธิตการขายดูน่าประทับใจมากกว่าการปรับปรุงประสบการณ์การรับชมจริง ๆ เช่นเดียวกับที่โทรทัศน์ในร้านค้าใช้ motion smoothing เพื่อให้ดูคมชัดกว่าคู่แข่ง การประมวลผลของ YouTube อาจมุ่งเป้าไปที่การทำให้เนื้อหาดูขัดเกลามากขึ้นบนหน้าจอมือถือขนาดเล็ก
รายละเอียดการประมวลผล AI ของ YouTube:
- ใช้เฉพาะกับ YouTube Shorts เท่านั้น ไม่ใช่วิดีโอปกติ
- ใช้ "machine learning แบบดั้งเดิม" สำหรับการลดสัญญาณรบกวนและการลดความเบลอ
- โฆษก Google ชี้แจงว่าเป็น "ไม่ใช่ generative AI" แต่เป็น computational photography
- การประมวลผลเกิดขึ้นโดยอัตโนมัติในวิดีโอที่เลือกโดยไม่ได้รับความยินยอมจากผู้อัปโหลด
- ส่งผลให้ได้ภาพที่ดูเทียมและแตกต่างจากการอัปโหลดต้นฉบับบนแพลตฟอร์มอื่นๆ
![]() |
---|
แฟนๆ แสดงการสนับสนุนระหว่างคอนเสิร์ต ท่ามกลางการถกเถียงเรื่องการปรับปรุงด้วยเทคโนโลยีประดิษฐ์ในเนื้อหาวิดีโอ |
แนวโน้มที่น่ากังวลสำหรับความเป็นจริง
นอกเหนือจากปัญหาภาพที่เกิดขึ้นทันทีแล้ว การพัฒนานี้ยังทำให้เกิดคำถามที่ลึกซึ้งกว่าเกี่ยวกับความสัมพันธ์ของเรากับเนื้อหาที่แท้จริง เมื่อการประมวลผลด้วย AI กลายเป็นเรื่องธรรมดาและตรวจจับได้ยากขึ้น เส้นแบ่งระหว่างเนื้อหาจริงและเทียมยังคงเบลอมากขึ้น สิ่งนี้น่ากังวลเป็นพิเศษสำหรับภาพประวัติศาสตร์ เนื้อหาข่าว และสื่อสารคดีที่ความถูกต้องมีความสำคัญ
สถานการณ์นี้เน้นย้ำปัญหาที่กว้างขึ้นในอุตสาหกรรมเทคโนโลยี: การผลักดันให้นำโซลูชัน AI มาใช้แม้ว่าผู้บริโภคจะไม่ได้ขอมา ตั้งแต่แชทบอทที่ไม่ต้องการไปจนถึงการปรับปรุงภาพอัตโนมัติ บริษัทต่าง ๆ ดูเหมือนมุ่งมั่นที่จะแทรก AI เข้าไปในทุกด้านของชีวิตดิจิทัล ซึ่งมักจะทำให้ประสบการณ์แย่ลงแทนที่จะดีขึ้น
การทดลองของ YouTube เป็นเพียงตัวอย่างล่าสุดของเทคโนโลยีที่ถูกนำมาใช้ไม่ใช่เพราะมันปรับปรุงประสบการณ์ผู้ใช้ แต่เพราะมันแสดงความสามารถที่ล้ำสมัย เมื่อ AI ซับซ้อนมากขึ้น การแยกแยะระหว่างเนื้อหาแท้จริงและที่ผ่านการประมวลผลจะยากขึ้นเท่านั้น ซึ่งอาจทำลายความไว้วางใจในสื่อดิจิทัลโดยรวม
อ้างอิง: Will Smith's concert crowds are real, but AI is blurring the lines