เครื่องมือเว็บที่เพิ่งเผยแพร่ชื่อ FFmpegs Pages ได้รับการวิจารณ์อย่างรุนแรงจากชุมชนนักพัฒนา หลังจากผู้ใช้ค้นพบข้อผิดพลาดทางเทคนิคมากมายในคำสั่ง FFmpeg ที่สร้างด้วย AI เครื่องมือนี้ซึ่งนำเสนอตัวเองเป็นอินเทอร์เฟซง่าย ๆ สำหรับงานประมวลผลวิดีโอทั่วไป ดูเหมือนจะถูกสร้างขึ้นทั้งหมดโดยโมเดลภาษาขนาดใหญ่โดยไม่มีการทดสอบหรือตรวจสอบที่เหมาะสม
ข้อบกพร่องทางเทคนิคที่สำคัญที่ถูกค้นพบ
สมาชิกชุมชนระบุปัญหาร้ายแรงหลายประการที่จะทำให้เครื่องมือไม่สามารถทำงานได้อย่างถูกต้อง ฟีเจอร์การบีบอัดคำนวณขนาดไฟล์เป้าหมายไม่ถูกต้อง โดยสมมติว่าวิดีโอทั้งหมดมีความยาว 60 วินาทีโดยไม่คำนึงถึงระยะเวลาจริง ซึ่งหมายความว่าผู้ใช้ที่พยายามบีบอัดวิดีโอ 10 นาทีให้มีขนาดเฉพาะจะได้ผลลัพธ์ที่ผิดพลาดอย่างมาก
เครื่องมือนี้ยังมีข้อผิดพลาดพื้นฐานของ codec รวมถึงการอ้างอิงถึง encoder ที่ไม่มีอยู่จริงอย่าง wav ใน FFmpeg เมื่อผู้ใช้พยายามรันคำสั่งเหล่านี้ FFmpeg จะส่งข้อความแสดงข้อผิดพลาดและไม่สามารถสร้างไฟล์เอาต์พุตได้ นอกจากนี้ แถบเลื่อนคุณภาพยังทำงานย้อนกลับ - การเลื่อนไปทางขวาแสดงให้เห็นถึงคุณภาพที่สูงขึ้น แต่จริง ๆ แล้วลดลง เนื่องจากค่า CRF ที่สูงขึ้นหมายถึงคุณภาพที่ต่ำลงใน FFmpeg
CRF (Constant Rate Factor): การตั้งค่าคุณภาพในการเข้ารหัสวิดีโอที่ตัวเลขต่ำกว่าหมายถึงคุณภาพสูงกว่า
ปัญหาทางเทคนิคสำคัญที่พบ:
- เครื่องมือบีบอัดคิดคำนวณโดยสมมติว่าวิดีโอทุกไฟล์มีความยาว 60 วินาที
- อ้างอิงตัวเข้ารหัส "wav" ที่ไม่มีอยู่จริงใน FFmpeg
- แถบเลื่อนคุณภาพทำงานย้อนกลับ (ตัวเลขสูงกว่า = คุณภาพต่ำกว่า)
- ไม่รองรับการรักษาอัตราส่วนภาพระหว่างการปรับขนาด
- บังคับให้เข้ารหัสเสียงใหม่แทนที่จะคัดลอกสตรีม
- ไม่สนใจแทร็กเสียง/วิดีโอหลายแทร็กในไฟล์ต้นฉบับ
แนวทางที่เรียบง่ายเกินไปทำให้เกิดปัญหา
อินเทอร์เฟซที่เรียบง่ายของเครื่องมือสร้างปัญหาเพิ่มเติมโดยการละเลยสถานการณ์ในโลกแห่งความเป็นจริงที่พบบ่อย มันไม่คำนึงถึงไฟล์ต้นฉบับที่มีหลายแทร็กเสียงหรือวิดีโอ ซึ่งอาจทำให้ผู้ใช้สูญเสียเนื้อหาสำคัญระหว่างการแปลง ฟังก์ชันปรับขนาดยังไม่สามารถรักษาอัตราส่วนภาพได้ ซึ่งอาจส่งผลให้เอาต์พุตวิดีโอยืดหรือบีบ
นี่เป็นการทำให้เรียบง่ายเกินไปอย่างอันตราย มันไม่คำนึงถึงไฟล์ต้นฉบับที่มีหลายแทร็ก ดังนั้นคุณอาจจะทิ้งบางส่วนโดยไม่ตั้งใจ
คำสั่งการแยกเสียงบังคับให้เข้ารหัสใหม่แม้ว่า codec ต้นฉบับสามารถคัดลอกโดยตรงได้ ทำให้เกิดการสูญเสียคุณภาพที่ไม่จำเป็นและเวลาประมวลผลที่นานขึ้น เครื่องมือยังตั้งค่าเริ่มต้นเป็น encoder AAC ในตัวของ FFmpeg ซึ่งให้ผลลัพธ์คุณภาพที่ต่ำกว่าอย่างเห็นได้ชัดเมื่อเปรียบเทียบกับทางเลือกภายนอก
ชุมชนแบ่งแยกเรื่องเครื่องมือที่สร้างด้วย AI
การค้นพบนี้ได้จุดประกายการอภิปรายที่กว้างขวางขึ้นเกี่ยวกับการแพร่กระจายของเครื่องมือซอฟต์แวร์ที่สร้างด้วย AI ในขณะที่นักพัฒนาบางคนแสดงความผิดหวังกับเอาต์พุต LLM ที่ไม่ได้ทดสอบและถูกแชร์สู่สาธารณะ คนอื่น ๆ โต้แย้งว่า AI ได้กลายเป็นสิ่งที่มีประโยชน์อย่างแท้จริงสำหรับการสร้างคำสั่ง FFmpeg เมื่อใช้อย่างถูกต้อง
ผู้ใช้หลายคนรายงานความสำเร็จในการใช้ ChatGPT, Claude และผู้ช่วย AI อื่น ๆ สำหรับงาน FFmpeg ที่ซับซ้อน รวมถึงสคริปต์ประมวลผลวิดีโออัตโนมัติที่รวมเครื่องมือหลายตัว อย่างไรก็ตาม การใช้งานที่ประสบความสำเร็จเหล่านี้มักจะเกี่ยวข้องกับผู้ใช้ที่เข้าใจเทคโนโลยีดีพอที่จะตรวจสอบและปรับปรุงคำสั่งที่สร้างด้วย AI
เครื่องมือทางเลือกที่กล่าวถึง:
- HandBrake: เครื่องมือแปลงวิดีโอแบบ GUI
- AI-shell CLI: ผู้ช่วย AI แบบ command-line สำหรับคำสั่ง shell
- Shell Oracle: เครื่องมือ GitHub สำหรับสร้างคำสั่ง FFmpeg
- ChatGPT / Claude: ผู้ช่วย AI แบบโต้ตอบสำหรับคำสั่ง FFmpeg ที่กำหนดเอง
ปัญหาการใช้งาน
เหตุการณ์นี้เน้นย้ำถึงความท้าทายที่ยังคงดำเนินต่อไปในระบบนิเวศ FFmpeg แม้ว่าเครื่องมือนี้จะมีพลังอย่างเหลือเชื่อ แต่ไวยากรณ์ที่ซับซ้อนของมันสร้างอุปสรรคสำหรับผู้ใช้ทั่วไป สิ่งนี้ได้นำไปสู่ความพยายามซ้ำ ๆ ในการสร้างอินเทอร์เฟซที่ใช้งานง่ายกว่า แม้ว่าโซลูชันที่ประสบความสำเร็จส่วนใหญ่จะต้องการความเชี่ยวชาญทางเทคนิคอย่างมากในการนำไปใช้อย่างถูกต้อง
นักพัฒนาบางคนแนะนำว่า FFmpeg เองอาจได้รับประโยชน์จากความสามารถในการประมวลผลภาษาธรรมชาติในตัว คล้ายกับการรวม Whisper เมื่อเร็ว ๆ นี้สำหรับการถอดเสียงเป็นข้อความ คนอื่น ๆ โต้แย้งว่าเครื่องมือ GUI ที่มีอยู่แล้วอย่าง HandBrake แก้ปัญหาการใช้งานสำหรับผู้ใช้ส่วนใหญ่ที่ต้องการอินเทอร์เฟซที่เรียบง่ายกว่าแล้ว
ความขัดแย้งนี้เป็นเครื่องเตือนใจว่าแม้ว่า AI จะมีค่าสำหรับการสร้างคำสั่งทางเทคนิค การตรวจสอบและการทดสอบที่เหมาะสมยังคงเป็นสิ่งจำเป็นก่อนที่จะแชร์เครื่องมือกับชุมชนที่กว้างขวางขึ้น สำหรับผู้ใช้ที่ต้องการความช่วยเหลือเรื่อง FFmpeg ผู้ช่วย AI ที่มีชื่อเสียงที่ใช้แบบโต้ตอบอาจให้ผลลัพธ์ที่ดีกว่าเครื่องมือเว็บที่สร้างไว้ล่วงหน้าที่มีคุณภาพไม่แน่นอน
อ้างอิง: FFmpegs Pages