การระบาดใหญ่ได้ผลักดันให้นักดนตรีและผู้เชี่ยวชาญด้านเสียงหลายคนต้องหาโซลูชันเชิงสร้างสรรค์สำหรับการโทรระยะไกลที่มีคุณภาพสูง สิ่งที่เริ่มต้นจากคำของ่ายๆ จากเพื่อนให้ใช้ไมโครโฟนภายนอกและกีตาร์บน Zoom ได้จุดประกายการสนทนาที่กว้างขึ้นเกี่ยวกับเหตุผลที่คุณภาพเสียงยังคงแย่มากในปี 2025 แม้ว่าเราจะมีเทคโนโลยีที่สามารถทำได้ดีกว่านี้มาก
แนวทางฮาร์ดแวร์เทียบกับซอฟต์แวร์แบ่งแยกชุมชน
ในขณะที่ผู้ที่ชื่นชอบเสียงบางคนยอมรับการกำหนดเส้นทางซอฟต์แวร์ที่ซับซ้อนผ่าน DAW และไดรเวอร์เสียงเสมือน คนอื่นๆ กลับโต้แย้งว่าโซลูชันฮาร์ดแวร์ให้ผลลัพธ์ที่เรียบง่ายและเชื่อถือได้มากกว่า ฝ่ายฮาร์ดแวร์ชี้ไปที่ไมโครโฟนพรีแอมป์เฉพาะทาง แชนเนลสตริป และอินเทอร์เฟซเสียงในฐานะทางเลือกที่ไม่มีเลเทนซีและทำงานได้กับระบบปฏิบัติการต่างๆ โดยไม่ต้องใช้อุปกรณ์รวมหรือการกำหนดเส้นทางเสมือน
แนวทางซอฟต์แวร์แม้จะซับซ้อนกว่า แต่ก็ให้ความยืดหยุ่นมากขึ้นด้วยปลั๊กอินสำหรับการลดเสียงรบกวนและการบีบอัด อย่างไรก็ตาม มันต้องการการตั้งค่าไดรเวอร์เสียงเสมือนอย่างระมัดระวังและการกำหนดเส้นทางที่แม่นยำเพื่อหลีกเลี่ยงลูปป้อนกลับ
หมายเหตุ: DAW ย่อมาจาก Digital Audio Workstation - ซอฟต์แวร์ที่ใช้สำหรับการบันทึกและผสมเสียง
ส่วนประกอบของการติดตั้งฮาร์ดแวร์:
- ไมโครโฟน: Shure SM57
- USB Audio Interface: Behringer UMC202HD
- ซอฟต์แวร์ DAW: Reaper
- Virtual Audio Driver: Blackhole (เวอร์ชัน 16ch และ 2ch)
- ฮาร์ดแวร์เพิ่มเติม: DBX286 mic preamp, TC Electronic multiband compressor
ปัญหาคุณภาพเสียง Bluetooth
จุดเจ็บปวดที่สำคัญเกิดขึ้นจากข้อจำกัดของเสียงไร้สาย แม้ว่าอุปกรณ์สมัยใหม่จะสามารถส่งข้อมูลได้หลายร้อยเมกะบิตต่อวินาทีผ่าน WiFi แต่คุณภาพเสียง Bluetooth แทบไม่ได้ปรับปรุงเลยในสองทศวรรษที่ผ่านมา ชุมชนสังเกตว่าการส่งเพียง 2.3 เมกะบิตต่อวินาทีสำหรับเสียงสเตอริโอคุณภาพสูงบวกกับไมโครโฟนโมโนควรจะเป็นเรื่องง่ายในปี 2025 แต่ผู้บริโภคส่วนใหญ่ยังคงติดอยู่กับโคเดกที่บีบอัดและคุณภาพต่ำ
โทรศัพท์แอนะล็อกในยุค 80 ฟังดูดีกว่าเกือบทุกอย่างที่ผู้บริโภคทั่วไปมีโอกาสได้สัมผัสในปัจจุบัน
ความหงุดหงิดขยายเกินกว่าข้อจำกัดทางเทคนิคไปสู่แนวปฏิบัติทางธุรกิจ ที่ซึ่งนักพัฒนาโคเดกสร้างอุปสรรคด้านสิทธิบัตรเพื่อป้องกันไม่ให้ทางเลือกที่ฟรีและมีคุณภาพสูงได้รับการยอมรับ
การเปรียบเทียบคุณภาพเสียง:
- Bluetooth สมัยใหม่: เสียงบีบอัดประมาณ 16kHz
- โทรศัพท์อนาล็อก (ทศวรรษ 1980): คุณภาพที่รับรู้ได้สูงกว่าโซลูชันสำหรับผู้บริโภคในปัจจุบัน
- เป้าหมายดิจิทัลคุณภาพสูง: 48kHz, 16-bit สเตอริโอ (ต้องการแบนด์วิดท์ 2.3 Mbps)
- บริการระดับมืออาชีพ: เสียงแบบ lossless พร้อมความหน่วงต่ำกว่า 50ms สำหรับการทำงานร่วมกันแบบเรียลไทม์
บริการเฉพาะทางเติมเต็มช่องว่าง
บริการเสียงระดับมืออาชีพอย่าง Cleanfeed ได้เกิดขึ้นเพื่อแก้ไขข้อจำกัดเหล่านี้ โดยเสนอเสียงความเที่ยงตรงสูงและเลเทนซีต่ำที่ออกแบบมาเฉพาะสำหรับนักดนตรีและพอดแคสเตอร์ แพลตฟอร์มเหล่านี้หลีกเลี่ยงข้อจำกัดการประมวลผลเสียงของเครื่องมือการประชุมทางวิดีโอทั่วไป แม้ว่าจะต้องให้ผู้เข้าร่วมทุกคนใช้บริการเฉพาะทางเดียวกัน
ความท้าทายทางเทคนิคจะเห็นได้ชัดเจนโดยเฉพาะสำหรับการร่วมมือดนตรีสด ที่ซึ่งเลเทนซีเกิน 50 มิลลิวินาทีทำให้การเล่นแบบเรียลไทม์เป็นไปไม่ได้เกือบจะเลย
บทสรุป
การอภิปรายเรื่องคุณภาพเสียงเผยให้เห็นความหงุดหงิดที่กว้างขึ้นต่อสถานะปัจจุบันของการสื่อสารดิจิทัล ในขณะที่เทคโนโลยีสำหรับการโทรที่ใสกิ๊งมีอยู่แล้ว แต่การผสมผสานของโปรโตคอลเก่า ข้อจำกัดด้านสิทธิบัตร และลำดับความสำคัญของประสบการณ์ผู้ใช้ ได้ทำให้ผู้เชี่ยวชาญด้านเสียงจำนวนมากต้องสร้างวิธีแก้ปัญหาที่ซับซ้อน ไม่ว่าจะผ่านการกำหนดเส้นทางซอฟต์แวร์ที่ซับซ้อนหรือการตั้งค่าฮาร์ดแวร์เฉพาะทาง ชุมชนยังคงผลักดันเพื่อโซลูชันที่ดีกว่าในยุคที่คุณภาพเสียงที่แย่รู้สึกเหมือนล้าสมัยมากขึ้น
อ้างอิง: Telephone colophon: Or, how I overengineered my call audio