ชุมชนผลักดันโปรเจกต์เสียงด้วย MCU ราคา 16 เซนต์ ให้ก้าวข้ามขีดจำกัด

ทีมชุมชน BigGo
ชุมชนผลักดันโปรเจกต์เสียงด้วย MCU ราคา 16 เซนต์ ให้ก้าวข้ามขีดจำกัด

ในโลกของโปรเจกต์ไมโครคอนโทรลเลอร์ วิศวกรมักจะผลักดันฮาร์ดแวร์ให้ไปถึงขีดจำกัดสูงสุดอยู่เสมอ โปรเจกต์ล่าสุดที่สาธิตการเล่นเสียงด้วยไมโครคอนโทรลเลอร์ราคา 16 เซนต์ ได้จุดประกายจินตนาการของชุมชน ส่งผลให้เกิดการอภิปรายเกี่ยวกับวิธีการปรับปรุงการทำงานและทิศทางของเทคโนโลยีต้นทุนต่ำสุดขั้วนี้ในอนาคต

ข้อมูลจำเพาะหลักของ CH32V003:

  • ราคา: $0.16 USD
  • แกนประมวลผล: 32-bit RISC-V
  • หน่วยความจำแฟลช: 16KB
  • RAM: 2KB
  • ความถี่ CPU สูงสุด: 48MHz
  • ตัวเลือกแพ็กเกจ: TSSOP20, QFN20, SOP16

การปรับแต่งทางเทคนิคเพื่อคุณภาพเสียงที่ดีขึ้น

โปรเจกต์ดั้งเดิมสามารถทำให้ CH32V003 เล่นเสียงผ่านการส่งออก PWM ได้สำเร็จ แต่สมาชิกชุมชนก็ระบุจุดที่ควรปรับปรุงได้ในทันที หนึ่งในข้อเสนอแนะสำคัญคือการเพิ่มวงจรกรองความถี่ต่ำ RC แบบง่ายๆ เข้าไปในวงจรลำโพง ซึ่งจะช่วยลดคุณภาพเสียงที่ฟังแล้วเหมือนเสียงหึ่งได้อย่างมีนัยสำคัญ

หากคุณรู้ว่าคุณกำลังขับอัตราสุ่มตัวอย่างที่ 8kHz คุณสามารถออกแบบตัวกรองโดยใช้ความถี่ตัดนั้นได้ และมันจะทำให้เสียงดีขึ้นมาก

ตัวกรองนี้จะช่วยลบสัญญาณพาหะ PWM ความถี่สูงออกไป ในขณะที่ยังคงรักษาเนื้อหาของเสียงจริงไว้ ส่งผลให้การสร้างเสียงมีความสะอาดมากขึ้น หลักการนี้ตรงไปตรงมา โดยการจับคู่ความถี่ตัดของตัวกรองกับอัตราสุ่มตัวอย่างของเสียง คุณจะกำจัดสิ่งรบกวนที่ไม่ต้องการออกไปโดยไม่ส่งผลต่อสัญญาณที่ต้องการ

วิธีการใช้งานเสียงที่ถูกหารือ:

  • เอาต์พุต PWM พร้อมการเล่นแซมเปิลที่ขับเคลื่อนด้วยซอフต์แวร์
  • การบีบอัด ADPCM (รูปแบบ 2-bit และ 4-bit)
  • การสังเคราะห์เสียงพูด LPC โดยใช้ไลบรารี Talkie
  • แฟลช I2C ภายนอกสำหรับขยายพื้นที่จัดเก็บข้อมูล
  • การกรอง RC แบบ low-pass เพื่อปรับปรุงคุณภาพเสียง
การแสดงผลกราฟิกของการบีบอัดแบบ 2-bit ADPCM ที่ใช้กับสัญญาณเสียง
การแสดงผลกราฟิกของการบีบอัดแบบ 2-bit ADPCM ที่ใช้กับสัญญาณเสียง

ขยายขีดความสามารถด้านเสียงผ่านส่วนประกอบภายนอก

ในขณะที่โปรเจกต์ดั้งเดิมมุ่งเน้นไปที่การเพิ่มประสิทธิภาพหน่วยความจำแฟลชภายใน 16KB ของไมโครคอนโทรลเลอร์ให้สูงสุด ผู้แสดงความคิดเห็นหลายคนได้เสนอวิธีปฏิบัติในการขยายขีดความสามารถด้านเสียง วิธีหนึ่งเกี่ยวข้องกับการเชื่อมต่อชิปแฟลช I2C เพื่อให้มีพื้นที่เก็บข้อมูลเพิ่มเติมสำหรับคลิปเสียงที่ยาวขึ้นหรือคำศัพท์ที่กว้างขวางขึ้นในแอปพลิเคชันการสังเคราะห์เสียงพูด

โซลูชันการจัดเก็บข้อมูลภายนอกนี้จะรักษาปรัชญาต้นทุนต่ำของโปรเจกต์ไว้ได้ ในขณะเดียวกันก็ขยายขอบเขตการนำไปใช้งานได้อย่างมาก CH32V003 ยังคงมีพิน I/O เพียงพอที่จะรองรับทั้งการสื่อสารแบบอนุกรมและการควบคุมอุปกรณ์ต่อพ่วงเพิ่มเติม แม้จะต่อกับแฟลชภายนอก ก็ทำให้เส้นทางการอัปเกรดนี้เป็นทางเลือกที่ใช้งานได้จริงสำหรับโปรเจกต์ที่ทะเยอทะยานมากขึ้น

บล็อกโพสต์ที่พูดถึงโปรเจกต์ไมโครคอนโทรลเลอร์ราคาประหยัดและความสามารถในการเล่นเสียง
บล็อกโพสต์ที่พูดถึงโปรเจกต์ไมโครคอนโทรลเลอร์ราคาประหยัดและความสามารถในการเล่นเสียง

บริบททางประวัติศาสตร์และวิธีการสังเคราะห์เสียงแบบอื่น

การอภิปรายได้หันไปสู่กรอบอ้างอิงทางประวัติศาสตร์ของการสังเคราะห์เสียงพูด โดยผู้แสดงความคิดเห็นอ้างอิงถึงการใช้งานคลาสสิกจากยุคแรกๆ ของคอมพิวเตอร์ TI Speak and Spell จากช่วงปลายทศวรรษ 1970 ใช้เทคนิคการเข้ารหัสเชิงคาดการณ์แบบเชิงเส้นที่คล้ายกัน ซึ่งแสดงให้เห็นว่าการสังเคราะห์เสียงที่ซับซ้อนบนฮาร์ดแวร์ที่มีขีดจำกัดนั้นเป็นประเพณีที่มีมายาวนาน

วิธีการสังเคราะห์แบบอื่นๆ ก็ปรากฏขึ้นในการสนทนาด้วย รวมถึงการอ้างอิงถึง SAM (Software Automatic Mouth) และความเป็นไปได้ในการใช้ตัวแปลงสัญญาณ (codec) ที่ซับซ้อนมากขึ้น เช่น AMR จากมาตรฐาน GSM ของโทรศัพท์มือถือ แม้ว่าการเข้าใกล้เหล่านี้จะเสนอคุณภาพเสียงหรือประสิทธิภาพการบีบอัดที่ดีกว่าที่มีศักยภาพ แต่ก็มาพร้อมกับความซับซ้อนในการคำนวณที่เพิ่มขึ้น ซึ่งอาจเป็นความท้าทายสำหรับโปรเซสเซอร์ CH32V003 ที่มีความสามารถจำกัด

อ้างอิงการสังเคราะห์เสียงพูดในอดีต:

  • Texas Instruments Speak & Spell (1978)
  • BBC Micro คำสั่ง "*SAY"
  • Apple MacinTalk สำหรับ Macintosh รุ่นคลาสสิก
  • SAM (Software Automatic Mouth)
วงจรรวมที่ใช้ในการสังเคราะห์เสียงยุคแรก แสดงให้เห็นความก้าวหน้าทางประวัติศาสตร์ของเทคโนโลยี
วงจรรวมที่ใช้ในการสังเคราะห์เสียงยุคแรก แสดงให้เห็นความก้าวหน้าทางประวัติศาสตร์ของเทคโนโลยี

ผลกระทบในวงกว้างสำหรับการคำนวณต้นทุนต่ำสุดขั้ว

เหนือกว่าการปรับปรุงทางเทคนิคเฉพาะด้าน การอภิปรายของชุมชนเผยให้เห็นถึงความตื่นเต้นเกี่ยวกับผลกระทบในวงกว้างของไมโครคอนโทรลเลอร์ราคาถูกแต่มีความสามารถ ชิปเหล่านี้เปิดโอกาสในการเพิ่มการตอบสนองด้วยเสียงให้กับแอปพลิเคชันต่างๆ ที่ก่อนหน้านี้ต้นทุนเป็นสิ่งกีดขวาง ตั้งแต่ของเล่นเพื่อการศึกษาไปจนถึงเซ็นเซอร์ในอุตสาหกรรมและอุปกรณ์อัตโนมัติในบ้าน

ตระกูล CH32V003 ยังมีรุ่นที่มีความสามารถมากกว่านี้ซึ่งมาพร้อมกับความสามารถ USB และ Ethernet ในตัว ชี้ให้เห็นถึงอนาคตที่อุปกรณ์ที่มีเครือข่ายและอินเทอร์เฟซเสียงสามารถสร้างขึ้นมาได้ด้วยราคารวมเพียงไม่กี่ดอลลาร์เท่านั้น ดังที่ผู้แสดงความคิดเห็นรายหนึ่งระบุ ข้อจำกัดหลักไม่ใช่ความสามารถของฮาร์ดแวร์ แต่เป็นเครื่องมือสำหรับการพัฒนา ยูทิลิตี้การวางแผนพินที่ดีขึ้นจะทำให้ชิปราคาถูกสุดขั้วเหล่านี้เข้าถึงได้ง่ายขึ้นสำหรับนักพัฒนาทั่วไป

ความกระตือรือร้นที่ล้อมรอบโปรเจกต์นี้แสดงให้เห็นว่าแม้ในยุคที่การคำนวณมีประสิทธิภาพและราคาไม่แพง วิศวกรยังคงพบกับความสุขและนวัตกรรมในการผลักดันฮาร์ดแวร์ที่ถูกที่สุดเท่าที่จะเป็นไปได้ให้ทำสิ่งที่น่าทาย ความรู้ร่วมกันของชุมชนช่วยเปลี่ยนการพิสูจน์แนวคิดที่ชาญฉลาดให้เป็นการใช้งานจริงที่มีแอปพลิเคชันในโลกแห่งความเป็นจริง

อ้างอิง: I made a 16 Cent MCU Talk