นักวิจัยจาก Penn State ได้สาธิตรูปแบบการเฝ้าระวังใหม่ที่สามารถถอดรหัสการสนทนาทางโทรศัพท์โดยการตรวจจับการสั่นสะเทือนเล็กๆ จากหูฟังโทรศัพท์มือถือด้วยเทคโนโลยีเรดาร์ แม้ว่าการค้นพบนี้จะแสดงให้เห็นความสามารถทางเทคนิคที่น่าประทับใจ แต่ชุมชนเทคโนโลยีกำลังตั้งคำถามสำคัญเกี่ยวกับประสิทธิผลในโลกแห่งความเป็นจริงและเปรียบเทียบกับวิธีการเฝ้าระวังที่มีอยู่
งานวิจัยนี้สร้างขึ้นจากงานก่อนหน้าในปี 2022 ซึ่งทีมเดียวกันนี้ทำได้แม่นยำ 83% ในการระบุคำแต่ละคำ ตอนนี้โดยใช้การรู้จำเสียงพูดที่ขับเคลื่อนด้วย AI พวกเขาได้ขยายระบบของตนให้สามารถถอดความการสนทนาทั้งหมดได้แม่นยำ 60% ในระยะใกล้
ประสิทธิภาพความแม่นยำตามระยะทาง:
- ระยะทาง 50 เซนติเมตร: ความแม่นยำ 60%
- ระยะทาง 300 เซนติเมตร: ความแม่นยำ 2%
- เวอร์ชันก่อนหน้าปี 2022: ความแม่นยำ 83% สำหรับคำที่กำหนดไว้ล่วงหน้าเพียง 10 คำเท่านั้น
![]() |
---|
บุคคลกำลังสนทนาทางโทรศัพท์กลางแจ้ง แสดงให้เห็นบริบทของการเฝ้าระวังการสื่อสารผ่านโทรศัพท์มือถือ |
ข้อจำกัดด้านระยะทางทำให้เกิดความสงสัย
การอภิปรายในชุมชนเผยให้เห็นความกังวลอย่างมากเกี่ยวกับการใช้งานจริงของเทคโนโลยีนี้ ความแม่นยำของระบบลดลงอย่างรวดเร็วตามระยะทาง - จาก 60% ที่ระยะ 50 เซนติเมตร เหลือเพียง 2% ที่ระยะ 3 เมตร การลดลงอย่างรุนแรงนี้ทำให้หลายคนตั้งคำถามว่าไมโครโฟนทิศทางแบบดั้งเดิมจะมีประสิทธิภาพมากกว่าสำหรับการเฝ้าระวังจริงหรือไม่
นักวิจัยได้วางเซ็นเซอร์เรดาร์คลื่นมิลลิเมตร - เทคโนโลยีเดียวกับที่พบในรถยนต์ขับขี่อัตโนมัติและเครือข่าย 5G - ภายในระยะไม่กี่ฟุตจากโทรศัพท์เป้าหมาย จากนั้นพวกเขาใช้เวอร์ชันที่ปรับแต่งของโมเดลการรู้จำเสียงพูด Whisper ของ OpenAI โดยปรับให้เหมาะสมกับข้อมูลเรดาร์ที่มีสัญญาณรบกวนโดยการฝึกใหม่เพียง 1% ของพารามิเตอร์ของโมเดล
ข้อมูลจำเพาะทางเทคนิค:
- ประเภทเรดาร์: เซ็นเซอร์เรดาร์คลื่นมิลลิเมตร
- โมเดล AI: โมเดลการรู้จำเสียงพูด OpenAI Whisper ที่ได้รับการปรับแต่ง
- การปรับแต่งโมเดล: วิธี Low-rank adaptation (ฝึกใหม่เพียง 1% ของพารามิเตอร์)
- ขนาดคำศัพท์: สูงสุด 10,000 คำ
- ระยะการทำงาน: สูงสุด 3 เมตร (10 ฟุต)
การเปรียบเทียบกับวิธีการเฝ้าระวังที่มีอยู่
ผู้ที่สนใจเทคโนโลยีกำลังเปรียบเทียบกับเทคนิคการจับเสียงระยะไกลอื่นๆ ที่มีมาหลายปีแล้ว ไมโครโฟนเลเซอร์ที่เคยเป็นเอกสิทธิ์ของหน่วยงานข่าวกรองสามารถสร้างได้โดยนักสมัครเล่นในปัจจุบันและอาจให้ประสิทธิภาพที่ดีกว่าในระยะทางที่ไกลกว่า อุปกรณ์เหล่านี้ทำงานโดยการสะท้อนแสงเลเซอร์จากพื้นผิวที่สั่นสะเทือนเช่นหน้าต่างหรือวัตถุใกล้การสนทนา
ชุมชนยังอ้างอิงถึงงานวิจัยของ MIT ในปี 2014 ที่กู้คืนเสียงพูดจากภาพวิดีโอของวัตถุที่สั่นสะเทือนเช่นถุงมันฝรั่งทอดและใบไม้ บางคนถือว่าแนวทางที่ใช้กล้องนี้น่าประทับใจกว่าวิธีเรดาร์ปัจจุบัน เนื่องจากไม่ต้องใช้อุปกรณ์พิเศษนอกเหนือจากการบันทึกวิดีโอมาตรฐาน
น่าสนใจที่การวัดการสั่นสะเทือนของเสียงพูดเป็นไปได้ แต่โดยรวมแล้วฉันไม่เห็นว่านี่เป็นการโจมตีที่เป็นไปได้ จะต้องเข้าใกล้เป้าหมายมาก ความแม่นยำ 60% ที่อ้างถึงนั้นอยู่ที่ระยะ 50 เซนติเมตร
การเปรียบเทียบกับวิธีการอื่น:
- ความแม่นยำในการอ่านริมฝีปาก: 30-40% ของคำพูด
- ไมโครโฟนเลเซอร์: มีความสามารถในการใช้งานระยะไกลกว่า สามารถสร้างได้สำหรับผู้ที่ชื่นชอบ
- การตรวจจับการสั่นสะเทือนด้วยกล้อง: ใช้งานได้กับอุปกรณ์วิดีโอมาตรฐาน
- ไมโครโฟนทิศทางแบบดั้งเดิม: อาจมีประสิทธิภาพที่ดีกว่าในระยะไกล
ผลกระทบด้านความปลอดภัยและความกังวลในอนาคต
แม้จะมีข้อจำกัดในปัจจุบัน ผู้เชี่ยวชาญด้านความปลอดภัยยอมรับคุณค่าของงานวิจัยในการเน้นย้ำความเสี่ยงด้านความเป็นส่วนตัวที่อาจเกิดขึ้น เทคโนโลยีนี้สามารถย่อขนาดลงเป็นวัตถุในชีวิตประจำวันเช่นปากกาได้ในทางทฤษฎี ทำให้เกิดอุปกรณ์เฝ้าระวังแบบลับๆ อย่างไรก็ตาม ฉันทามติแสดงให้เห็นว่าวิธีการที่มีอยู่เช่นไมโครโฟนทิศทางคุณภาพสูงน่าจะมีประสิทธิภาพเหนือกว่าระบบที่ใช้เรดาร์ในสถานการณ์ส่วนใหญ่
ทีมวิจัยเน้นย้ำว่างานของพวกเขาได้รับการออกแบบมาเพื่อคาดการณ์สิ่งที่ผู้ร้ายอาจพัฒนา มากกว่าการสร้างเครื่องมือเฝ้าระวังจริง โดยการเข้าใจความเป็นไปได้เหล่านี้ พวกเขาหวังว่าจะเพิ่มความตระหนักของสาธารณชนเกี่ยวกับภัยคุกคามด้านความเป็นส่วนตัวที่เกิดขึ้นใหม่
การค้นพบนี้ยังทำให้เกิดคำถามเกี่ยวกับการออกแบบสมาร์ทโฟนและว่ารูปแบบบางอย่างอาจเสี่ยงต่อการเฝ้าระวังประเภทนี้มากกว่าหรือไม่ สมาชิกชุมชนบางคนคาดเดาว่าหูฟังอาจสร้างสัญญาณการสั่นสะเทือนที่แรงกว่าเนื่องจากขนาดที่เล็กกว่า แม้ว่าพื้นที่ผิวที่ลดลงอาจชดเชยข้อได้เปรียบนี้
เนื่องจากความสามารถของ AI ยังคงขยายตัวอย่างรวดเร็ว นักวิจัยแนะนำว่าการปรับปรุงในอนาคตในการรู้จำเสียงพูดอาจเพิ่มความแม่นยำของระบบดังกล่าว อย่างไรก็ตาม สำหรับตอนนี้ เทคโนโลยีนี้ยังคงเป็นการพิสูจน์แนวคิดมากกว่าภัยคุกคามการเฝ้าระวังที่ใช้งานได้จริง
อ้างอิง: Conversations remotely detected from cell phone vibrations, researchers report