การทดลองล่าสุดของ Monadic DNA ในงานประชุม ethDenver ได้จุดประกายการอภิปรายที่สำคัญเกี่ยวกับความท้าทายที่แท้จริงในการปกป้องความเป็นส่วนตัวของข้อมูลพันธุกรรม แม้ว่าบริษัทจะได้สาธิตเทคโนโลยี multi-party computation (MPC) สำหรับการวิเคราะห์ DNA แต่ข้อเสนอแนะจากชุมชนเผยให้เห็นช่องว่างที่สำคัญระหว่างคำสัญญาเรื่องความเป็นส่วนตัวกับการนำไปใช้จริง
การทดลองนี้เก็บตัวอย่างน้ำลายจากผู้เข้าร่วมงานประชุมและใช้การจัดเก็บแบบเข้ารหัสที่ขับเคลื่อนด้วยเทคโนโลยี MPC เพื่อวิเคราะห์ข้อมูลพันธุกรรมโดยไม่เปิดเผยข้อมูลดิบ ผู้เข้าร่วมสามารถเข้าถึงผลลัพธ์ของตนผ่านเว็บแอปพลิเคชันโดยใช้หมายเลขชุดทดสอบเฉพาะและรหัส PIN ส่วนตัว
ข้อมูลจำเพาะทางเทคนิค:
- Genotyping Array: Global Screening Array (~500k markers)
- ตัวเลือกอื่น: Global Diversity Array (~1.5m markers)
- Full Genome Sequencing: ~3-11 ล้าน markers (ไม่ได้ใช้เนื่องจากต้นทุนสูง)
- เวลาในการประมวลผล: 2 เดือน (ระยะทดลอง), 2-3 สัปดาห์ (ระดับการผลิต)
- MPC Cluster: การตั้งค่า 3-node ที่ต้องการเพียง 1 honest node เพื่อความปลอดภัย
ปัญหาความไว้วางใจในห้องปฏิบัติการยังไม่ได้รับการแก้ไข
แม้จะมีการอ้างถึงความเป็นส่วนตัวที่เพิ่มขึ้น แต่จุดอ่อนที่สำคัญที่สุดยังคงไม่เปลี่ยนแปลง ห้องปฏิบัติการที่ประมวลผลตัวอย่าง DNA ยังคงมีการเข้าถึงข้อมูลพันธุกรรมที่ไม่ได้เข้ารหัสอย่างสมบูรณ์ สิ่งนี้สร้างความต้องการความไว้วางใจขั้นพื้นฐานที่เทคโนโลยีการเข้ารหัสไม่สามารถขจัดได้ บริษัทยอมรับข้อจำกัดนี้โดยระบุว่าความไว้วางใจในห้องปฏิบัติการในระดับหนึ่งเป็นสิ่งที่หลีกเลี่ยงไม่ได้ และกฎระเบียบกำหนดให้ห้องปฏิบัติการต้องเก็บรักษาตัวอย่างทางกายภาพไว้เป็นระยะเวลาที่กำหนด
สิ่งนี้แสดงถึงช่องว่างที่สำคัญในห่วงโซ่การปกป้องความเป็นส่วนตัว แม้จะมีการเข้ารหัสที่ซับซ้อนสำหรับการจัดเก็บและวิเคราะห์ แต่ขั้นตอนการประมวลผลเบื้องต้นยังคงมีความเสี่ยงต่อการใช้ข้อมูลในทางที่ผิดหรือการละเมิดข้อมูล
ข้อจำกัดด้านความเป็นส่วนตัว:
- ห้องปฏิบัติการยังคงมีสิทธิ์เข้าถึงตัวอย่าง DNA ดิบแบบไม่เข้ารหัส
- การปฏิบัติตามกฎหมายกำหนดให้ต้องเก็บตัวอย่างไว้เป็นระยะเวลาหนึ่ง
- การให้ความยินยอมโดยรู้เท่าทันสร้างการเชื่อมโยงตัวตน
- การทำให้ไม่ระบุตัวตนในปัจจุบัน ≠ การไม่ระบุตัวตนอย่างแท้จริง
- ยังคงใช้ S3/cloud storage ในห่วงโซ่การถ่ายโอนข้อมูล
การทำให้ไม่ระบุตัวตนยังไม่ถึงขั้นไม่ระบุตัวตนอย่างแท้จริง
การอภิปรายในชุมชนเน้นย้ำถึงความกังวลสำคัญอีกประการหนึ่งเกี่ยวกับความแตกต่างระหว่างข้อมูลที่ไม่ระบุตัวตนและข้อมูลที่ไม่ระบุตัวตนอย่างแท้จริง ระบบปัจจุบันใช้หมายเลขชุดทดสอบแบบต่อเนื่องร่วมกับรหัส PIN สี่หลัก ซึ่งสร้างช่องโหว่ด้านความปลอดภัยที่อาจเกิดขึ้น นักวิจารณ์ชี้ให้เห็นว่าผู้โจมตีอาจสามารถเจาะรหัส PIN ด้วยการลองผิดลองถูกได้หากพวกเขาค้นพบรูปแบบของหมายเลขชุดทดสอบ
ข้อกำหนดทางกฎหมายสำหรับการยินยอมโดยรู้เท่าทันยังสร้างการเชื่อมโยงกับตัวตนที่แท้จริง ทำให้เกิดช่องทางอื่นสำหรับการระบุตัวตนที่อาจเกิดขึ้น แม้ว่าบริษัทจะเสนอแนะการปรับปรุงในอนาคตโดยใช้กุญแจการเข้ารหัสและการพิสูจน์แบบไม่เปิดเผยความรู้ แต่วิธีแก้ปัญหาเหล่านี้ยังคงเป็นเพียงทฤษฎีในตอนนี้
ข้อพิจารณาด้านต้นทุนและความปลอดภัย:
- การจัดส่งตัวอย่าง: ต่ำกว่า 50 ดอลลาร์สหรัฐ ผ่าน UPS
- การตรวจสอบความปลอดภัยจากภายนอก: ประมาณ 100,000 ดอลลาร์สหรัฐ (ปัจจุบันไม่สามารถจ่ายได้)
- ความปลอดภัยของ PIN: รหัส 4 หลักพร้อมหมายเลขชุดทดสอบที่เรียงตามลำดับ (เสี่ยงต่อการโจมตีแบบ brute force)
- การจัดเก็บข้อมูล: การจัดเก็บในเบราว์เซอร์แบบ local storage สำหรับคีย์ของผู้ใช้ (ระยะทดลอง)
การนำไปใช้ทางเทคนิคทำให้เกิดคำถาม
การตั้งค่าการทดลองเผยให้เห็นข้อจำกัดเชิงปฏิบัติหลายประการ การถ่ายโอนข้อมูลยังคงพึ่งพาบริการจัดเก็บข้อมูลบนคลาวด์มาตรฐานเช่น Amazon S3 ซึ่งห้องปฏิบัติการมักใช้สำหรับการแบ่งปันข้อมูลพันธุกรรม แม้ว่าบริษัทจะสัญญาว่าจะขจัดตัวกลางดังกล่าวในการผลิต แต่การนำไปใช้ในปัจจุบันไม่ได้ส่งมอบคำสัญญาเรื่องความเป็นส่วนตัวอย่างเต็มที่
ดังนั้น... มันเป็นเพียงการอัปโหลด DNA ของคุณไปยัง S3 แต่มีขั้นตอนเพิ่มเติมในครั้งนี้?
การตอบสนองของบริษัทเน้นย้ำถึงความมุ่งมั่นในการเก็บข้อมูลให้เข้ารหัสตลอดเวลาและการสร้างโครงสร้างพื้นฐานที่จะยังคงทำงานได้แม้ว่าบริษัทจะล้มเหลว อย่างไรก็ตาม ระยะการทดลองในปัจจุบันแสดงให้เห็นการพึ่งพาวิธีการจัดการข้อมูลแบบดั้งเดิมอย่างมาก
ความท้าทายด้านต้นทุนและความสามารถในการขยายขนาด
การตรวจสอบความปลอดภัยจากภายนอก ซึ่งจะให้การตรวจสอบที่สำคัญของการอ้างเรื่องความเป็นส่วนตัว ยังคงอยู่นอกเหนือการเข้าถึงเนื่องจากข้อจำกัดด้านต้นทุน บริษัทประเมินว่าการตรวจสอบดังกล่าวจะมีค่าใช้จ่ายประมาณ 100,000 ดอลลาร์สหรัฐ ทำให้ไม่สามารถจ่ายได้สำหรับการดำเนินงานแบบ bootstrapped ของพวกเขา สิ่งนี้สร้างช่องว่างความไว้วางใจที่ผู้ใช้ต้องพึ่งพาการประเมินความปลอดภัยภายในของบริษัท
การทดลองยังเผยให้เห็นปัญหาความสามารถในการขยายขนาด โดยการประมวลผลตัวอย่างใช้เวลาสองเดือนเนื่องจากขนาดชุดที่ไม่เพียงพอ สภาพแวดล้อมการผลิตจะต้องมีปริมาณที่สม่ำเสมอเพื่อให้บรรลุเวลาดำเนินการสองถึงสามสัปดาห์ที่สัญญาไว้
คำสัญญาในอนาคตเทียบกับความเป็นจริงในปัจจุบัน
แม้ว่า Monadic DNA จะวางแผนที่ทะเยอทะยานสำหรับการเข้ารหัสระดับโมเลกุลและการจัดลำดับที่บ้านเพื่อแก้ไขข้อจำกัดปัจจุบัน แต่วิธีแก้ปัญหาเหล่านี้ยังคงอยู่ในระหว่างการพัฒนา บริษัทกำลังทำงานเกี่ยวกับการรวม fully homomorphic encryption (FHE) กับเทคโนโลยี MPC และสำรวจความร่วมมือสำหรับการปกป้องข้อมูลระดับโมเลกุล
การทดลองสาธิตได้สำเร็จว่าเทคโนโลยี MPC สามารถทำงานสำหรับการวิเคราะห์พันธุกรรมได้ แต่ข้อเสนอแนะจากชุมชนเผยให้เห็นว่ายังมีความท้าทายที่สำคัญเหลืออยู่ก่อนที่การวิเคราะห์ DNA ที่เป็นส่วนตัวอย่างแท้จริงจะกลายเป็นความจริง ผู้ใช้ที่สนใจความเป็นส่วนตัวของข้อมูลพันธุกรรมอาจต้องรอการนำไปใช้ที่เป็นผู้ใหญ่มากขึ้นซึ่งแก้ไขข้อกำหนดความไว้วางใจขั้นพื้นฐานในห่วงโซ่การประมวลผลข้อมูล
อ้างอิง: Using MPC for Anonymous and Private DNA Analysis
![]() |
---|
ความซับซ้อนของการใช้ MPC สำหรับการวิเคราะห์ DNA แบบส่วนตัวและความทะเยอทะยานในอนาคตของบริษัทถูกนำเสนอภายในบทความทางวิชาการนี้ |