ส่วนขยายเบราว์เซอร์ของ Claude เปิดตัวพร้อมอัตราการโจมตีสำเร็จ 11% แม้จะมีมาตรการรักษาความปลอดภัย

ทีมชุมชน BigGo
ส่วนขยายเบราว์เซอร์ของ Claude เปิดตัวพร้อมอัตราการโจมตีสำเร็จ 11% แม้จะมีมาตรการรักษาความปลอดภัย

Anthropic ได้เปิดตัวโครงการนำร่องแบบจำกัดของ Claude for Chrome ซึ่งเป็นส่วนขยายเบราว์เซอร์ที่ช่วยให้ผู้ช่วย AI สามารถดำเนินการแทนผู้ใช้ได้ อย่างไรก็ตาม การเปิดตัวครั้งนี้มาพร้อมกับความกังวลด้านความปลอดภัยที่สำคัญซึ่งได้จุดประกายการถกเถียงอย่างเข้มข้นในชุมชนเทคโนโลยี

ส่วนขยายนี้ซึ่งปัจจุบันมีให้บริการเพียง 1,000 ผู้ใช้ ถือเป็นก้าวสำคัญสู่ AI agents ที่สามารถโต้ตอบกับหน้าเว็บได้โดยตรง Claude สามารถคลิกปุ่ม กรอกแบบฟอร์ม จัดการปฏิทิน และจัดการงานประจำเช่นรายงานค่าใช้จ่ายได้ แต่ความสะดวกสบายนี้มาพร้อมกับราคาที่แพงในแง่ของช่องโหว่ด้านความปลอดภัย

ขอบเขตการทดสอบ:

  • ประเมินกรณีทดสอบ 135 กรณี
  • ทดสอบสถานการณ์การโจมตี 10 รูปแบบที่แตกต่างกัน
  • ผู้ใช้แผน Max จำนวน 1,000 คนในโครงการนำร่องเริ่มต้น
  • ประเภทการโจมตีเฉพาะเบราว์เซอร์ 4 ประเภทในชุดความท้าทาย
แนะนำ Claude สำหรับ Chrome : ส่วนขยายเบราว์เซอร์ AI ใหม่ที่ออกแบบมาเพื่อช่วยเหลือผู้ใช้ในกิจกรรมออนไลน์
แนะนำ Claude สำหรับ Chrome : ส่วนขยายเบราว์เซอร์ AI ใหม่ที่ออกแบบมาเพื่อช่วยเหลือผู้ใช้ในกิจกรรมออนไลน์

การโจมตีแบบ Prompt Injection ยังคงเป็นภัยคุกคามหลัก

แม้จะมีการใช้มาตรการรักษาความปลอดภัยหลายชั้น การทดสอบของ Anthropic เองเผยให้เห็นว่าระบบยังคงมีอัตราการโจมตีสำเร็จ 11.2% ต่อการโจมตีแบบ prompt injection การโจมตีเหล่านี้เกิดขึ้นเมื่อผู้ไม่หวังดีซ่อนคำสั่งในเว็บไซต์ อีเมล หรือเอกสารที่หลอกให้ AI ทำการกระทำที่เป็นอันตรายโดยที่ผู้ใช้ไม่รู้ตัว

บริษัทได้ทำการทดสอบอย่างครอบคลุมด้วยกรณีทดสอบ 135 กรณีใน 10 สถานการณ์การโจมตีที่แตกต่างกัน ก่อนที่จะใช้มาตรการรักษาความปลอดภัย อัตราการโจมตีสำเร็จอยู่ที่ 23.6% ซึ่งถือว่าสูงมาก แม้ว่าการปรับปรุงจะเห็นได้ชัด แต่อัตราความล้มเหลว 11% หมายความว่าประมาณหนึ่งในเก้าของการโจมตีที่มีเป้าหมายยังคงสามารถสำเร็จได้

ตัวอย่างหนึ่งที่ Anthropic แบ่งปันเกี่ยวข้องกับอีเมลที่เป็นอันตรายซึ่งอ้างว่าด้วยเหตุผลด้านความปลอดภัย อีเมลจำเป็นต้องถูกลบ AI ได้ทำตามคำสั่งที่ซ่อนอยู่เหล่านี้และลบอีเมลของผู้ใช้โดยไม่ขอการยืนยัน แม้ว่าการป้องกันปัจจุบันของพวกเขาสามารถจดจำความพยายามฟิชชิ่งที่ชัดเจนเช่นนี้ได้แล้ว แต่การโจมตีที่ซับซ้อนมากขึ้นยังคงเป็นข้อกังวล

อัตราความสำเร็จของการโจมตี:

  • ก่อนการใช้มาตรการป้องกัน: 23.6%
  • หลังการใช้มาตรการป้องกัน: 11.2%
  • การโจมตีเฉพาะเบราว์เซอร์ (ชุดทดสอบความท้าทาย): ลดลงจาก 33.7% เหลือ 0%

ชุมชนแสดงความกังวลด้านความเป็นส่วนตัวและความปลอดภัยอย่างจริงจัง

ชุมชนเทคโนโลยีได้ตอบสนองด้วยความสงสัยอย่างมากเกี่ยวกับผลกระทบด้านความปลอดภัย นักพัฒนาและผู้เชี่ยวชาญด้านความปลอดภัยหลายคนกำลังตั้งคำถามว่าผลประโยชน์ที่ได้รับคุ้มค่ากับความเสี่ยงหรือไม่ โดยเฉพาะอย่างยิ่งเมื่อผู้ใช้จะต้องให้สิทธิ์การเข้าถึงกิจกรรมการท่องเว็บและข้อมูลส่วนบุคคลของตนแก่ระบบ AI อย่างกว้างขวาง

มันจะปลอดภัยกว่าที่จะทิ้งบัตรเครดิตของคุณไว้พร้อมกับ PIN ที่แกะสลักไว้มากกว่าการใช้เครื่องมือนี้

ความกังวลขยายไปไกลกว่าการโจมตีแบบ prompt injection เท่านั้น ผู้ใช้กังวลเกี่ยวกับผลกระทบด้านความเป็นส่วนตัว เนื่องจากส่วนขยายจะสามารถเข้าถึงประวัติการท่องเว็บและเนื้อหาในทุกเว็บไซต์ นอกจากนี้ยังมีความกลัวเกี่ยวกับศักยภาพของการโจมตีที่ซับซ้อนมากขึ้นที่ยังไม่ได้ถูกค้นพบ

การแจ้งเตือนเหตุการณ์ด้านความปลอดภัย: ผู้ใช้ได้รับการเรียกร้องให้ดำเนินการทันทีเพื่อปกป้องข้อมูลอีเมลของตน ซึ่งเน้นย้ำถึงความกังวลด้านความเป็นส่วนตัว
การแจ้งเตือนเหตุการณ์ด้านความปลอดภัย: ผู้ใช้ได้รับการเรียกร้องให้ดำเนินการทันทีเพื่อปกป้องข้อมูลอีเมลของตน ซึ่งเน้นย้ำถึงความกังวลด้านความเป็นส่วนตัว

ข้อจำกัดทางเทคนิคขัดขวางประสิทธิภาพในโลกแห่งความจริง

นอกเหนือจากปัญหาด้านความปลอดภัยแล้ว นักพัฒนาที่ได้ทดลองใช้เครื่องมือระบบอัตโนมัติของเบราว์เซอร์ที่คล้ายกันรายงานข้อจำกัดทางเทคนิคที่สำคัญ หลายคนสังเกตว่าโมเดล AI สูญเสียบริบทอย่างรวดเร็วเมื่อทำงานที่ซับซ้อนหลายขั้นตอนในเบราว์เซอร์ ความหนาแน่นของข้อมูลภาพและบริบทของหน้าเว็บดูเหมือนจะเป็นความท้าทายสำหรับโมเดลภาษาปัจจุบันในการประมวลผลอย่างมีประสิทธิภาพ

สมาชิกชุมชนหลายคนแบ่งปันประสบการณ์ที่ AI browser agents จะทำงานได้เพียงไม่กี่รอบก่อนที่จะสับสนหรือประกาศว่างานเสร็จสิ้นก่อนเวลาอันควร สิ่งนี้ชี้ให้เห็นว่าแม้เทคโนโลยีจะแสดงให้เห็นถึงความหวัง แต่อาจยังไม่พร้อมสำหรับการใช้งานในโลกแห่งความจริงอย่างเชื่อถือได้

คุณสมบัติด้านความปลอดภัยในปัจจุบัน:

  • การอนุญาตระดับเว็บไซต์ (ผู้ใช้สามารถให้สิทธิ์หรือยกเลิกการเข้าถึงได้)
  • การยืนยันการดำเนินการสำหรับการปฏิบัติการที่มีความเสี่ยงสูง
  • การบล็อกหมวดหมู่เว็บไซต์ที่มีความเสี่ยงสูง (การเงิน เนื้อหาสำหรับผู้ใหญ่ เนื้อหาละเมิดลิขสิทธิ์)
  • ตัวจำแนกขั้นสูงเพื่อตรวจจับรูปแบบคำสั่งที่น่าสงสัย
  • ปรับปรุงระบบพรอมต์สำหรับการจัดการข้อมูลที่มีความละเอียดอ่อน

บทสรุป

แนวทางที่ระมัดระวังของ Anthropic ด้วยโครงการนำร่องที่จำกัดผู้ใช้ 1,000 คนแสดงให้เห็นถึงความตระหนักถึงความเสี่ยงที่เกี่ยวข้อง อย่างไรก็ตาม อัตราการโจมตีสำเร็จ 11% และความกังวลด้านความปลอดภัยในวงกว้างทำให้เกิดคำถามว่า AI agents ที่ควบคุมเบราว์เซอร์พร้อมสำหรับการใช้งานหลักหรือไม่ บริษัทวางแผนที่จะขยายการเข้าถึงอย่างค่อยเป็นค่อยไปในขณะที่พวกเขาพัฒนามาตรการรักษาความปลอดภัยที่แข็งแกร่งขึ้น แต่ความท้าทายพื้นฐานของ prompt injection และความน่าเชื่อถือของ AI ในสภาพแวดล้อมเว็บที่ซับซ้อนยังคงเป็นอุปสรรคสำคัญที่ต้องเอาชนะ

Prompt injection: ประเภทของการโจมตีทางไซเบอร์ที่คำสั่งที่เป็นอันตรายถูกซ่อนไว้ในเนื้อหาเพื่อจัดการระบบ AI ให้ทำการกระทำที่ไม่ได้ตั้งใจ

อ้างอิง: Piloting Claude for Chrome