Residential Proxies: เครือข่ายบอตสุดลับที่ซ่อนอยู่ในกระเป๋าคุณ

ทีมชุมชน BigGo
Residential Proxies: เครือข่ายบอตสุดลับที่ซ่อนอยู่ในกระเป๋าคุณ

ปัญหาบอตบนอินเทอร์เน็ตได้พัฒนาขึ้นไปไกลเกินกว่าแค่โปรแกรมเก็บข้อมูลแบบง่ายๆ ในปัจจุบัน บอตรุ่นใหม่ที่ก้าวร้าวได้เปลี่ยนมาใช้ที่อยู่ IP ตามบ้านเรือนจริงเพื่ออำพรางตัว ทำให้อุปกรณ์ของผู้ใช้ที่ไม่รู้ตัวกลายเป็นส่วนหนึ่งของการดำเนินการเก็บข้อมูลขนาดใหญ่โดยไม่ตั้งใจ เครือข่ายพร็อกซี่ที่ทันสมัยนี้เป็นหนึ่งในภัยคุกคามที่ท้าทายที่สุดสำหรับผู้ให้บริการเว็บไซต์ในยุคนี้

โทรศัพท์ของคุณกลายเป็นส่วนหนึ่งของกองทัพบอตได้อย่างไร

ข้อมูลที่น่าตกใจจากการอภิปรายล่าสุดเกี่ยวข้องกับวิธีการที่การดำเนินการเก็บข้อมูลเหล่านี้ได้มาซึ่งที่อยู่ IP ตามบ้านเรือน บริการหลายแห่ง รวมถึง Bright Data, IPRoyal และ Oxylabs ให้บริการ Residential Proxies ที่ส่งผ่านการรับส่งข้อมูลเครือข่ายไปยังอุปกรณ์ของผู้บริโภคจริง แทนที่จะเป็นศูนย์ข้อมูล บริษัทเหล่านี้ให้ชุดพัฒนาซอฟต์แวร์ (SDK) แก่นักพัฒนาแอปพลิเคชันมือถือ เพื่อนำไปรวมไว้ในแอปพลิเคชันฟรี

พวกเขาให้ SDK สำหรับนักพัฒนาแอปมือถือ แอปจะขอให้ผู้ใช้ยืนยันการใช้อุปกรณ์ของตนเพื่อรันพร็อกซี่ภายในแอป

เมื่อผู้ใช้ติดตั้งแอปเหล่านี้ พวกเขามักจะพบกับข้อกำหนดในการให้บริการที่เข้าใจยาก ซึ่งอนุญาตให้ใช้การเชื่อมต่ออินเทอร์เน็ตของพวกเขาเป็นโหนดทางออกสำหรับการรับส่งข้อมูลพร็อกซี่ ผลกระทบที่ตามมานั้นน่ากังวล — โทรศัพท์ของคุณอาจกำลังส่งคำขอสำหรับทุกอย่าง ตั้งแต่การเก็บข้อมูลแบบง่าย ไปจนถึงกิจกรรมที่อาจผิดกฎหมาย โดยที่คุณไม่เข้าใจอย่างถ่องแท้

บริการ Residential Proxy หลักที่ถูกกล่าวถึง:

  • Bright Data (เดิมชื่อ Luminati)
  • IPRoyal
  • Oxylabs
  • บริการอื่นๆ ที่เสนอ "รายได้แบบพาสซีฟ" จากการแชร์การเชื่อมต่ออินเทอร์เน็ตของคุณ

ความท้าทายด้านเทคนิคสำหรับผู้ปกป้องเว็บไซต์

วิธีการใช้ Residential Proxies นี้สร้างความท้าทายที่ไม่เคยมีมาก่อนสำหรับความปลอดภัยของเว็บไซต์ การบล็อกตาม IP แบบดั้งเดิมกลายเป็นวิธีที่ไร้ประสิทธิภาพ เพราะพร็อกซี่เหล่านี้ใช้ที่อยู่ IP แบบ Carrier-Grade NAT (CGNAT) ที่ถูกใช้ร่วมกันโดยผู้ใช้ที่ถูกกฎหมายหลายพันคน การบล็อก IP ที่มีการใช้งานในทางที่ผิดเพียงอันเดียว อาจทำให้ผู้เยี่ยมชมที่ถูกกฎหมายทั้งเมืองหรือทั้งภูมิภาคถูกบล็อกโดยไม่ได้ตั้งใจ

ขนาดของปัญหานั้นใหญ่มาก ผู้ให้บริการเว็บไซต์รายหนึ่งรายงานว่าบล็อกคำขอที่เป็นอันตรายเกือบ 2 ล้านครั้ง บนบล็อกหลายร้อยแห่งในเวลาเพียง 24 ชั่วโมง บอตเหล่านี้หมุนเวียนใช้ที่อยู่ IP หลายพันอัน ทำให้การตรวจจับตามรูปแบบการใช้งานทำได้ยากขึ้นเรื่อยๆ บางบริการ甚至เสนอเครื่องมือเช่น NobleTLS หรือ JA3Cloak เพื่อเลี่ยงการตรวจสอบลายนิ้วมือ JA3 ซึ่งเป็นวิธีการทั่วไปสำหรับการระบุไคลเอ็นต์ที่เป็นอันตราย

ยุทธศาสตร์การป้องกันเชิงสร้างสรรค์เริ่มปรากฏขึ้น

ผู้ให้บริการเว็บไซต์กำลังตอบโต้ด้วยเทคนิคใหม่ๆ บางรายใช้กลยุทธ์ กับดัก (honeypot) โดยวางจุดปลายทางปลอมในไฟล์ robots.txt ของพวกเขา ซึ่งมีเพียงบอตเท่านั้นที่จะเข้าถึงได้ เมื่อมีไคลเอ็นต์เข้าถึงจุดปลายทางเหล่านี้ พวกเขาจะถูกบล็อกโดยอัตโนมัติหรือถูกตอบโต้กลับ บางรายกำลังทดลองใช้การตรวจสอบความถูกต้องด้วย การพิสูจน์การทำงาน (proof-of-work) ซึ่งทำให้การเก็บข้อมูลมีต้นทุนด้านการคำนวณที่สูงสำหรับบอต

การแข่งขันด้านอาวุธนี้บังคับให้ผู้ประกอบการหลายรายต้องนำยุทธศาสตร์การป้องกันแบบหลายชั้นมาใช้ ซึ่งรวมถึงการจำกัดอัตราการขอข้อมูล (rate limiting) แบบเข้มข้น กฎของไฟร์วอลล์แอปพลิเคชันเว็บ อัลกอริธึมการตรวจจับบอตที่กำหนดเอง และการส่งข้อมูลที่ไม่เป็นประโยชน์จำนวนมากเพื่อให้บอตที่มาเก็บข้อมูลยุ่งอยู่ตลอดเวลา อย่างไรก็ตาม แต่ละวิธีแก้ปัญหาล้วนเพิ่มความซับซ้อนและจุดล้มเหลวที่อาจเกิดขึ้นสำหรับผู้ใช้ที่ถูกกฎหมาย

เทคนิคการป้องกันบอทที่พบบ่อย:

  • กฎของ Web Application Firewall (WAF)
  • การจำกัดอัตราตาม IP และพฤติกรรม
  • การตรวจจับลายนิ้วมือ JA3
  • จุดดักฝังใน robots.txt
  • การตรวจสอบความถูกต้องแบบ Proof-of-work
  • การส่งข้อมูลขยะหรือ zip bombs ให้กับไคลเอนต์ที่ใช้งานในทางที่ผิด

ผลกระทบในวงกว้างต่อสุขภาพของอินเทอร์เน็ต

ระบบนิเวศพร็อกซี่นี้แสดงถึงการเปลี่ยนแปลงพื้นฐานในวิธีการทำงานของการเก็บข้อมูล สิ่งที่เริ่มต้นจากสคริปต์อัตโนมัติแบบง่ายๆ ได้พัฒนากลายเป็นโครงสร้างพื้นฐานที่ทันสมัย ซึ่งใช้ประโยชน์จากอุปกรณ์ของผู้บริโภคเพื่อผลกำไรทางการค้า แนวปฏิบัตินี้ทำให้เกิดคำถามสำคัญเกี่ยวกับความยินยอม ความโปร่งใส และสุขภาพในระยะยาวของเว็บแบบเปิด

ตามที่ผู้แสดงความคิดเห็นรายหนึ่งระบุไว้ อินเทอร์เน็ตสาธารณะส่วนใหญ่เป็นบอต ซึ่งหลายตัวเป็นพลเมืองออนไลน์ที่ไม่ดี สภาพแวดล้อมเว็บที่เพิ่มความเกรี้ยวกราดขึ้น ทำให้ผู้ให้บริการอิสระสามารถรักษาการมีอยู่ของตนบนโลกออนไลน์ได้ยากกว่าที่เคย กระนั้น หลายคนยังคงต่อสู้ต่อไป ด้วยการตระหนักว่าพื้นที่ออนไลน์ที่แท้จริงสำหรับมนุษย์นั้นคุ้มค่าที่จะปกป้อง

การต่อสู้ระหว่างผู้ให้บริการเว็บไซต์และบอตเก็บข้อมูลที่ก้าวร้าวยังไม่แสดงสัญญาณว่าจะชะลอตัวลง เมื่อข้อมูลกลายเป็นสิ่งที่มีค่ามากขึ้นเรื่อยๆ สำหรับการฝึกฝน AI และวัตถุประสงค์ทางการค้าอื่นๆ แรงจูงใจสำหรับการเก็บข้อมูลขนาดใหญ่จะเพิ่มขึ้นเท่านั้น อนาคตของอินเทอร์เน็ตอาจขึ้นอยู่กับการหาความสมดุลระหว่างการเข้าถึงแบบเปิดและการดำเนินงานที่ยั่งยืน

อ้างอิง: Aggressive bots ruined my weekend