การเติบโตของ generative AI ได้สร้างปัญหาที่ไม่คาดคิดซึ่งคุกคามรากฐานของวิธีการเรียนรู้และพัฒนาของระบบเหล่านี้ เมื่อผู้คนใช้เครื่องมือ AI มากขึ้นในการสร้างเนื้อหาสำหรับเว็บไซต์ วงจรป้อนกลับที่อันตรายกำลังปรากฏขึ้นซึ่งอาจทำลายเทคโนโลยีที่ขับเคลื่อนระบบ AI สมัยใหม่อย่างมีนัยสำคัญ
เหตุการณ์สำคัญตามลำดับเวลา:
- 1989: Tim Berners-Lee ประดิษฐ์ World Wide Web ที่ CERN
- 1993: เว็บเบราว์เซอร์ Mosaic เปิดตัว
- 1995: อินเทอร์เน็ตเริ่มใช้งานเชิงพาณิชย์
- พฤศจิกายน 2022: ChatGPT เปิดตัว เริ่มต้นการปฏิวัติ GenAI
- กรกฎาคม 2024: Nature เผยแพร่การศึกษาเกี่ยวกับการล่มสลายของโมเดล AI จากการฝึกแบบวนซ้ำ
โมเดลธุรกิจของเว็บถูกคุกคาม
ระบบนิเวศเว็บแบบดั้งเดิมอาศัยการแลกเปลี่ยนอย่างง่าย ผู้ใช้เข้าชมเว็บไซต์เพื่อหาข้อมูล และผู้โฆษณาจ่ายเงินเพื่อเข้าถึงผู้ใช้เหล่านั้น เสิร์ชเอนจิ้นของ Google ได้เจริญรุ่งเรืองด้วยโมเดลนี้มานานหลายทศวรรษ โดยนำผู้คนไปยังหน้าเว็บพร้อมทั้งสร้างรายได้จากโฆษณา อย่างไรก็ตาม แชทบอท AI กำลังเปลี่ยนแปลงพลวัตนี้โดยให้คำตอบโดยตรงต่อคำถามของผู้ใช้ ทำให้ไม่จำเป็นต้องเข้าชมเว็บไซต์เลย
การเปลี่ยนแปลงนี้คุกคามมากกว่าเพียงรายได้จากโฆษณา เมื่อผู้คนหยุดเข้าชมเว็บไซต์ ผู้สร้างเนื้อหาจะสูญเสียแรงจูงใจในการเผยแพร่เนื้อหาใหม่ การอภิปรายในชุมชนเผยให้เห็นความกังวลสำคัญเกี่ยวกับวงจรนี้ หากเว็บมีคุณค่าน้อยลงสำหรับทั้งผู้ใช้และผู้สร้างเนื้อหา ระบบนิเวศข้อมูลทั้งหมดอาจพังทลายลง
ภัยคุกคามต่อระบบนิเวศเว็บ:
- โมเดลรายได้: การค้นหาที่อาศัยรายได้จากโฆษณาจะมีความเป็นไปได้น้อยลงเมื่อผู้ใช้งานข้ามผ่านเว็บไซต์ต่างๆ
- การสร้างเนื้อหา: แรงจูงใจในการสร้างเนื้อหาต้นฉบับของผู้เผยแพร่ลดลง
- ข้อมูลสำหรับการฝึกอบรม: แหล่งข้อมูลที่มนุษย์สร้างขึ้นและมีคุณภาพสูงสำหรับการฝึกอบรม AI มีจำนวนลดลง
- คุณภาพข้อมูล: ความเสี่ยงที่เพิ่มขึ้นจากข้อมูลเท็จที่ AI สร้างขึ้นและ "ภาพหลอน"
Model Collapse: เมื่อ AI ฝึกจาก AI
ปัญหาทางเทคนิคที่ร้ายแรงกว่ากำลังปรากฏขึ้นเมื่อเนื้อหาที่สร้างโดย AI ท่วมท้นอินเทอร์เน็ต งานวิจัยที่เผยแพร่ใน Nature ในเดือนกรกฎาคม 2024 เผยให้เห็นว่าเมื่อ large language models ฝึกกับเนื้อหาที่สร้างโดยระบบ AI อื่น พวกมันจะประสบกับ model collapse ซึ่งเป็นการเสื่อมสภาพที่ AI สูญเสียความสามารถในการเข้าใจความหลากหลายของการแสดงออกและความรู้ของมนุษย์
ลองจินตนาการว่า AI บอกคุณว่าปลอดภัยและเหมาะสมที่จะใช้วิธี water bath ในการกระป๋องเนื้อสัตว์เพื่อการเก็บรักษาอาหาร และสิ่งที่นั่นหมายความว่าอย่างไรเมื่อคุณกินเนื้อกระป๋องตามคำแนะนำเหล่านั้น
ชุมชนได้ระบุว่านี่เป็นปัญหาความปลอดภัยที่สำคัญ เมื่อข้อความที่สร้างโดย AI ผลิตได้ง่ายกว่าการเขียนของมนุษย์ เว็บไซต์จึงเต็มไปด้วยเนื้อหาสังเคราะห์มากขึ้น เมื่อระบบ AI ในอนาคตฝึกกับข้อมูลเทียมนี้ พวกมันจะสูญเสียการติดต่อกับความรู้ของมนุษย์ที่แท้จริงและอาจให้ข้อมูลที่ผิดที่อันตราย
ผลการวิจัยเรื่อง Model Collapse:
- ชื่อการศึกษา: "AI Models Collapse when Trained on Recursively Generated Data"
- ข้อค้นพบสำคัญ: "การใช้เนื้อหาที่สร้างโดยโมเดลอย่างไม่เลือกสรรในการฝึกอบรมทำให้เกิดข้อบกพร่องที่ไม่สามารถแก้ไขได้ในโมเดลที่ได้"
- ผลกระทบ: ระบบ AI สูญเสียความสามารถในการแสดงเนื้อหาต้นฉบับของมนุษย์ได้อย่างครบถ้วน
- แนวทางแก้ไขที่เป็นไปได้: เพิ่มเนื้อหา AI เข้าไปในเนื้อหาของมนุษย์แทนการแทนที่ทั้งหมด
![]() |
---|
เข็มทิศดิจิทัลเป็นสัญลักษณ์ของความจำเป็นในการนำทางที่แม่นยำในภูมิทัศน์ที่ซับซ้อนของเนื้อหาที่สร้างโดย AI |
ความตายของคุณภาพข้อมูล
หลายคนในชุมชนเทคโนโลยีโต้แย้งว่าคุณภาพของเว็บได้ลดลงอย่างมีนัยสำคัญแล้วเนื่องจากกลยุทธ์การปรับแต่งเสิร์ชเอนจิ้นและเนื้อหาที่ขับเคลื่อนด้วยโฆษณา AI อาจเป็นเพียงการเร่งปัญหาที่มีอยู่แล้วมากกว่าการสร้างปัญหาใหม่ ความท้าทายคือระบบ AI ต้องการเนื้อหาที่สร้างโดยมนุษย์ที่มีคุณภาพสูงและหลากหลายเพื่อทำงานได้อย่างถูกต้อง แต่ในขณะเดียวกันพวกมันกำลังลดแรงจูงใจในการสร้างเนื้อหาดังกล่าว
ผู้เชี่ยวชาญบางคนแนะนำว่าบริษัท AI จะต้องจ่ายเงินให้ผู้สร้างเนื้อหาสำหรับข้อมูลฝึกอบรมในที่สุด คล้ายกับวิธีที่บริการสตรีมมิ่งจ่ายเงินสำหรับเนื้อหาเพลงและวิดีโอ อย่างไรก็ตาม โมเดลฟรีปัจจุบันของการขูดข้อมูลเว็บทำให้การเปลี่ยนผ่านนี้ท้าทายทางเศรษฐกิจ
การตรวจสอบกลายเป็นสิ่งสำคัญ
เมื่อเนื้อหาที่สร้างโดย AI ไม่สามารถแยกแยะจากการเขียนของมนุษย์ได้ ความสามารถในการตรวจสอบแหล่งข้อมูลจึงสำคัญมากกว่าที่เคย ชุมชนเน้นย้ำว่าผู้ใช้ต้องการการเข้าถึงแหล่งข้อมูลต้นฉบับเพื่อตรวจสอบข้อเท็จจริงของการตอบสนองของ AI แต่หลายคนข้ามขั้นตอนการตรวจสอบนี้เนื่องจากความสะดวก
ความขัดแย้งคือในขณะที่ AI สัญญาว่าจะทำให้ข้อมูลเข้าถึงได้มากขึ้น มันอาจทำให้ข้อมูลที่เชื่อถือได้หายากขึ้น ห้องสมุดและแหล่งข้อมูลที่เชื่อถือได้ยังคงสำคัญ แต่พวกมันไม่สามารถเทียบได้กับความสะดวกและความพร้อมใช้งานของระบบ AI แม้ว่าระบบเหล่านั้นจะให้ข้อมูลที่ไม่ถูกต้องก็ตาม
อนาคตของเว็บอาจขึ้นอยู่กับการหาโมเดลเศรษฐกิจใหม่ที่ให้รางวัลการสร้างเนื้อหาคุณภาพในขณะที่รักษาการเข้าถึงได้ที่ทำให้อินเทอร์เน็ตปฏิวัติ หากไม่แก้ปัญหานี้ เราเสี่ยงต่อการสร้างระบบนิเวศข้อมูลที่ระบบ AI มีความน่าเชื่อถือน้อยลงเมื่อเวลาผ่านไป ซึ่งอาจนำไปสู่ข้อมูลที่ผิดอย่างแพร่หลายและการพังทลายของระบบความรู้ดิจิทัล
อ้างอิง: Will AI Destroy the World Wide Web?
![]() |
---|
เครือข่ายบ้านอัจฉริยะแสดงถึงการเชื่อมโยงของแหล่งข้อมูลในการแสวงหาข้อมูลที่เชื่อถือได้ในโลกที่ AI ครอบงำ |