Google ยกเลิกพารามิเตอร์แสดงผลค้นหา 100 รายการ ก่อให้เกิดการถกเถียงเรื่องการเข้าถึงข้อมูลฝึก AI

ทีมชุมชน BigGo
Google ยกเลิกพารามิเตอร์แสดงผลค้นหา 100 รายการ ก่อให้เกิดการถกเถียงเรื่องการเข้าถึงข้อมูลฝึก AI

Google ได้ยกเลิกฟีเจอร์การค้นหาที่ให้ผู้ใช้ดูผลลัพธ์ 100 รายการในหน้าเดียวอย่างเงียบๆ โดยจำกัดการแสดงผลเหลือเพียง 10 รายการเท่านั้น แม้ว่าอาจดูเป็นการเปลี่ยนแปลงส่วนติดต่อผู้ใช้เล็กน้อย แต่ก็ได้จุดประกายการถกเถียงอย่างมีนัยสำคัญในชุมชนเทคโนโลยีเกี่ยวกับผลกระทบต่อระบบ AI และการมองเห็นของเว็บไซต์

การยกเลิกพารามิเตอร์ num=100 ได้ทำให้เกิดคำถามเกี่ยวกับวิธีที่บริษัท AI รวบรวมข้อมูลฝึกและว่าพวกเขาควรพึ่งพาผลลัพธ์การค้นหาของ Google ตั้งแต่แรกหรือไม่ สมาชิกชุมชนจำนวนมากมองว่านี่เป็นการเคลื่อนไหวที่คาดหวังไว้แล้วมากกว่าการพัฒนาที่น่าแปลกใจ

ข้อจำกัดของผลการค้นหา:

  • ข้อจำกัดเดิม: 100 ผลลัพธ์ต่อหน้าผ่านพารามิเตอร์ num=100
  • ข้อจำกัดใหม่: 10 ผลลัพธ์ต่อหน้า (ข้อจำกัดสูงสุด)
  • ผลกระทบ: 86% ของเว็บไซต์พบการลดลงของ impressions ตามรายงานของ Search Engine Land

โซลูชันทางเทคนิคมีอยู่แล้ว

ชุมชนเทคโนโลยีได้ชี้ให้เห็นอย่างรวดเร็วว่ามีโซลูชันทางเลือกที่พร้อมใช้งานอยู่แล้ว Common Crawl ซึ่งเป็นที่เก็บข้อมูลเว็บแบบเปิด ให้ทางเลือกหนึ่งสำหรับบริษัทที่ต้องการเนื้อหาเว็บที่ครอบคลุม นักพัฒนาหลายคนได้ชี้ให้เห็นว่าการสร้างเว็บครอลเลอร์แบบกำหนดเองนั้นไม่ซับซ้อนเป็นพิเศษ โดยแนะนำว่าบริษัท AI น่าจะพัฒนาระบบค้นหาของตนเองภายในไม่กี่เดือน

อย่างไรก็ตาม การถกเถียงได้เปิดเผยว่าการครอลและการจัดทำดัชนีมีความท้าทายที่แตกต่างกัน ในขณะที่การครอลหน้าเว็บนั้นตรงไปตรงมา การสร้างระบบการจัดอันดับที่มีประสิทธิภาพยังคงเป็นจุดแข็งหลักของ Google สมาชิกชุมชนบางคนตั้งคำถามว่าการจัดอันดับนี้มีความสำคัญต่อระบบ AI ที่มีหน้าต่างบริบทขนาดใหญ่เท่ากับผู้ใช้มนุษย์ที่เรียกดูผลลัพธ์การค้นหาหรือไม่

การตั้งคำถามต่อข้อกล่าวอ้างเดิม

การถกเถียงในชุมชนได้ท้าทายสมมติฐานหลายประการในการรายงานข่าวเดิม ผู้ใช้หลายคนได้ชี้ให้เห็นว่าบริษัท AI รายใหญ่อย่าง OpenAI ใช้ Bing สำหรับฟังก์ชันการค้นหา ในขณะที่ Claude รายงานว่าใช้ Brave Search สิ่งนี้แนะนำว่าผลกระทบต่อไปป์ไลน์การฝึก AI อาจรุนแรงน้อยกว่าที่อ้างไว้ในตอนแรก

ผมคิดว่า OpenAI ใช้ Bing อยู่ Gemini เห็นได้ชัดว่าจะใช้ Google แต่สำหรับพวกเขาแล้วข้อจำกัดนี้ไม่มีผล Claude บอกว่าใช้ Brave

ชุมชนยังสังเกตว่าผู้จำหน่าย AI รายใหญ่โดยทั่วไปดำเนินการระบบครอลของตนเองแทนที่จะพึ่งพาส่วนติดต่อการค้นหาของ Google ทำให้การยกเลิกพารามิเตอร์มีนัยสำคัญน้อยลงสำหรับผู้เล่นที่มีชื่อเสียง

แหล่งข้อมูลทางเลือกสำหรับบริษัท AI:

  • Common Crawl: ที่เก็บข้อมูลการรวบรวมเว็บแบบเปิด
  • Bing Search API: ใช้โดย OpenAI
  • Brave Search: ใช้โดย Claude/Anthropic
  • ตัวรวบรวมข้อมูลแบบกำหนดเอง: OAI-SearchBot, GPTBot สำหรับการฝึกอบรม OpenAI

โอกาสทางการตลาดเกิดขึ้น

การเปลี่ยนแปลงนี้ได้สร้างโอกาสทางธุรกิจที่มีศักยภาพสำหรับผู้เชี่ยวชาญเทคโนโลยีการค้นหา อดีตวิศวกรการค้นหาของ Google และผู้เชี่ยวชาญที่คล้ายกันสามารถใช้ประโยชน์จากความต้องการที่เพิ่มขึ้นสำหรับโครงสร้างพื้นฐานการค้นหาที่เป็นอิสระ เนื่องจากบริษัท AI ต้องการทางเลือกอื่นจากระบบนิเวศของ Google

การถกเถียงได้เน้นย้ำว่าแม้อัลกอริทึมการจัดอันดับของ Google ใช้เวลาหลายปีในการพัฒนา แต่เทคโนโลยีพื้นฐานสำหรับการครอลและการจัดทำดัชนีนั้นเข้าใจกันดีแล้ว สิ่งนี้แนะนำว่าบริษัทที่มีความมุ่งมั่นและมีทรัพยากรเพียงพอสามารถสร้างทางเลือกที่แข่งขันได้ แม้ว่าการจำลองความสามารถด้านอำนาจและการรู้จำรูปแบบของ Google จะต้องใช้การลงทุนอย่างมีนัยสำคัญ

การตอบสนองของชุมชนบ่งชี้ว่าแม้การเคลื่อนไหวของ Google จะส่งผลกระทบต่อระบบบางอย่าง แต่อุตสาหกรรมเทคโนโลยีกำลังปรับตัวด้วยแนวทางและโซลูชันทางเลือกอยู่แล้ว

อ้างอิง: Google just cut off 90% of the internet from AI - no one's talking about it