เอเจนต์วิจัย TTD-DR ของ Google จุดประกายการถ่ายเถียงเรื่องการใช้คำศัพท์ "Diffusion" อย่างผิดๆ

ทีมชุมชน BigGo
เอเจนต์วิจัย TTD-DR ของ Google จุดประกายการถ่ายเถียงเรื่องการใช้คำศัพท์ "Diffusion" อย่างผิดๆ

Google ได้เปิดตัว Test-Time Diffusion Deep Researcher ( TTD-DR ) เฟรมเวิร์กวิจัย AI ใหม่ที่อ้างว่ามีประสิทธิภาพเหนือกว่าระบบ Deep Research ของ OpenAI อย่างไรก็ตาม การประกาศนี้ได้จุดประกายการถกเถียงอย่างมากในชุมชนเทคโนโลยีเกี่ยวกับว่าระบบนี้ใช้เทคนิค diffusion จริงหรือเพียงแค่ยืมคำศัพท์มาใช้เพื่อดึงดูดใจในการตลาด

เว็บเพจของ Google Research ที่รายละเอียดเกี่ยวกับเฟรมเวิร์ก Test-Time Diffusion Deep Researcher ( TTD-DR )
เว็บเพจของ Google Research ที่รายละเอียดเกี่ยวกับเฟรมเวิร์ก Test-Time Diffusion Deep Researcher ( TTD-DR )

ชุมชนตั้งคำถามต่อการอ้าง Diffusion ของ Google

ผู้เชี่ยวชาญด้านเทคโนโลยีกำลังตั้งคำถามต่อการใช้คำว่า diffusion ของ Google ในการอธิบาย TTD-DR ระบบนี้ทำงานโดยการสร้างรายงานร่างเบื้องต้นแล้วปรับปรุงให้ดีขึ้นอย่างต่อเนื่องผ่านการวิจัยเพิ่มเติมและการดึงข้อมูล นักวิจารณ์โต้แย้งว่ากระบวนการนี้แทบไม่มีความคล้ายคลึงกับโมเดล diffusion จริงๆ ซึ่งโดยทั่วไปจะเริ่มต้นด้วยสัญญาณรบกวนแบบสุ่มและค่อยๆ ลดสัญญาณรบกวนผ่านการแปลงที่เรียนรู้มา

อย่างไรก็ตาม สิ่งนี้ดูเหมือนการใช้คำว่า diffusion อย่างผิดๆ จริงๆ เท่าที่ผมเข้าใจ ผมไม่คิดว่าสิ่งนี้กำลังย้อนกลับเอนโทรปีใดๆ ในพื้นที่แฝงใดๆ

ความขัดแย้งนี้เน้นย้ำถึงแนวโน้มที่กว้างขึ้นในการวิจัย AI ที่บางครั้งคำศัพท์ทางเทคนิคที่ยอมรับแล้วถูกขยายความหมายเพื่ออธิบายแนวคิดที่เกี่ยวข้องอย่างหลวมๆ ซึ่งอาจสร้างความสับสนในสาขานี้

องค์ประกอบของเฟรมเวิร์ก TTD-DR:

  • ขั้นตอนที่ 1: การสร้างแผนการวิจัย
  • ขั้นตอนที่ 2a: การสร้างคำถามสำหรับการค้นหา
  • ขั้นตอนที่ 2b: การค้นหาคำตอบด้วยระบบแบบ RAG
  • ขั้นตอนที่ 3: การสังเคราะห์รายงานขั้นสุดท้าย
  • การปรับปรุง: อัลกอริทึมการพัฒนาตนเองแบบแยกส่วน
  • การปรับแต่ง: การลดสัญญาณรบกวนในระดับรายงานด้วยการดึงข้อมูล

การอ้างประสิทธิภาพแสดงให้เห็นความหวังแม้จะมีปัญหาเรื่องคำศัพท์

หากไม่นับประเด็นการตั้งชื่อ การปรับปรุงประสิทธิภาพที่รายงานของ TTD-DR ถือว่าน่าสนใจ ระบบนี้ได้อัตราชนะ 74.5% เมื่อเทียบกับ Deep Research ของ OpenAI ในงานสร้างรายงานแบบยาว นอกจากนี้ยังแสดงการปรับปรุง 7.7% และ 1.7% ในชุดข้อมูลวิจัยสองชุดที่ต้องใช้ความสามารถในการค้นหาและการใช้เหตุผลอย่างกว้างขวาง

เฟรมเวิร์กใช้แนวทางสามขั้นตอน: การสร้างแผนวิจัย การค้นหาแบบวนซ้ำด้วย retrieval-augmented generation และการผลิตรายงานสุดท้าย สิ่งที่ทำให้แตกต่างคือวิธีการร่างก่อน ที่รายงานร่างเบื้องต้นจะชี้นำทิศทางการวิจัยที่ตามมาแทนที่จะปฏิบัติตามแผนที่กำหนดไว้ล่วงหน้า

การเปรียบเทียบประสิทธิภาพกับ OpenAI Deep Research:

  • การสร้างรายงานแบบยาว: อัตราชนะ 74.5%
  • ชุดข้อมูล HLE-Search: ปรับปรุงดีขึ้น +7.7%
  • ชุดข้อมูล GAIA: ปรับปรุงดีขึ้น +1.7%
  • โมเดลพื้นฐาน: Gemini 2.5-pro
ภาพประกอบแนวทางเป็นระบบในการแก้ไขคำถาม คล้ายคลึงกับกระบวนการสร้างรายงานแบบวนซ้ำของ TTD-DR
ภาพประกอบแนวทางเป็นระบบในการแก้ไขคำถาม คล้ายคลึงกับกระบวนการสร้างรายงานแบบวนซ้ำของ TTD-DR

ความกังวลเรื่องการเข้าถึงและอุปสรรคในการใช้งาน

แม้ว่าการวิจัยจะแสดงให้เห็นความหวัง แต่การเข้าถึงในทางปฏิบัติยังคงจำกัด ระบบนี้ปัจจุบันใช้ได้เฉพาะผ่านแพลตฟอร์ม AgentSpace ของ Google ซึ่งต้องมีการสมัครสมาชิก Enterprise Agentic ราคาสำหรับบริการนี้ยังไม่ได้เปิดเผย ซึ่งอาจจำกัดการนำไปใช้ในหมู่นักวิจัยรายบุคคลและองค์กรขนาดเล็ก

อย่างไรก็ตาม สมาชิกชุมชนบางคนเสนอว่าแนวทางนี้สามารถทำซ้ำได้อย่างอิสระ โดยสังเกตว่าแนวคิดพื้นฐานนั้นตรงไปตรงมาพอที่จะนำไปใช้งานได้โดยใช้เครื่องมือโอเพนซอร์สและโมเดลภาษาที่มีอยู่

เกณฑ์มาตรฐานการประเมิน:

  • DeepConsult: รายงานแบบครอบคลุมในรูปแบบยาว
  • Humanity's Last Exam (HLE-Search): คำถาม 200 ข้อที่สุ่มตัวอย่างมาซึ่งต้องใช้การค้นหาและการใช้เหตุผล
  • GAIA: คำถามแบบหลายขั้นตอนที่ต้องใช้การค้นหาอย่างกว้างขวาง

ผลกระทบที่กว้างขึ้นต่อวิธีการวิจัย AI

แนวทาง TTD-DR สะท้อนความสนใจที่เพิ่มขึ้นในการทำให้ระบบ AI ทำงานเหมือนนักวิจัยมนุษย์มากขึ้น กระบวนการวนซ้ำของการร่าง วิจัย และปรับปรุงสะท้อนถึงวิธีที่คนเราเข้าหางานเขียนที่ซับซ้อนตามธรรมชาติ วิธีการที่ได้แรงบันดาลใจจากมนุษย์นี้อาจมีการประยุกต์ใช้นอกเหนือจากรายงานวิจัย และอาจปรับปรุงผู้ช่วยเขียนโค้ดและเครื่องมือ AI อื่นๆ ที่ได้ประโยชน์จากการปรับปรุงแบบวนซ้ำ

การถกเถียงรอบ TTD-DR ยังทำให้เกิดคำถามสำคัญเกี่ยวกับมาตรฐานคำศัพท์ในการวิจัย AI ที่พัฒนาอย่างรวดเร็ว ที่การสื่อสารที่ชัดเจนกลายเป็นสิ่งสำคัญเมื่อสาขานี้เติบโตให้ซับซ้อนและข้ามสาขามากขึ้น

อ้างอิง: Deep researcher with test-time diffusion