Google ได้เปิดตัว Test-Time Diffusion Deep Researcher ( TTD-DR ) เฟรมเวิร์กวิจัย AI ใหม่ที่อ้างว่ามีประสิทธิภาพเหนือกว่าระบบ Deep Research ของ OpenAI อย่างไรก็ตาม การประกาศนี้ได้จุดประกายการถกเถียงอย่างมากในชุมชนเทคโนโลยีเกี่ยวกับว่าระบบนี้ใช้เทคนิค diffusion จริงหรือเพียงแค่ยืมคำศัพท์มาใช้เพื่อดึงดูดใจในการตลาด
![]() |
---|
เว็บเพจของ Google Research ที่รายละเอียดเกี่ยวกับเฟรมเวิร์ก Test-Time Diffusion Deep Researcher ( TTD-DR ) |
ชุมชนตั้งคำถามต่อการอ้าง Diffusion ของ Google
ผู้เชี่ยวชาญด้านเทคโนโลยีกำลังตั้งคำถามต่อการใช้คำว่า diffusion ของ Google ในการอธิบาย TTD-DR ระบบนี้ทำงานโดยการสร้างรายงานร่างเบื้องต้นแล้วปรับปรุงให้ดีขึ้นอย่างต่อเนื่องผ่านการวิจัยเพิ่มเติมและการดึงข้อมูล นักวิจารณ์โต้แย้งว่ากระบวนการนี้แทบไม่มีความคล้ายคลึงกับโมเดล diffusion จริงๆ ซึ่งโดยทั่วไปจะเริ่มต้นด้วยสัญญาณรบกวนแบบสุ่มและค่อยๆ ลดสัญญาณรบกวนผ่านการแปลงที่เรียนรู้มา
อย่างไรก็ตาม สิ่งนี้ดูเหมือนการใช้คำว่า diffusion อย่างผิดๆ จริงๆ เท่าที่ผมเข้าใจ ผมไม่คิดว่าสิ่งนี้กำลังย้อนกลับเอนโทรปีใดๆ ในพื้นที่แฝงใดๆ
ความขัดแย้งนี้เน้นย้ำถึงแนวโน้มที่กว้างขึ้นในการวิจัย AI ที่บางครั้งคำศัพท์ทางเทคนิคที่ยอมรับแล้วถูกขยายความหมายเพื่ออธิบายแนวคิดที่เกี่ยวข้องอย่างหลวมๆ ซึ่งอาจสร้างความสับสนในสาขานี้
องค์ประกอบของเฟรมเวิร์ก TTD-DR:
- ขั้นตอนที่ 1: การสร้างแผนการวิจัย
- ขั้นตอนที่ 2a: การสร้างคำถามสำหรับการค้นหา
- ขั้นตอนที่ 2b: การค้นหาคำตอบด้วยระบบแบบ RAG
- ขั้นตอนที่ 3: การสังเคราะห์รายงานขั้นสุดท้าย
- การปรับปรุง: อัลกอริทึมการพัฒนาตนเองแบบแยกส่วน
- การปรับแต่ง: การลดสัญญาณรบกวนในระดับรายงานด้วยการดึงข้อมูล
การอ้างประสิทธิภาพแสดงให้เห็นความหวังแม้จะมีปัญหาเรื่องคำศัพท์
หากไม่นับประเด็นการตั้งชื่อ การปรับปรุงประสิทธิภาพที่รายงานของ TTD-DR ถือว่าน่าสนใจ ระบบนี้ได้อัตราชนะ 74.5% เมื่อเทียบกับ Deep Research ของ OpenAI ในงานสร้างรายงานแบบยาว นอกจากนี้ยังแสดงการปรับปรุง 7.7% และ 1.7% ในชุดข้อมูลวิจัยสองชุดที่ต้องใช้ความสามารถในการค้นหาและการใช้เหตุผลอย่างกว้างขวาง
เฟรมเวิร์กใช้แนวทางสามขั้นตอน: การสร้างแผนวิจัย การค้นหาแบบวนซ้ำด้วย retrieval-augmented generation และการผลิตรายงานสุดท้าย สิ่งที่ทำให้แตกต่างคือวิธีการร่างก่อน ที่รายงานร่างเบื้องต้นจะชี้นำทิศทางการวิจัยที่ตามมาแทนที่จะปฏิบัติตามแผนที่กำหนดไว้ล่วงหน้า
การเปรียบเทียบประสิทธิภาพกับ OpenAI Deep Research:
- การสร้างรายงานแบบยาว: อัตราชนะ 74.5%
- ชุดข้อมูล HLE-Search: ปรับปรุงดีขึ้น +7.7%
- ชุดข้อมูล GAIA: ปรับปรุงดีขึ้น +1.7%
- โมเดลพื้นฐาน: Gemini 2.5-pro
![]() |
---|
ภาพประกอบแนวทางเป็นระบบในการแก้ไขคำถาม คล้ายคลึงกับกระบวนการสร้างรายงานแบบวนซ้ำของ TTD-DR |
ความกังวลเรื่องการเข้าถึงและอุปสรรคในการใช้งาน
แม้ว่าการวิจัยจะแสดงให้เห็นความหวัง แต่การเข้าถึงในทางปฏิบัติยังคงจำกัด ระบบนี้ปัจจุบันใช้ได้เฉพาะผ่านแพลตฟอร์ม AgentSpace ของ Google ซึ่งต้องมีการสมัครสมาชิก Enterprise Agentic ราคาสำหรับบริการนี้ยังไม่ได้เปิดเผย ซึ่งอาจจำกัดการนำไปใช้ในหมู่นักวิจัยรายบุคคลและองค์กรขนาดเล็ก
อย่างไรก็ตาม สมาชิกชุมชนบางคนเสนอว่าแนวทางนี้สามารถทำซ้ำได้อย่างอิสระ โดยสังเกตว่าแนวคิดพื้นฐานนั้นตรงไปตรงมาพอที่จะนำไปใช้งานได้โดยใช้เครื่องมือโอเพนซอร์สและโมเดลภาษาที่มีอยู่
เกณฑ์มาตรฐานการประเมิน:
- DeepConsult: รายงานแบบครอบคลุมในรูปแบบยาว
- Humanity's Last Exam (HLE-Search): คำถาม 200 ข้อที่สุ่มตัวอย่างมาซึ่งต้องใช้การค้นหาและการใช้เหตุผล
- GAIA: คำถามแบบหลายขั้นตอนที่ต้องใช้การค้นหาอย่างกว้างขวาง
ผลกระทบที่กว้างขึ้นต่อวิธีการวิจัย AI
แนวทาง TTD-DR สะท้อนความสนใจที่เพิ่มขึ้นในการทำให้ระบบ AI ทำงานเหมือนนักวิจัยมนุษย์มากขึ้น กระบวนการวนซ้ำของการร่าง วิจัย และปรับปรุงสะท้อนถึงวิธีที่คนเราเข้าหางานเขียนที่ซับซ้อนตามธรรมชาติ วิธีการที่ได้แรงบันดาลใจจากมนุษย์นี้อาจมีการประยุกต์ใช้นอกเหนือจากรายงานวิจัย และอาจปรับปรุงผู้ช่วยเขียนโค้ดและเครื่องมือ AI อื่นๆ ที่ได้ประโยชน์จากการปรับปรุงแบบวนซ้ำ
การถกเถียงรอบ TTD-DR ยังทำให้เกิดคำถามสำคัญเกี่ยวกับมาตรฐานคำศัพท์ในการวิจัย AI ที่พัฒนาอย่างรวดเร็ว ที่การสื่อสารที่ชัดเจนกลายเป็นสิ่งสำคัญเมื่อสาขานี้เติบโตให้ซับซ้อนและข้ามสาขามากขึ้น