Alibaba เปิดตัว AI Agent โอเพนซอร์ส เชี่ยวชาญการวิจัยกฎหมายและเหตุผลเชิงซ้อน

ทีมชุมชน BigGo
Alibaba เปิดตัว AI Agent โอเพนซอร์ส เชี่ยวชาญการวิจัยกฎหมายและเหตุผลเชิงซ้อน

ในโลกของปัญญาประดิษฐ์ที่พัฒนาอย่างรวดเร็ว การสนทนาได้เปลี่ยนจากแชทบอทธรรมดาๆ ไปเป็นเอเจนต์อัตโนมัติอันชาญฉลาดที่สามารถจัดการกับงานวิจัยที่ซับซ้อนได้ การเปิดตัว Tongyi DeepResearch ของ Alibaba ซึ่งเป็นเว็บเอเจนต์โอเพนซอร์สเต็มรูปแบบ ได้จุดประกายการอภิปรายอย่างคึกคักในหมู่ผู้ชื่นชอบเทคโนโลยีและนักพัฒนาถึงอนาคตของโมเดล AI เชี่ยวชาญและการประยุกต์ใช้จริง

การเพิ่มขึ้นของเอเจนต์ AI เชี่ยวชาญ

ชุมชนเทคโนโลยีกำลังถกเถียงกันอย่างจริงจังว่าเรากำลังเข้าสู่ยุคของโมเดล AI ที่ได้รับการฝึกฝนสำหรับจุดประสงค์เฉพาะ หรือว่าความสามารถเฉพาะทางเหล่านี้จะถูกผนวกรวมกลับเข้าไปในโมเดล Frontier ในที่สุด ผู้สังเกตการณ์บางส่วนตั้งข้อสังเกตว่าเมื่อระบบ AI ก้าวหน้าขึ้นมากกว่าเดิม เราอาจได้เห็นการเติบโตอย่างรวดเร็วของโมเดลเฉพาะทางที่ถูกปรับให้เหมาะสมสำหรับงานเฉพาะ แทนที่จะพึ่งพาเฉพาะระบบอเนกประสงค์ขนาดใหญ่เพียงอย่างเดียว แนวทางนี้อาจนำไปสู่โซลูชัน AI ที่มีประสิทธิภาพและตรงเป้าหมายมากขึ้นสำหรับอุตสาหกรรมและกรณีใช้งานเฉพาะด้าน

มันทำให้ฉันสงสัยว่าเราจะได้เห็นการเติบโตอย่างรวดเร็วของ LLMs ที่ฝึกฝนมาเพื่อจุดประสงค์เฉพาะ เนื่องจากเราได้ผลตอบแทนที่ลดลงจากการลงทุนด้วยการพรีเทรน หรือว่ามันใช้เวลาเพียงไม่กี่เดือนที่จะผนวกข้อได้เปรียบเหล่านี้กลับเข้าไปในโมเดล Frontier

ความรู้สึกนี้สะท้อนถึงความอยากรู้อยากเห็นในวงกว้างของชุมชนนักพัฒนาเกี่ยวกับวิวัฒนาการของการพัฒนา AI และว่าโมเดลเฉพาะทางอย่าง Tongyi DeepResearch นั้นเป็นตัวแทนของอนาคตของการประยุกต์ใช้ปัญญาประดิษฐ์หรือไม่

การประยุกต์ใช้จริงและผลกระทบในโลกความจริง

สิ่งที่ทำให้ Tongyi DeepResearch น่าสนใจเป็นพิเศษสำหรับชุมชนคือการประยุกต์ใช้จริงในทันที โมเดลนี้กำลังขับเคลื่อน Tongyi Tafui อยู่แล้ว ซึ่งเป็นเอเจนต์วิจัยกฎหมายที่ทำหน้าที่เป็นผู้ช่วยทางกฎหมายอย่างแท้จริง ระบบนี้ดำเนินการงานวิจัยหลายขั้นตอนที่ซับซ้อนได้อย่างอัตโนมัติ ซึ่งสะท้อนถึงขั้นตอนการทำงานของทนายความจูเนียร์ โดยดึงข้อมูลคดีอย่างเป็นระบบ อ้างอิงข้ามกฎหมาย และสังเคราะห์แหล่งข้อมูลทางตุลาการด้วยความแม่นยำที่น่าประทับใจ โดเมนกฎหมายเป็นตัวแทนของสาขาความรู้ที่ซับซ้อนและเข้มข้น ซึ่งเอเจนต์ AI เชี่ยวชาญสามารถมอบคุณค่าทันที โดยจัดการงานวิจัยที่น่าเบื่อ ในขณะที่ผู้เชี่ยวชาญที่เป็นมนุษย์โฟกัสที่กลยุทธ์ระดับสูงและปฏิสัมพันธ์กับลูกค้า

การเข้าถึงและการติดตั้งในเครื่อง

สำหรับชุมชนนักพัฒนาที่ชอบลงมือปฏิบัติ คำถามเร่งด่วนที่สุดข้อหนึ่งเกี่ยวข้องกับการเข้าถึงและการติดตั้งในเครื่อง ผู้ที่มีความกระตือรือร้นต่างอยากรู้เกี่ยวกับการรันโมเดลขั้นสูงเหล่านี้บนฮาร์ดแวร์ของตัวเอง แม้จะมีข้อจำกัด เช่น การ์ดจอรุ่นเก่า ชุมชนได้แบ่งปันโซลูชันปฏิบัติสำหรับการติดตั้งในเครื่อง โดยมีคำแนะนำตั้งแต่การใช้ Ollama สำหรับการตั้งค่าที่รวดเร็ว ไปจนถึงการใช้ llama.cpp สำหรับผู้ที่ต้องการควบคุมการปรับแต่งประสิทธิภาพให้มากที่สุด การทดลองระดับรากหญ้านี้แสดงให้เห็นถึงความต้องการที่เพิ่มขึ้นสำหรับเครื่องมือ AI ที่เข้าถึงได้ ซึ่งนักพัฒนาสามารถทดสอบและปรับใช้สำหรับโครงการของพวกเขาเอง

นวัตกรรมทางเทคนิคและวิธีการฝึกฝน

เบื้องหลัง Tongyi DeepResearch คือไปป์ไลน์การฝึกฝนที่ครอบคลุมซึ่งเป็นตัวแทนของกระบวนทัศน์ใหม่สำหรับการพัฒนาเอเจนต์ AI ระบบนี้ใช้ Agentic Continual Pre-training, Supervised Finetuning และแนวทางการเสริมแรงการเรียนรู้แบบกำหนดนโยบายที่ปรับแต่งเองซึ่งเรียกว่า Group Relative Policy Optimization (GRPO) สิ่งที่สร้างสรรค์เป็นพิเศษคือการใช้งานการสร้างข้อมูลสังเคราะห์เต็มรูปแบบ โดยสร้างวัสดุฝึกฝนผ่านกระบวนการอัตโนมัติที่ไม่ต้องการการแทรกแซงจากมนุษย์ โมเดลนี้รองรับโหมดการให้เหตุผลหลายแบบ ตั้งแต่กระบวนทัศน์ ReAct แบบตรงไปตรงมา ไปจนถึงโหมดขั้นสูง Heavy Mode ที่ออกแบบมาสำหรับงานวิจัยหลายขั้นตอนที่ซับซ้อน

ส่วนประกอบของไปป์ไลน์การฝึกอบรม:

  • Agentic Continual Pre-training (CPT)
  • Supervised Finetuning (SFT)
  • Reinforcement Learning (RL) โดยใช้ Group Relative Policy Optimization (GRPO)
  • การสร้างข้อมูลสังเคราะห์แบบเต็มรูปแบบ
  • สภาพแวดล้อมการฝึกอบรมแบบจำลองโดยใช้ฐานข้อมูล Wikipedia แบบออฟไลน์

มองไปข้างหน้า: ความท้าทายและโอกาส

แม้จะมีขีดความสามารถที่น่าประทับใจ Tongyi DeepResearch ยังคงเผชิญกับข้อจำกัดหลายประการที่ทีมพัฒนายอมรับ ขนาดคอนเท็กซ์วินโดว์ 128k ในปัจจุบันอาจยังไม่เพียงพอสำหรับงานที่มีขอบเขตยาวนานและซับซ้อนที่สุด และความสามารถในการขยายขนาดของไปป์ไลน์การฝึกฝนยังไม่ได้รับการพิสูจน์บนโมเดลที่มีขนาดใหญ่กว่าสถาปัตยกรรม 30 พันล้านพารามิเตอร์ของพวกเขาอย่างมีนัยสำคัญ ความท้าทายเหล่านี้เป็นตัวแทนของโอกาสสำหรับการพัฒนาในอนาคต โดยเฉพาะอย่างยิ่งในขณะที่ชุมชน AI ยังคงผลักดันขอบเขตของสิ่งที่ทำได้ด้วยเอเจนต์อัตโนมัติ

การเปิดตัว Tongyi DeepResearch ถือเป็น вехиสำคัญในวิวัฒนาการของ AI จากคู่หูสนทนาไปสู่ผู้ช่วยวิจัยที่มีความสามารถ ในขณะที่นักพัฒนาทดลองกับเครื่องมือโอเพนซอร์สเหล่านี้และปรับใช้สำหรับการประยุกต์ใช้ต่างๆ เรามีแนวโน้มที่จะได้เห็นการใช้งานที่สร้างสรรค์ยิ่งขึ้นเกิดขึ้น across อุตสาหกรรมและโดเมนต่างๆ

อ้างอิง: Tongyi DeepResearch: A New Era of Open-Source AI Researchers