ชุมชนหุ่นยนต์ถกเถียงว่าการขยายขนาดโมเดล AI จะแก้ปัญหาหุ่นยนต์ในโลกจริงได้หรือไม่

ทีมชุมชน BigGo
ชุมชนหุ่นยนต์ถกเถียงว่าการขยายขนาดโมเดล AI จะแก้ปัญหาหุ่นยนต์ในโลกจริงได้หรือไม่

สาขาหุ่นยนต์กำลังประสบกับการถกเถียงอย่างเข้มข้นเกี่ยวกับว่าแนวทางการขยายขนาดที่ปฏิวัติวงการคอมพิวเตอร์วิทัศน์และการประมวลผลภาษาธรรมชาติจะสามารถแก้ไขความท้าทายที่ซับซ้อนของหุ่นยนต์ในโลกจริงได้หรือไม่ ในขณะที่นักวิจัยบางคนเชื่อว่าชุดข้อมูลขนาดใหญ่และโมเดลที่ใหญ่ขึ้นคือกุญแจสำคัญ แต่คนอื่นๆ กลับตั้งคำถามว่ากลยุทธ์นี้จะสามารถเอาชนะอุปสรรคเฉพาะตัวที่หุ่นยนต์เผชิญในสภาพแวดล้อมทางกายภาพได้หรือไม่

ข้อโต้แย้งหลักที่สนับสนุนการขยายขนาดในหุ่นยนต์: • ความสำเร็จใน Computer Vision และ NLP แสดงให้เห็นศักยภาพสำหรับหุ่นยนต์ • โมเดลขนาดใหญ่ให้ความสามารถ "สามัญสำนึก" ที่จำเป็นสำหรับหุ่นยนต์ • Foundation models สามารถช่วยระบุรูปแบบในงานหุ่นยนต์ • การใช้ประโยชน์จากความก้าวหน้าที่มีอยู่ในด้านข้อมูล การคำนวณ และโครงสร้างพื้นฐาน AI

ความก้าวหน้าปัจจุบันแสดงผลลัพธ์ที่หลากหลาย

การพัฒนาล่าสุดในสาขานี้นำเสนอภาพที่ซับซ้อน บริษัทอย่าง 1X ได้แสดงให้เห็นความสามารถที่น่าสัญญากับโมเดล Redwood ของพวกเขา โดยนำเสนอหุ่นยนต์ที่ปฏิบัติงานในบ้านด้วยความซับซ้อนที่เพิ่มขึ้น อย่างไรก็ตาม ชุมชนยังคงแบ่งออกเป็นสองฝ่ายเกี่ยวกับว่าการปรับปรุงแบบเพิ่มขึ้นเป็นระยะเหล่านี้แสดงถึงความก้าวหน้าที่แท้จริงหรือเป็นเพียงการสาธิตที่ขัดเกลาแล้ว

อุตสาหกรรมยานยนต์ให้การตรวจสอบความเป็นจริงที่เрезвый เทคโนโลยีการขับขี่อัตโนมัติของ Tesla แม้จะผ่านการพัฒนามาหลายปีและการเก็บรวบรวมข้อมูลขนาดใหญ่ แต่ยังคงดิ้นรนกับการนำไปใช้ในโลกจริง สิ่งนี้ทำให้ผู้สังเกตการณ์บางคนตั้งคำถามว่าแนวทางการขยายขนาดจะสามารถส่งมอบความน่าเชื่อถือ 99.9% ที่แอปพลิเคชันหุ่นยนต์ต้องการได้หรือไม่

ข้อโต้แย้งหลักต่อการขยายขนาดในด้านหุ่นยนต์: • ข้อมูลสำหรับการฝึกหุ่นยนต์มีอยู่อย่างจำกัด • รูปแบบการออกแบบหุ่นยนต์ที่แตกต่างกันสร้างปัญหาความเข้ากันได้ • ความแปรปรวนของสภาพแวดล้อมสูงในสภาวะการทำงานของหุ่นยนต์ • ความต้องการความน่าเชื่อถือ 99.X% ที่โมเดลขนาดใหญ่ปัจจุบันยังทำไม่ได้ • งานระยะยาวต้องการประสิทธิภาพที่ยั่งยืนตลอดเวลา

ความท้าทายในการเก็บรวบรวมข้อมูล

หนึ่งในอุปสรรคที่สำคัญที่สุดที่แนวทางการขยายขนาดเผชิญคือความแตกต่างพื้นฐานระหว่างข้อมูลหุ่นยนต์กับข้อมูลข้อความหรือภาพที่ขับเคลื่อนความก้าวหน้าของ AI ในอดีต ไม่เหมือนกับการขูดข้อมูลเว็บสำหรับโมเดลภาษา การเก็บรวบรวมข้อมูลหุ่นยนต์ต้องใช้หุ่นยนต์จริงที่ทำงานในสภาพแวดล้อมที่หลากหลาย ซึ่งเป็นกระบวนการที่มีค่าใช้จ่ายสูงและใช้เวลานาน

ความท้าทายจะซับซ้อนยิ่งขึ้นเมื่อพิจารณาถึงความแตกต่างอย่างมากในการออกแบบหุ่นยนต์และสภาพแวดล้อมการทำงาน แขนหุ่นยนต์ในโรงงานทำงานแตกต่างอย่างมากจากหุ่นยนต์ทำความสะอาดในบ้าน ทำให้ไม่ชัดเจนว่าโมเดลขนาดใหญ่เดียวจะสามารถจัดการกับความหลากหลายดังกล่าวได้อย่างมีประสิทธิภาพหรือไม่

แนวทางทางเลือกได้รับความสนใจ

นักวิจัยบางคนโต้แย้งว่าการมุ่งเน้นไปที่ชุดข้อมูลขนาดใหญ่อาจเป็นการเข้าใจผิด พวกเขาแนะนำว่าหุ่นยนต์ เช่นเดียวกับระบบชีวภาพ ควรมีความสามารถในการเรียนรู้อย่างต่อเนื่องในสภาพแวดล้อมเฉพาะของพวกมัน แทนที่จะพึ่งพาโมเดลที่ฝึกล่วงหน้า

คิดดูสิ ทำไมมันถึงจำเป็นที่ทุกคนที่ต้องการหุ่นยนต์พ่อบ้านในบ้านจะต้องถ่ายวิดีโอห้องครัวของตัวเองแล้วนำไปผสมกับห้องครัวหลายหมื่นห้องอื่นๆ เพียงเพื่อให้หุ่นยนต์รู้จักห้องครัวเฉพาะของคุณอย่างละเอียด?

มุมมองนี้เน้นย้ำถึงความสำคัญของระบบการเรียนรู้แบบปรับตัวที่สามารถปรับเข้ากับสภาพแวดล้อมใหม่ได้อย่างรวดเร็วโดยไม่ต้องใช้ชุดข้อมูลการฝึกล่วงหน้าขนาดใหญ่

แนวทางทางเลือกที่กำลังได้รับการสำรวจ: • ระบบที่มีมนุษย์เข้ามาร่วมในกระบวนการสำหรับการดำเนินงานที่สำคัญ • การผสมผสานหุ่นยนต์แบบคลาสสิกกับวิธีการที่ใช้การเรียนรู้ • การฝึกอบรมแบบจำลองเพื่อลดความต้องการข้อมูลในโลกแห่งความจริง • ระบบการเรียนรู้อย่างต่อเนื่องที่ปรับตัวให้เข้ากับสภาพแวดล้อมเฉพาะ • การมุ่งเน้นไปที่การจัดการแบบเคลื่อนที่และอินเทอร์เฟซที่เป็นมิตรต่อผู้ใช้

เส้นทางข้างหน้า

ชุมชนหุ่นยนต์ดูเหมือนจะมาบรรจบกันในแนวทางหลายทาง แทนที่จะเดิมพันทุกอย่างกับการขยายขนาด นักวิจัยกำลังสำรวจการผสมผสานเทคนิคหุ่นยนต์แบบคลาสสิกกับวิธีการ AI สมัยใหม่ ระบบที่มีมนุษย์ในลูป และแนวทางการฝึกอบรมที่ใช้การจำลอง

การถกเถียงนี้สะท้อนถึงคำถามที่กว้างขึ้นเกี่ยวกับอนาคตของการพัฒนา AI ว่าแนวทางการขยายขนาดที่ได้ผลในโดเมนดิจิทัลจะสามารถถ่ายทอดไปยังโลกกายภาพได้สำเร็จหรือไม่ ในที่ซึ่งความผิดพลาดมีผลกระทบจริงและความน่าเชื่อถือที่สมบูรณ์แบบมักจะเป็นสิ่งจำเป็นมากกว่าเป็นทางเลือก

อ้างอิง: Scaling might solve robotics?