ชุมชนปัญญาประดิษฐ์กำลังเผชิญกับความท้าทายพื้นฐานที่อาจเป็นตัวกำหนดอนาคตของการพัฒนา AI ในขณะที่บริษัทเทคโนโลยีใหญ่อย่าง Google DeepMind , Meta และ OpenAI กำลังแข่งขันกันสร้างระบบ AI ที่มีแบบจำลองโลกที่ซับซ้อน ซึ่งเป็นการแสดงภายในของการทำงานของโลก หลักฐานปัจจุบันชี้ให้เห็นว่าระบบเหล่านี้ยังห่างไกลจากการบรรลุเป้าหมายนี้
![]() |
---|
การจัดวางลูกแก้วหิมะที่มีโลกจิ๋วอยู่ข้างในไว้บนแผงวงจรเน้นย้ำถึงการแสวงหาของชุมชน AI ในการพัฒนาแบบจำลองโลกที่แท้จริงท่ามกลางข้อจำกัดในปัจจุบัน |
ช่องว่างระหว่างความคาดหวังและความเป็นจริง
งานวิจัยล่าสุดเผยให้เห็นว่าโมเดลภาษาขนาดใหญ่ในปัจจุบันไม่ได้พัฒนาแบบจำลองโลกที่สอดคล้องกันตามที่ผู้เชี่ยวชาญหลายคนหวังไว้ แต่กลับเรียนรูสิ่งที่นักวิจัยเรียกว่า กลุ่มกฎเกณฑ์ ซึ่งเป็นชุดของกฎที่ไม่เชื่อมโยงกันและสามารถจัดการกับสถานการณ์เฉพาะได้ แต่ไม่ได้สร้างความเข้าใจที่เป็นหนึ่งเดียว การค้นพบนี้มีผลกระทบที่สำคัญต่อความน่าเชื่อถือและประสิทธิภาพของ AI
ชุมชนได้สังเกตข้อจำกัดนี้โดยตรงผ่านการประยุกต์ใช้งานจริง นักพัฒนาเกมที่ทำงานกับระบบ AI รายงานว่าแม้แต่โมเดลที่ทันสมัยที่สุดก็ยังดิ้นรนกับการจัดการสถานะพื้นฐานและความสอดคล้องของกฎเกณฑ์ เมื่อได้รับมอบหมายงานง่าย ๆ เช่น การนำทางในเขาวงกตทีละขั้นตอน ระบบเหล่านี้จะสับสนอย่างรวดเร็วและเริ่มเคลื่อนไหวแบบวนเวียนและไร้เหตุผล
กฎเกณฑ์: กฎง่าย ๆ หรือทางลัดที่ใช้แก้ปัญหาอย่างรวดเร็ว แต่ไม่ได้แม่นยำเสมอไป
ข้อจำกัดปัจจุบันของ AI World Model:
- โมเดลภาษาขนาดใหญ่ใช้ "bags of heuristics" แทนการแสดงโลกที่สอดคล้องกัน
- ประสิทธิภาพลดลงอย่างมีนัยสำคัญเมื่อมีการเปลี่ยนแปลงเล็กน้อยในสภาพแวดล้อม (การปิดกั้นถนนเพียง 1% ทำให้ระบบล้มเหลว)
- ไม่สามารถรักษาสถานะภายในที่สม่ำเสมอระหว่างงานที่เป็นลำดับ
- ประสบปัญหาในการรักษาความสอดคล้องของกฎพื้นฐานในสถานการณ์เกม
การตรวจสอบความเป็นจริงของเครื่องมือหมากรุก
ชุมชน AI เกมให้หลักฐานที่น่าเชื่อถือเกี่ยวกับข้อจำกัดปัจจุบัน เครื่องมือหมากรุกและเกมกระดานแบบดั้งเดิมยังคงมีประสิทธิภาพเหนือกว่าเครือข่ายประสาทเทียมโดยการใช้กฎเกมที่ชัดเจนและค้นหาล่วงหน้าหลายตา AI สมัยใหม่ช่วยเหลือในฟังก์ชันการประเมินและการตัดตาที่ไม่จำเป็น แต่แบบจำลองโลกหลัก ซึ่งเป็นความเข้าใจกฎเกมและการเคลื่อนไหวที่ถูกต้อง ยังคงต้องได้รับการเขียนโปรแกรมด้วยตนเองโดยมนุษย์
ไม่มีอะไรเอาชนะ 'การใช้ตรรกะเกมอย่างเต็มรูปแบบและการใช้กฎเกณฑ์ในการตัดทอนเพื่อมองไปข้างหน้า 50 ตา' นี่คือวิธีการทำงานของเครื่องมือหมากรุกและวิธีการทำงานของ AI เกมเทิร์นเบสที่ดีทั้งหมด
แม้แต่ระบบขั้นสูงอย่าง AlphaGo และ MuZero แม้จะมีประสิทธิภาพที่น่าประทับใจ ก็ยังต้องการการใช้กฎที่เขียนโปรแกรมโดยมนุษย์เป็นรากฐาน ส่วนประกอบ AI ช่วยเพิ่มกลยุทธ์และการประเมิน แต่ไม่สามารถทดแทนความจำเป็นในการสร้างแบบจำลองโลกที่ชัดเจน
การตัดตา: เทคนิคการกำจัดการเคลื่อนไหวที่แย่อย่างชัดเจนออกจากการพิจารณาเพื่อเร่งการตัดสินใจ
เอนจิ้นเกมแบบดั้งเดิม เทียบกับ AI:
- เอนจิ้นแบบดั้งเดิม: การใช้กฎเกณฑ์ที่ชัดเจน + การค้นหาแบบต้นไม้ + การประเมินแบบฮิวริสติก
- ระบบ AI: การจับคู่รูปแบบโดยไม่เข้าใจกฎเกณฑ์อย่างแท้จริง
- AlphaGo / MuZero : ยังคงต้องการรากฐานกฎเกณฑ์ที่มนุษย์เขียนโปรแกรมไว้
- เอนจิ้นหมากรุก: มองไปข้างหน้า 50+ ตา โดยใช้โมเดลโลกที่ใช้งานด้วยตนเอง
ความท้าทายทางเทคนิคในการนำไปใช้
นักพัฒนาที่พยายามสร้างระบบ AI สำหรับเกมกระดานเผชิญกับรูปแบบที่สอดคล้องกัน ในขณะที่ AI สามารถสร้างโค้ดการเล่นเกมเมื่อได้รับข้อมูลที่สมบูรณ์ แต่จะล้มเหลวเมื่อต้องการให้รักษาสถานะภายในหรือปรับตัวกับสภาวะที่เปลี่ยนแปลง การศึกษาการนำทางถนนใน Manhattan ที่กล่าวถึงในงานวิจัยต้นฉบับแสดงให้เห็นถึงความเปราะบางนี้ เมื่อถนนเพียง 1% ถูกปิดกั้นแบบสุ่ม ประสิทธิภาพของ AI จะพังทลายลงอย่างสมบูรณ์
ชุมชนได้ทดลองกับแนวทางต่าง ๆ เพื่อแก้ไขข้อจำกัดเหล่านี้ นักพัฒนาบางคนพยายามให้ระบบ AI เขียนบันทึกรายละเอียดสำหรับตนเองเพื่อรักษาบริบทตลอดการโต้ตอบ แต่แม้แต่แนวทางนี้ก็เผยให้เห็นช่องว่างพื้นฐาน ระบบมักจะลืมข้อมูลสำคัญเช่นทิศทางปัจจุบันหรือล้มเหลวในการรวมคำแนะนำที่จำเป็นสำหรับการตีความการแสดงสถานะของตนเอง
แนวทางการวิจัยที่กำลังได้รับการสำรวจ:
- ข้อมูลการฝึกอบรมแบบหลายรูปแบบ (วิดีโอ, การจำลอง 3D, ข้อความ)
- สถาปัตยกรรมเฉพาะทาง ( Tolman-Eichenbaum Machine )
- การถอดรหัสที่จำกัดด้วยไวยากรณ์สำหรับผลลัพธ์ที่มีโครงสร้าง
- Gaussian splatting ในฐานะการแสดงแบบจำลองโลก
- สถาปัตยกรรมแบบจำลองที่ประกอบตัวเองได้
เส้นทางไปข้างหน้า
แม้จะมีข้อจำกัดปัจจุบัน ชุมชน AI ยังคงมองโลกในแง่ดีเกี่ยวกับแนวทางแก้ไขที่เป็นไปได้ นักวิจัยบางคนกำลังสำรวจสถาปัตยกรรมเฉพาะทางอย่าง Tolman-Eichenbaum Machine ซึ่งแสดงให้เห็นความหวังในงานแก้เขาวงกตและสร้างรูปแบบการเปิดใช้งานที่คล้ายสมอง คนอื่น ๆ กำลังตследวจว่าข้อมูลการฝึกแบบมัลติโมดัลจำนวนมหาศาลอาจนำไปสู่แบบจำลองโลกที่เกิดขึ้นเองได้หรือไม่
ฉันทามติในหมู่ผู้ปฏิบัติงานคือแบบจำลองโลกที่แท้จริงยังคงเป็นสิ่งจำเป็นสำหรับการบรรลุระบบ AI ที่แข็งแกร่ง หากไม่มีแบบจำลองเหล่านี้ AI จะยังคงเปราะบางและไม่น่าเชื่อถือเมื่อเผชิญกับสถานการณ์ใหม่หรือการเปลี่ยนแปลงเล็กน้อยในสภาพแวดล้อมที่คุ้นเคย
การเดินทางสู่แบบจำลองโลก AI ที่แท้จริงแสดงถึงหนึ่งในความท้าทายที่สำคัญที่สุดของสาขานี้ ในขณะที่ระบบปัจจุบันสามารถทำสิ่งที่น่าประทับใจผ่านการจับคู่รูปแบบทางสถิติ การสร้าง AI ที่เข้าใจและสร้างแบบจำลองโลกอย่างแท้จริงยังคงเป็นปัญหาที่ยังไม่ได้รับการแก้ไขซึ่งน่าจะต้องการการพัฒนาพื้นฐานในสถาปัตยกรรมและแนวทางการฝึก
อ้างอิง: 'World Models,' an Old Idea in AI, Mount a Comeback