ในขณะที่การคาดการณ์เกี่ยวกับปัญญาประดิษฐ์จะมาแทนที่มนุษย์ในการทำงานกำลังร้อนระอุ การทดสอบมาตรฐานใหม่ได้นำเสนอข้อเท็จจริงที่ทำให้ต้องกลับมาคิดใหม่ ดัชนี Remote Labor Index ที่พัฒนาโดย Scale AI และ Center for AI Safety เผยให้เห็นว่าแม้แต่เอไอเอเจนต์ที่ล้ำสมัยที่สุดยังคงต่อสู้ดิ้นรนอย่างมากกับงานหลายขั้นตอนที่ซับซ้อนซึ่งเป็นลักษณะของงานฟรีแลนซ์สมัยใหม่ ท้าทายการคาดการณ์ในแง่บวกเกี่ยวกับการทำให้งานเป็นอัตโนมัติในระยะอันใกล้
ดัชนี Remote Labor Index ทดสอบความสามารถของ เอไอ
นักวิจัยสร้างเกณฑ์มาตรฐานที่ครอบคลุมโดยการสร้างงานฟรีแลนซ์จากโลกจริงผ่านพนักงานของ Upwork ที่ผ่านการยืนยันแล้ว ครอบคลุมงานออกแบบกราฟิก ตัดต่อวิดีโอ พัฒนาเกม และงานธุรการอย่างการดึงข้อมูล แต่ละงานมีคำอธิบาย job description ไฟล์ที่จำเป็น และตัวอย่างงานที่มนุษย์ทำเสร็จแล้ว วิธีการนี้เป็นการจำลองเศรษฐกิจฟรีแลนซ์ที่สมจริง เพื่อทดสอบความสามารถของเอไอในการจัดการงานที่มีคุณค่าทางเศรษฐกิจ ซึ่งเกินกว่าแค่งานเขียนโค้ดหรือการใช้เหตุผลง่ายๆ
ประเภทงานที่ทดสอบ: การออกแบบผลิตภัณฑ์ การออกแบบกราฟิก การพัฒนาเกม การผลิตเสียง/วิดีโอ การดำเนินงาน การตลาด การวิเคราะห์ข้อมูล การวิจัย การเขียน และงานธุรการ
ผลการทำงานต่ำกว่าความคาดหมายอย่างมาก
ผลลัพธ์ที่ออกมาดูแย่อย่างน่าตกใจ across all tested AI systems แม้แต่เอไอเอเจนต์ที่สามารถที่สุดอย่าง Manus จากสตาร์ทอัพจีนที่มีชื่อเดียวกัน ก็สามารถทำงานที่มีให้ทำได้เพียง 2.5-3% เท่านั้น ในแง่การเงิน เอไอที่ทำผลงานได้ดีที่สุดทำรายได้เพียง 1,810 ดอลลาร์สหรัฐ จากจำนวนที่เป็นไปได้ทั้งหมด 143,991 ดอลลาร์สหรัฐ ตามหลัง Manus ในการจัดอันดับคือ Grok จาก xAI, Claude จาก Anthropic, ChatGPT จาก OpenAI และ Gemini จาก Google ซึ่งทั้งหมดแสดงข้อจำกัดที่คล้ายคลึงกันในการทำให้งานเป็นอัตโนมัติในทางปฏิบัติ
การจัดอันดับประสิทธิภาพของ AI Agent บน Remote Labor Index:
- Manus (สตาร์ทอัพจีน) - ผู้มีประสิทธิภาพสูงสุด
- Grok (xAI)
- Claude (Anthropic)
- ChatGPT (OpenAI)
- Gemini (Google)
เหตุใดเอไอจึงลำบากกับงานในโลกจริง
ตามที่ Dan Hendrycks ผู้อำนวยการของ CAIS กล่าว ข้อจำกัดพื้นฐานมาจากความไม่สามารถของเอไอในการใช้เครื่องมือหลายๆ อย่างอย่างมีประสิทธิภาพและปฏิบัติงานหลายขั้นตอนที่ซับซ้อน พวกมันไม่มีที่เก็บความจำระยะยาวและไม่สามารถเรียนรู้อย่างต่อเนื่องจากประสบการณ์ได้ พวกมันไม่สามารถรับทักษะระหว่างทำงานได้เหมือนมนุษย์ เขาอธิบาย แม้โมเดลเอไอจะก้าวหน้าอย่างมากในการเขียนโค้ด คณิตศาสตร์ และการใช้เหตุผลเชิงตรรกะ แต่ความสามารถเหล่านี้ไม่สามารถถ่ายโอนไปสู่ข้อกำหนดที่เปลี่ยนแปลงได้ของงานฟรีแลนซ์ซึ่งเกี่ยวข้องกับความคิดสร้างสรรค์ การผสานรวมเครื่องมือ และการแก้ปัญหาแบบปรับตัวได้
ท้าทายการคาดการณ์การทำให้เป็นอัตโนมัติในแง่บวกเกินจริง
ข้อค้นพบเหล่านี้แสดงให้เห็นความแตกต่างอย่างชัดเจนเมื่อเทียบกับเกณฑ์มาตรฐานอื่นๆ เช่น GDPval ของ OpenAI ซึ่งชี้ให้เห็นว่า Frontier AI Models กำลังเข้าใกล้ความสามารถของมนุษย์ across 220 office tasks ดัชนี Remote Labor Index ให้มุมมองที่現實มากกว่า ชี้ให้ว่าในขณะที่เอไอทำได้ดีในโดเมนเฉพาะทาง การแทนที่งานของมนุษย์อย่างครอบคลุมยังคงเป็นเรื่องที่ยังอีกไกล สิ่งนี้ท้าทายการคาดการณ์ล่าสุด รวมถึงคำแนะนำของ Dario Amodei ซีอีโอของ Anthropic ที่ว่า 90% ของงานเขียนโค้ดจะถูกทำให้เป็นอัตโนมัติภายในไม่กี่เดือน
ผลกระทบในโลกจริงต่อแนวโน้มการจ้างงาน
แม้เอไอในปัจจุบันจะมีข้อจำกัด แต่เทคโนโลยีนี้ก็已经开始ส่งผลต่อการตัดสินใจด้านการจ้างงานแล้ว Amazon ประกาศลดตำแหน่งงาน 14,000 ตำแหน่ง โดยอ้างส่วนหนึ่งว่าเป็นเพราะศักยภาพการเปลี่ยนแปลงของ Generative AI Beth Galetti รองประธานอาวุโสของ Amazon เรียกเอไอรุ่นนี้ว่าเป็นเทคโนโลยีที่เปลี่ยนแปลงมากที่สุดที่เราเคยเห็นตั้งแต่มีอินเทอร์เน็ต อย่างไรก็ตาม หากดัชนี Remote Labor Index ถูกต้อง เอไอจะไม่มาแทนที่บทบาทงานที่ว่างเหล่านี้ในเร็วๆ นี้
ผลการดำเนินงานทางการเงิน: AI ที่มีผลงานดีที่สุดสามารถทำรายได้ 1,810 ดอลลาร์สหรัฐ จากศักยภาพ 143,991 ดอลลาร์สหรัฐ (อัตราความสำเร็จประมาณ 1.3%)
อนาคตของเอไอและงานที่ต้องพิจารณาให้ละเอียดขึ้น
การวิจัยชี้ให้เห็นว่าบทบาทของเอไอในระยะใกล้อาจเป็นเครื่องมือเพิ่มผลผลิตมากกว่าจะเป็นแรงงานทดแทน Bing Liu ผู้อำนวยการฝ่ายวิจัยของ Scale AI ตั้งข้อสังเกตว่ามีความเป็นไปได้สูงที่ฟรีแลนเซอร์หลายคนจะใช้เอไอเป็นเครื่องมือในลักษณะที่เพิ่มผลผลิตของพวกเขา สิ่งนี้สอดคล้องกับรูปแบบทางประวัติศาสตร์ที่เทคโนโลยีใหม่ๆ เสริมความสามารถของมนุษย์ แทนที่จะแทนที่พวกมันในทันที เกณฑ์มาตรฐานนี้ให้การตรวจสอบความเป็นจริงที่มีคุณค่า ต่อต้านทั้งความกลัวการแทนที่งานในแง่ลบและกรอบเวลาการทำให้เป็นอัตโนมัติในแง่บวกที่เกินจริง ชี้ให้เห็นว่าความร่วมมือระหว่างมนุษย์และเอไอน่าจะเป็นเส้นทางข้างหน้าที่เป็นไปได้มากที่สุดในเศรษฐกิจฟรีแลนซ์

