การฝึก AI เปลี่ยนจากการติดป้ายข้อมูลต้นทุนต่ำสู่สภาพแวดล้อมผู้เชี่ยวชาญทักษะสูง

ทีมชุมชน BigGo
การฝึก AI เปลี่ยนจากการติดป้ายข้อมูลต้นทุนต่ำสู่สภาพแวดล้อมผู้เชี่ยวชาญทักษะสูง

อุตสาหกรรม AI กำลังประสบกับการเปลี่ยนแปลงพื้นฐานในวิธีการฝึกและพัฒนาโมเดล สิ่งที่เคยอาศัยชุดข้อมูลขนาดใหญ่ที่สร้างโดยผู้รับเหมาค่าแรงต่ำ ตอนนี้กำลังพัฒนาเป็นกระบวนการที่ซับซ้อนซึ่งต้องการผู้เชี่ยวชาญเฉพาะด้านและสภาพแวดล้อมการเรียนรู้แบบโต้ตอบ

เป็นเวลาหลายปีที่บริษัท AI สามารถบรรลุผลลัพธ์ที่น่าประทับใจได้โดยการจ้างผู้รับเหมาบุคคลที่สามให้ติดป้ายรูปภาพ ถอดเสียง และสร้างชุดข้อมูลข้อความพื้นฐาน คนงานเหล่านี้ซึ่งมักได้รับค่าจ้างเพียงไม่กี่ดอลลาร์ต่อชั่วโมง ได้สร้างรากฐานสำหรับแชทบอท เครื่องมือสร้างภาพ และระบบรู้จำเสียงในยุคแรกๆ อย่างไรก็ตาม วิธีการนี้ได้ถึงขีดจำกัดแล้ว เนื่องจากโมเดล AI เชี่ยวชาญงานพื้นฐานแล้ว แต่ยังคงต่อสู้กับความท้าทายที่ซับซ้อนและระยะยาว

แนวทางการฝึกอบรม AI แบบดั้งเดิมเทียบกับแบบสมัยใหม่

ด้าน "ข้อมูลโรงงานเหงื่อแรง" แบบดั้งเดิม แนวทางที่ขับเคลื่อนโดยผู้เชี่ยวชาญสมัยใหม่
พนักงาน ผู้รับเหมาทักษะต่ำ ผู้เชี่ยวชาญเต็มเวลาที่มีความเชี่ยวชาญเชิงลึก
อัตราค่าจ้าง ไม่กี่ดอลลาร์ต่อชั่วโมง อัตราระดับผู้เชี่ยวชาญทักษะสูง
ขอบเขตงาน การติดป้ายแคบๆ น่าเบื่อ การจำลองงานแบบครบวงจร
ประเภทข้อมูล ชุดข้อมูลคงที่ สภาพแวดล้อมการเรียนรู้แบบโต้ตอบ
จุดเน้น การทำงานพื้นฐาน การแก้ปัญหาที่ซับซ้อนระยะยาว

การเพิ่มขึ้นของสภาพแวดล้อมการเรียนรู้แบบโต้ตอบ

ชุมชนได้ระบุการเปลี่ยนแปลงที่สำคัญไปสู่สภาพแวดล้อมซอฟต์แวร์แบบโต้ตอบมากกว่าชุดข้อมูลแบบคงที่ ระบบ AI สมัยใหม่เรียนรู้ได้ดีที่สุดผ่านการโต้ตอบซ้ำๆ กับสภาพแวดล้อมดิจิทัล โดยพยายามทำงานและเรียนรู้จากผลลัพธ์ วิธีการนี้คล้ายกับวิธีที่เกมยังคงดึงดูดผู้เล่นในระดับทักษะต่างๆ โดยให้ความท้าทายอย่างต่อเนื่องที่ยังคงมีคุณค่าเมื่อความสามารถพัฒนาขึ้น

การอภิปรายเผยให้เห็นว่าเครื่องมือเขียนโค้ด AI ปัจจุบัน ซึ่งได้รับรางวัลหลักจากการผลิตโค้ดที่ผ่านการทดสอบง่ายๆ มักล้มเหลวเมื่อสร้างระบบซอฟต์แวร์ที่ซับซ้อน พวกมันขาดความสามารถในการสร้างระบบที่มีความพร้อมใช้งานสูงและทนต่อข้อผิดพลาด หรือการใช้แนวปฏิบัติด้านความปลอดภัยที่เหมาะสม ซึ่งเป็นทักษะที่ต้องการการเรียนรู้อย่างต่อเนื่องมากกว่าการฝึกชุดข้อมูลครั้งเดียว

ข้อจำกัดทางเทคนิคหลักของระบบ AI ปัจจุบัน

  • Infrastructure Engineering: ไม่สามารถสร้างระบบที่ทนต่อความผิดพลาดและมีความพร้อมใช้งานสูงได้
  • Security Practices: ล้มเหลวในการนำมาตรการรักษาความปลอดภัยที่เหมาะสมมาใช้
  • Performance Optimization: ไม่สามารถคาดการณ์คอขวดในสภาพแวดล้อมแบบกระจาย
  • Code Quality: ผลิตโค้ดที่ผ่านการทดสอบง่าย ๆ แต่ล้มเหลวในสถานการณ์ที่ซับซ้อน
  • Real-world Adaptation: ประสบปัญหาในสถานการณ์แบบเปิดที่ความสำเร็จไม่สามารถตรวจสอบได้ง่าย

ความเชี่ยวชาญเฉพาะด้านกลายเป็นสิ่งสำคัญ

จุดสำคัญของการอภิปรายในชุมชนมุ่งเน้นไปที่ความสำคัญที่เพิ่มขึ้นของผู้เชี่ยวชาญเฉพาะด้าน ผู้เชี่ยวชาญหลายคนในสาขาเฉพาะเคยได้รับการบอกว่าความเชี่ยวชาญของพวกเขากำลังมีคุณค่าลดลงเนื่องจากความสามารถของ AI อย่างไรก็ตาม คอขวดปัจจุบันในความก้าวหน้าของ AI ดูเหมือนจะเป็นการขาดความรู้เฉพาะด้านที่ลึกซึ้งซึ่งถูกรวมเข้าในระบบการฝึกอย่างเหมาะสม

เรากำลังไปถึงจุดที่คุณไม่สามารถโยนข้อมูลเพิ่มเติมใส่ปัญหาได้ (โดยเฉพาะข้อมูลที่เป็นไปตามอำเภอใจ) เราต้องคิดเกี่ยวกับข้อมูลใดที่เราตั้งใจใช้เพื่อสร้างโมเดล

ความท้าทายอยู่ที่การเปลี่ยนการสร้างข้อมูลจากกิจกรรมการจ้างงานภายนอกที่มีสถานะต่ำให้เป็นกระบวนการที่ซับซ้อนซึ่งต้องการความสามารถระดับโลกและวิศวกรรมที่ซับซ้อน นี่แสดงถึงการกำหนดกรอบใหม่พื้นฐานของวิธีการคิดและสร้างข้อมูลการฝึก AI

ความท้าทายทางเทคนิคและผลกระทบต่อตลาด

ชุมชนได้สังเกตเห็นความคล้ายคลึงที่น่าสนใจในประวัติการพัฒนา AI ในขณะที่ Google มุ่งเน้นไปที่ AI เล่นเกมอย่าง AlphaGo , OpenAI มุ่งเน้นไปที่การประมวลผลภาษาธรรมชาติ ซึ่งท้ายที่สุดนำไปสู่การใช้งานเชิงพาณิชย์ที่เป็นไปได้มากกว่า นี่เน้นย้ำว่าการเลือกข้อมูลการฝึกสามารถกำหนดความสำเร็จในตลาดได้ ไม่ใช่แค่ความสำเร็จทางเทคนิคเท่านั้น

วิธีการเรียนรู้เสริมแรงปัจจุบันที่มีรางวัลที่ตรวจสอบได้แสดงให้เห็นความหวังสำหรับงานการใช้เหตุผลเชิงรูปแบบ เช่น การพิสูจน์ทฤษฎีบทและการแก้ปริศนา อย่างไรก็ตาม วิธีการเหล่านี้ยังไม่เพียงพอเมื่อต้องจัดการกับสถานการณ์โลกแห่งความเป็นจริงแบบเปิดที่ความสำเร็จไม่สามารถตรวจสอบได้ง่ายๆ ว่าถูกหรือผิด

การอภิปรายแสดงให้เห็นว่าความก้าวหน้าของ AI ในอนาคตจะขึ้นอยู่กับการสร้างระบบรางวัลที่ดีกว่าและสภาพแวดล้อมการเรียนรู้เสริมแรงที่ซับซ้อนมากขึ้น กลไกการให้คะแนนแบบง่ายไม่สามารถประเมินได้ว่า AI จะเป็นทนายความหรือวิศวกรที่มีประสิทธิภาพหรือไม่ การประเมินเหล่านี้ต้องการความเข้าใจในประสิทธิภาพที่ซับซ้อนและตามบริบทในหลายมิติ

บทสรุป

การเปลี่ยนแปลงนี้แสดงถึงมากกว่าแค่วิวัฒนาการทางเทคนิค มันส่งสัญญาณถึงการเปลี่ยนแปลงพื้นฐานในวิธีที่อุตสาหกรรม AI ให้คุณค่าและรวมความเชี่ยวชาญของมนุษย์ เมื่อโมเดลมีความสามารถมากขึ้น คอขวดจะเปลี่ยนจากพลังการคำนวณดิบไปสู่คุณภาพของสภาพแวดล้อมการเรียนรู้และความลึกของความรู้ที่พวกมันสามารถจำลองได้ อนาคตของการพัฒนา AI ดูเหมือนจะไม่ได้อยู่ที่การแทนที่ความเชี่ยวชาญของมนุษย์ แต่ในการหาวิธีที่ซับซ้อนมากขึ้นในการจับและถ่ายทอดความเชี่ยวชาญนั้นไปยังระบบประดิษฐ์

อ้างอิง: Sweatshop data is over