อุตสาหกรรม AI กำลังประสบกับการเปลี่ยนแปลงพื้นฐานในวิธีการฝึกและพัฒนาโมเดล สิ่งที่เคยอาศัยชุดข้อมูลขนาดใหญ่ที่สร้างโดยผู้รับเหมาค่าแรงต่ำ ตอนนี้กำลังพัฒนาเป็นกระบวนการที่ซับซ้อนซึ่งต้องการผู้เชี่ยวชาญเฉพาะด้านและสภาพแวดล้อมการเรียนรู้แบบโต้ตอบ
เป็นเวลาหลายปีที่บริษัท AI สามารถบรรลุผลลัพธ์ที่น่าประทับใจได้โดยการจ้างผู้รับเหมาบุคคลที่สามให้ติดป้ายรูปภาพ ถอดเสียง และสร้างชุดข้อมูลข้อความพื้นฐาน คนงานเหล่านี้ซึ่งมักได้รับค่าจ้างเพียงไม่กี่ดอลลาร์ต่อชั่วโมง ได้สร้างรากฐานสำหรับแชทบอท เครื่องมือสร้างภาพ และระบบรู้จำเสียงในยุคแรกๆ อย่างไรก็ตาม วิธีการนี้ได้ถึงขีดจำกัดแล้ว เนื่องจากโมเดล AI เชี่ยวชาญงานพื้นฐานแล้ว แต่ยังคงต่อสู้กับความท้าทายที่ซับซ้อนและระยะยาว
แนวทางการฝึกอบรม AI แบบดั้งเดิมเทียบกับแบบสมัยใหม่
ด้าน | "ข้อมูลโรงงานเหงื่อแรง" แบบดั้งเดิม | แนวทางที่ขับเคลื่อนโดยผู้เชี่ยวชาญสมัยใหม่ |
---|---|---|
พนักงาน | ผู้รับเหมาทักษะต่ำ | ผู้เชี่ยวชาญเต็มเวลาที่มีความเชี่ยวชาญเชิงลึก |
อัตราค่าจ้าง | ไม่กี่ดอลลาร์ต่อชั่วโมง | อัตราระดับผู้เชี่ยวชาญทักษะสูง |
ขอบเขตงาน | การติดป้ายแคบๆ น่าเบื่อ | การจำลองงานแบบครบวงจร |
ประเภทข้อมูล | ชุดข้อมูลคงที่ | สภาพแวดล้อมการเรียนรู้แบบโต้ตอบ |
จุดเน้น | การทำงานพื้นฐาน | การแก้ปัญหาที่ซับซ้อนระยะยาว |
การเพิ่มขึ้นของสภาพแวดล้อมการเรียนรู้แบบโต้ตอบ
ชุมชนได้ระบุการเปลี่ยนแปลงที่สำคัญไปสู่สภาพแวดล้อมซอฟต์แวร์แบบโต้ตอบมากกว่าชุดข้อมูลแบบคงที่ ระบบ AI สมัยใหม่เรียนรู้ได้ดีที่สุดผ่านการโต้ตอบซ้ำๆ กับสภาพแวดล้อมดิจิทัล โดยพยายามทำงานและเรียนรู้จากผลลัพธ์ วิธีการนี้คล้ายกับวิธีที่เกมยังคงดึงดูดผู้เล่นในระดับทักษะต่างๆ โดยให้ความท้าทายอย่างต่อเนื่องที่ยังคงมีคุณค่าเมื่อความสามารถพัฒนาขึ้น
การอภิปรายเผยให้เห็นว่าเครื่องมือเขียนโค้ด AI ปัจจุบัน ซึ่งได้รับรางวัลหลักจากการผลิตโค้ดที่ผ่านการทดสอบง่ายๆ มักล้มเหลวเมื่อสร้างระบบซอฟต์แวร์ที่ซับซ้อน พวกมันขาดความสามารถในการสร้างระบบที่มีความพร้อมใช้งานสูงและทนต่อข้อผิดพลาด หรือการใช้แนวปฏิบัติด้านความปลอดภัยที่เหมาะสม ซึ่งเป็นทักษะที่ต้องการการเรียนรู้อย่างต่อเนื่องมากกว่าการฝึกชุดข้อมูลครั้งเดียว
ข้อจำกัดทางเทคนิคหลักของระบบ AI ปัจจุบัน
- Infrastructure Engineering: ไม่สามารถสร้างระบบที่ทนต่อความผิดพลาดและมีความพร้อมใช้งานสูงได้
- Security Practices: ล้มเหลวในการนำมาตรการรักษาความปลอดภัยที่เหมาะสมมาใช้
- Performance Optimization: ไม่สามารถคาดการณ์คอขวดในสภาพแวดล้อมแบบกระจาย
- Code Quality: ผลิตโค้ดที่ผ่านการทดสอบง่าย ๆ แต่ล้มเหลวในสถานการณ์ที่ซับซ้อน
- Real-world Adaptation: ประสบปัญหาในสถานการณ์แบบเปิดที่ความสำเร็จไม่สามารถตรวจสอบได้ง่าย
ความเชี่ยวชาญเฉพาะด้านกลายเป็นสิ่งสำคัญ
จุดสำคัญของการอภิปรายในชุมชนมุ่งเน้นไปที่ความสำคัญที่เพิ่มขึ้นของผู้เชี่ยวชาญเฉพาะด้าน ผู้เชี่ยวชาญหลายคนในสาขาเฉพาะเคยได้รับการบอกว่าความเชี่ยวชาญของพวกเขากำลังมีคุณค่าลดลงเนื่องจากความสามารถของ AI อย่างไรก็ตาม คอขวดปัจจุบันในความก้าวหน้าของ AI ดูเหมือนจะเป็นการขาดความรู้เฉพาะด้านที่ลึกซึ้งซึ่งถูกรวมเข้าในระบบการฝึกอย่างเหมาะสม
เรากำลังไปถึงจุดที่คุณไม่สามารถโยนข้อมูลเพิ่มเติมใส่ปัญหาได้ (โดยเฉพาะข้อมูลที่เป็นไปตามอำเภอใจ) เราต้องคิดเกี่ยวกับข้อมูลใดที่เราตั้งใจใช้เพื่อสร้างโมเดล
ความท้าทายอยู่ที่การเปลี่ยนการสร้างข้อมูลจากกิจกรรมการจ้างงานภายนอกที่มีสถานะต่ำให้เป็นกระบวนการที่ซับซ้อนซึ่งต้องการความสามารถระดับโลกและวิศวกรรมที่ซับซ้อน นี่แสดงถึงการกำหนดกรอบใหม่พื้นฐานของวิธีการคิดและสร้างข้อมูลการฝึก AI
ความท้าทายทางเทคนิคและผลกระทบต่อตลาด
ชุมชนได้สังเกตเห็นความคล้ายคลึงที่น่าสนใจในประวัติการพัฒนา AI ในขณะที่ Google มุ่งเน้นไปที่ AI เล่นเกมอย่าง AlphaGo , OpenAI มุ่งเน้นไปที่การประมวลผลภาษาธรรมชาติ ซึ่งท้ายที่สุดนำไปสู่การใช้งานเชิงพาณิชย์ที่เป็นไปได้มากกว่า นี่เน้นย้ำว่าการเลือกข้อมูลการฝึกสามารถกำหนดความสำเร็จในตลาดได้ ไม่ใช่แค่ความสำเร็จทางเทคนิคเท่านั้น
วิธีการเรียนรู้เสริมแรงปัจจุบันที่มีรางวัลที่ตรวจสอบได้แสดงให้เห็นความหวังสำหรับงานการใช้เหตุผลเชิงรูปแบบ เช่น การพิสูจน์ทฤษฎีบทและการแก้ปริศนา อย่างไรก็ตาม วิธีการเหล่านี้ยังไม่เพียงพอเมื่อต้องจัดการกับสถานการณ์โลกแห่งความเป็นจริงแบบเปิดที่ความสำเร็จไม่สามารถตรวจสอบได้ง่ายๆ ว่าถูกหรือผิด
การอภิปรายแสดงให้เห็นว่าความก้าวหน้าของ AI ในอนาคตจะขึ้นอยู่กับการสร้างระบบรางวัลที่ดีกว่าและสภาพแวดล้อมการเรียนรู้เสริมแรงที่ซับซ้อนมากขึ้น กลไกการให้คะแนนแบบง่ายไม่สามารถประเมินได้ว่า AI จะเป็นทนายความหรือวิศวกรที่มีประสิทธิภาพหรือไม่ การประเมินเหล่านี้ต้องการความเข้าใจในประสิทธิภาพที่ซับซ้อนและตามบริบทในหลายมิติ
บทสรุป
การเปลี่ยนแปลงนี้แสดงถึงมากกว่าแค่วิวัฒนาการทางเทคนิค มันส่งสัญญาณถึงการเปลี่ยนแปลงพื้นฐานในวิธีที่อุตสาหกรรม AI ให้คุณค่าและรวมความเชี่ยวชาญของมนุษย์ เมื่อโมเดลมีความสามารถมากขึ้น คอขวดจะเปลี่ยนจากพลังการคำนวณดิบไปสู่คุณภาพของสภาพแวดล้อมการเรียนรู้และความลึกของความรู้ที่พวกมันสามารถจำลองได้ อนาคตของการพัฒนา AI ดูเหมือนจะไม่ได้อยู่ที่การแทนที่ความเชี่ยวชาญของมนุษย์ แต่ในการหาวิธีที่ซับซ้อนมากขึ้นในการจับและถ่ายทอดความเชี่ยวชาญนั้นไปยังระบบประดิษฐ์
อ้างอิง: Sweatshop data is over