แพลตฟอร์ม Plexe AI ก่อให้เกิดการอภิปรายในชุมชนเกี่ยวกับการจัดการข้อมูลและความโปร่งใสของโมเดล

ทีมชุมชน BigGo
แพลตฟอร์ม Plexe AI ก่อให้เกิดการอภิปรายในชุมชนเกี่ยวกับการจัดการข้อมูลและความโปร่งใสของโมเดล

ในโลกของปัญญาประดิษฐ์ที่พัฒนาอย่างรวดเร็ว แพลตฟอร์มใหม่ชื่อว่า Plexe กำลังสร้างความตื่นตัวโดยสัญญาว่าจะเปลี่ยนข้อมูลทางธุรกิจให้เป็นโมเดลแมชชีนเลิร์นนิงที่ปรับแต่งได้ โดยต้องใช้ความเชี่ยวชาญทางเทคนิคเพียงเล็กน้อย แพลตฟอร์มนี้ซึ่งเพิ่งได้รับความสนใจจากสื่อต่างๆ เช่น Business Insider และ Financial Times มีเป้าหมายที่จะทำให้การพัฒนา AI เป็นประชาธิปไตยสำหรับธุรกิจทุกขนาด อย่างไรก็ตาม ในขณะที่ผู้ใช้ยุคแรกเริ่มเริ่มใช้งานแพลตฟอร์ม คำถามสำคัญต่างๆ ก็เริ่มปรากฏขึ้นเกี่ยวกับการทำงานจริงของเทคโนโลยีเบื้องหลังและข้อจำกัดที่ผู้ใช้อาจพบ

ปัญหาคุณภาพข้อมูล

หนึ่งในการอภิปรายที่สำคัญที่สุดนั้นอยู่ที่การเตรียมและการทำความสะอาดข้อมูล ในขณะที่ Plexe ตลาดตัวเองเป็นโซลูชันที่สามารถจัดการการวิเคราะห์ข้อมูลและการจดจำรูปแบบได้โดยอัตโนมัติ ผู้ใช้กลับพบว่าคุณภาพข้อมูลยังคงเป็นปัจจัยสำคัญ เอเจนต์ของแพลตฟอร์มสามารถทำความสะอาดแบบอัตโนมัติในระดับหนึ่งได้ เช่น การเติมค่าที่ขาดหายไป แต่การปรับปรุงคุณภาพข้อมูลครั้งใหญ่ยังคงต้องอาศัยความเชี่ยวชาญในโดเมนของมนุษย์ สิ่งนี้เน้นย้ำถึงความเป็นจริงที่สำคัญในแวดวง AI: แม้แต่เครื่องมืออัตโนมัติที่ทันสมัยที่สุดก็ยังคงลำบากที่จะเข้าใจบริบททางธุรกิจโดยไม่มีคำแนะนำจากมนุษย์ ดังที่สมาชิกในชุมชนหนึ่งระบุไว้ การทำความเข้าใจว่าแพลตฟอร์มสรุปโครงสร้างข้อมูลและจัดการกับประเภทข้อมูลต่างๆ อย่างไร กลับกลายเป็นเรื่องท้าทายสำหรับผู้ใช้รุ่นแรกเริ่มบางส่วน

พื้นที่ปัญหานั้นน่าสนใจมาก ฟังดูเหมือนงานส่วนใหญ่จะเป็นการจัดการข้อมูลซึ่งเป็นปัญหาที่มีมาช้านาน

ทีมพัฒนาของแพลตฟอร์มได้ยอมรับความท้าทายเหล่านี้และกำลังทำงานเพื่อการปรับปรุง รวมถึงฟีเจอร์การเสริมข้อมูลที่ใช้ LLM ในการสร้างป้ายกำกับและเอกสารประกอบที่ดียิ่งขึ้นเกี่ยวกับกระบวนการทำความสะอาด

มากกว่าวิศวกรรมพรอมต์: โมเดลที่ปรับแต่งได้ เทียบกับ ตัวห่อหุ้ม LLM

ประเด็นชี้แจงที่สำคัญได้เกิดขึ้นเมื่อผู้ใช้ตั้งคำถามว่า Plexe เป็นเพียงการสร้างพรอมต์ที่ซับซ้อนสำหรับโมเดลภาษาขนาดใหญ่ที่มีอยู่หรือไม่ ทีมพัฒนาชี้แจงว่า Plexe จริงๆ แล้วสร้างโค้ดสำหรับไปป์ไลน์แมชชีนเลิร์นนิงแบบสมบูรณ์ซึ่งประมวลผลชุดข้อมูล ดำเนินการวิศวกรรมคุณลักษณะ และฝึกอบรมโมเดลที่ปรับแต่งได้เฉพาะสำหรับแต่ละกรณีใช้ การแบ่งแยกนี้มีความสำคัญเพราะโมเดลที่ฝึกอบรมมาโดยเฉพาะมักจะให้ประสิทธิภาพที่ดีกว่า ต้นทุนที่ต่ำกว่า และเวลาในการอนุมานที่เร็วกว่าเมื่อเทียบกับการรันการทำนายผ่าน LLM แบบทั่วไป โดยเฉพาะเมื่อธุรกิจมีข้อมูลที่เป็นกรรมสิทธิ์จำนวนมาก แพลตฟอร์มยังจัดการความรับผิดชอบด้าน MLOps เช่น การฝึกอบรมโมเดลใหม่และการประเมินประสิทธิภาพ โดยให้โซลูชันแบบครบวงจรแทนที่จะเป็นเพียงอินเทอร์เฟซสำหรับการทำนาย

ข้อจำกัดทางเทคนิคและวิธีแก้ปัญหา

การทดสอบโดยชุมชนได้เปิดเผยข้อจำกัดในปัจจุบันหลายประการของแพลตฟอร์ม โมเดลคอมพิวเตอร์วิทัศน์ยังไม่ได้รับการสนับสนุนอย่างเป็นทางการ แม้ว่าผู้ใช้ที่มีความเข้าใจทางเทคนิคจะพบวิธีแก้ปัญหาโดยการจัดเก็บภาพเป็นอาร์เรย์ของไบต์ในไฟล์ parquet แพลตฟอร์มในปัจจุบันมุ่งเน้นไปที่ข้อมูลแบบตารางเป็นหลัก โดยมีการสนับสนุนภาพ วิดีโอ และเสียงที่วางแผนไว้สำหรับการเปิดตัวในอนาคต เวลาในการฝึกอบรมยังแตกต่างกันอย่างมีนัยสำคัญ ตั้งแต่ 45 นาทีไปจนถึงหลายชั่วโมง ขึ้นอยู่กับความซับซ้อนของชุดข้อมูล และผู้ใช้ได้ร้องขอบ่งชี้ความคืบหน้าและเวลาที่คาดว่าจะแล้วเสร็จที่ดีขึ้นระหว่างการสร้างโมเดล ทีมแพลตฟอร์มได้ตอบสนองต่อคำติชมโดยเพิ่มสถานะ 'baseline_deployed' ที่ให้ผู้ใช้มีโมเดลเริ่มต้นเพื่อทดสอบในขณะที่โมเดลสุดท้ายกำลังฝึกอบรมให้เสร็จสิ้น

ความสามารถของแพลตฟอร์มในปัจจุบัน ประเภทข้อมูลที่รองรับ: ข้อมูลแบบตารางเป็นหลัก Computer Vision: ไม่รองรับอย่างเป็นทางการ (มีวิธีแก้ปัญหาชั่วคราวที่จำกัด) เวลาในการฝึกโมเดล: 45 นาทีถึงหลายชั่วโมง ฟีเจอร์หลัก: การวิเคราะห์ข้อมูลอัตโนมัติ, feature engineering, การฝึกโมเดลแบบกำหนดเอง, การจัดการ MLOps

  • ความโปร่งใส: ให้ข้อมูลเมตริกประสิทธิภาพ, รายละเอียดการฝึก, และคำอธิบายการทำนาย

แนวทางการมีมนุษย์ร่วมในกระบวนการ

บางทีข้อมูลเชิงลึกที่น่าสนใจที่สุดจากการอภิปรายในชุมชนคือวิธีที่ Plexe จัดตำแหน่งผู้ใช้เป็นผู้เชี่ยวชาญในโดเมน แทนที่จะเป็นผู้บริโภคเทคโนโลยี AI แบบ passively แพลตฟอร์มส่งเสริมการโต้ตอบผ่านอินเทอร์เฟสแชทที่ผู้ใช้สามารถให้บริบททางธุรกิจและตอบคำถามต่อเนื่องได้ ซึ่งจะช่วยให้เอเจนต์ AI ตัดสินใจได้ดีขึ้นเกี่ยวกับการประมวลผลข้อมูลและการสร้างโมเดล แนวทางการมีมนุษย์ร่วมในกระบวนการนี้ยอมรับว่าในขณะที่ AI สามารถทำงานทางเทคนิคให้เป็นอัตโนมัติได้ แต่ความเข้าใจในธุรกิจยังคงเป็นจุดแข็งของมนุษย์ การออกแบบของแพลตฟอร์มสะท้อนปรัชญานี้โดยมีความเห็นที่ชัดเจนเกี่ยวกับการทำให้ AI เข้าถึงได้สำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญ ในขณะที่ยังคงใช้ประโยชน์จากความรู้ในโดเมนของพวกเขา

ในขณะที่แพลตฟอร์ม AI ยังคงเติบโตอย่างต่อเนื่อง การสนทนาเกี่ยวกับ Plexe เน้นย้ำถึงวิวัฒนาการที่สำคัญในอุตสาหกรรม: การเปลี่ยนจากเครื่องมือสำหรับผู้เชี่ยวชาญด้าน ML ไปเป็นโซลูชันที่เพิ่มขีดความสามารถให้ผู้เชี่ยวชาญในโดเมน แม้ความท้าทายทางเทคนิคเกี่ยวกับคุณภาพข้อมูล ความโปร่งใสของโมเดล และข้อจำกัดของฟีเจอร์จะยังคงอยู่ แต่การมีส่วนร่วมของชุมชนบ่งชี้ถึงความสนใจอย่างมากในแพลตฟอร์มที่สามารถเชื่อมช่องว่างระหว่างความต้องการทางธุรกิจและความสามารถของ AI บทสนทนาอย่างต่อเนื่องระหว่างผู้ใช้และนักพัฒนาสาธิตให้เห็นว่าการทดสอบในโลกจริงกำลังกำหนดอนาคตของเครื่องมือพัฒนา AI ที่เข้าถึงได้อย่างไร

อ้างอิง: AI Data Scientist