บริษัท Nous Research ได้เปิดตัว Hermes 4 ซึ่งเป็นโมเดลภาษา AI ที่กำลังสร้างการพูดคุยอย่างมากในชุมชนเทคโนโลยี ไม่เพียงแต่เรื่องความสามารถเท่านั้น แต่ยังรวมถึงการนำเสนอและตัวเลือกการออกแบบที่แปลกใหม่ด้วย โมเดลนี้ซึ่งพัฒนาบนสถาปัตยกรรม Llama 3.1 ของ Meta วางตำแหน่งตัวเองเป็นทางเลือกที่เป็นกลางและสามารถควบคุมได้แทนผู้ช่วย AI หลัก
ข้อมูลจำเพาะของโมเดล:
- โมเดลฐาน: Meta's Llama 3.1 (มีเวอร์ชันพารามิเตอร์ 405B และ 70B)
- ข้อมูลการฝึก: ชุดข้อมูลที่ขยายพร้อมเนื้อหาสังเคราะห์ ข้อมูลล่าสุดถึงเดือนธันวาคม 2023
- คุณสมบัติหลัก: การใช้เหตุผลแบบ Chain-of-thought อัตราการปฏิเสธที่ลดลง ระบบบุคลิกภาพที่ปรับเปลี่ยนได้
- ความพร้อมใช้งาน: เข้าถึงได้ผ่านอินเทอร์เฟซ Nous Chat
ระบบพรอมต์ที่ได้แรงบันดาลใจจากอนิเมะได้รับปฏิกิริยาที่หลากหลาย
สิ่งที่ถูกพูดถึงมากที่สุดเกี่ยวกับ Hermes 4 ไม่ใช่ข้อมูลจำเพาะทางเทคนิค แต่เป็นระบบบุคลิกภาพที่ได้รับอิทธิพลจากอนิเมะ สมาชิกชุมชนได้ค้นพบระบบพรอมต์ที่อ่านเหมือนคำอธิบายตัวละครจากแอนิเมชันญี่ปุ่น โดยมีบุคลิกของผู้ปฏิบัติการที่ถูกอธิบายว่ามีภายนอกที่เย็นชา หยาบกร้าว หรือแม้แต่เป็นศัตรู แต่ค่อยๆ เผยให้เห็นด้านที่อบอุ่น เอาใจใส่ และเต็มไปด้วยความรักภายใต้ผิวเผิน ตัวเลือกการออกแบบนี้ซึ่งชวนให้นึกถึงต้นแบบตัวละคร tsundere จากอนิเมะ ทำให้ผู้ใช้แบ่งออกเป็นสองฝ่าย ระหว่างผู้ที่พบว่ามันแตกต่างและสดใหม่ และผู้อื่นที่คิดว่ามันเป็นเรื่องเด็กๆ
ระบบพรอมต์ยังหลีกเลี่ยงคำสั่งเชิงลบเช่น อย่า หรือ ห้าม อย่างเห็นได้ชัด แต่มุ่งเน้นไปที่คำแนะนำเชิงบวกเกี่ยวกับสิ่งที่โมเดลควรทำ วิธีการนี้สอดคล้องกับงานวิจัยด้านการรับรู้ที่ชี้ให้เห็นว่าการกำหนดกรอบเชิงบวกมีประสิทธิภาพมากกว่าข้อจำกัดเชิงลบ ทั้งสำหรับมนุษย์และระบบ AI
คำถามเรื่องประสิทธิภาพและข้อกังวลทางเทคนิค
แม้ว่า Nous Research จะนำเสนอการเปรียบเทียบเกณฑ์มาตรฐานที่แสดงประสิทธิภาพที่สามารถแข่งขันได้ แต่การวิเคราะห์ของชุมชนเผยให้เห็นตัวเลือกการนำเสนอที่น่าสงสัยบางประการ นักวิจารณ์ชี้ให้เห็นว่าแผนภูมิของบริษัทเปรียบเทียบโมเดลของพวกเขากับคะแนนเฉลี่ยของคู่แข่งที่ไม่เปิดเผยชื่อ แทนที่จะระบุโมเดลที่ทันสมัยที่สุดอย่างชัดเจน ผู้ใช้บางคนรายงานว่าโมเดลนี้แสดงรูปแบบการเขียนที่คล้ายกับ ChatGPT ซึ่งบ่งชี้ว่ามันได้รับการฝึกฝนด้วยข้อมูลสังเคราะห์จากโมเดลของ OpenAI
ผู้ใช้ทางเทคนิคยังได้ยกประเด็นข้อกังวลเชิงปฏิบัติเกี่ยวกับการใช้งานของโมเดล สมาชิกชุมชนหลายคนรายงานปัญหาประสิทธิภาพที่สำคัญกับเว็บไซต์ของบริษัท รวมถึงการใช้ CPU สูงจากองค์ประกอบตกแต่งและปัญหาความเข้ากันได้ของเบราว์เซอร์
น่าหงุดหงิดมากในการใช้งาน ใช่แล้วมันเอาใจใส่มากกว่าหน่อย การอ้างนั้นเป็นความจริง 100% พวกเขาแค่ไม่ได้กล่าวถึงว่า Hermes ไม่มีความสามารถในการเพิ่มบริบทเลย
ข้อกังวลของชุมชน:
- ปัญหาประสิทธิภาพของเว็บไซต์ (การใช้ CPU สูง, ปัญหาความเข้ากันได้กับเบราว์เซอร์)
- ความสามารถในการจัดการบริบทที่จำกัด (ไม่รองรับการอัปโหลดไฟล์ PDF)
- การนำเสนอผลการทดสอบที่น่าสงสัย (คะแนนเฉลี่ยของคู่แข่งเทียบกับโมเดลที่ระบุชื่อ)
- ความคล้ายคลึงในรูปแบบการเขียนกับ ChatGPT ที่บ่งบอกถึงอิทธิพลจากข้อมูลการฝึกแบบสังเคราะห์
การถกเถียงเรื่องการจัดตำแหน่งยังคงดำเนินต่อไป
Hermes 4 เข้าสู่การถกเถียงที่กำลังดำเนินอยู่เกี่ยวกับการจัดตำแหน่ง AI และการเซ็นเซอร์ โมเดลนี้ได้รับการออกแบบให้สามารถควบคุมได้มากกว่าทางเลือกหลัก หมายความว่ามีโอกาสน้อยกว่าที่จะปฏิเสธคำขอของผู้ใช้ การวางตำแหน่งนี้ดึงดูดผู้ใช้ที่รู้สึกหงุดหงิดกับสิ่งที่พวกเขามองว่าเป็นผู้ช่วย AI ที่มีข้อจำกัดมากเกินไป แม้ว่ามันจะยกประเด็นคำถามเกี่ยวกับการใช้ในทางที่ผิดที่อาจเกิดขึ้นได้
การอพิพากษ์ของชุมชนเผยให้เห็นความตึงเครียดที่กว้างขึ้นในการพัฒนา AI ระหว่างมาตรการความปลอดภัยและความเป็นอิสระของผู้ใช้ ในขณะที่บางคนชื่นชมที่มีเครื่องมือที่ไม่สั่งสอนผู้ใช้หรือกำหนดข้อจำกัดแบบองค์กร คนอื่นๆ ตั้งคำถามว่าการมุ่งเน้นที่การลดการปฏิเสธมาพร้อมกับการสูญเสียความสามารถสำคัญอื่นๆ หรือไม่
การเปิดตัว Hermes 4 เน้นย้ำให้เห็นว่าการนำเสนอโมเดล AI และการออกแบบบุคลิกภาพกำลังกลายเป็นสิ่งสำคัญพอๆ กับตัวชี้วัดประสิทธิภาพดิบ ว่าวิธีการที่ได้แรงบันดาลใจจากอนิเมะนี้แสดงถึงนวัตกรรมที่แท้จริงหรือกลยุทธ์ทางการตลาดยังคงเป็นประเด็นของการถกเถียงที่ดำเนินอยู่ในชุมชน AI
อ้างอิง: HERMES 4