Open Codex เครื่องมือช่วยเหลือด้าน AI แบบคอมมานด์ไลน์ที่มีน้ำหนักเบาซึ่งแปลงภาษาธรรมชาติเป็นคำสั่งเชลล์ กำลังพัฒนาตามข้อเสนอแนะจากชุมชน แม้ว่าในตอนแรกจะเปิดตัวด้วย Phi-4-mini ของ Microsoft เป็นโมเดลเริ่มต้น การสนทนาเผยให้เห็นถึงแผนการขยายการสนับสนุนสำหรับโมเดลภาษาท้องถิ่นเพิ่มเติม โดยเฉพาะอย่างยิ่ง Qwen 2.5
การเลือกโมเดลจุดประกายการสนทนาในชุมชน
การเลือก Phi-4-mini เป็นโมเดลเริ่มต้นของ Open Codex ได้สร้างการสนทนาที่สำคัญในหมู่ผู้ใช้ นักพัฒนา codingmoh ได้ปกป้องการตัดสินใจนี้โดยอ้างถึงอัตราส่วนคุณภาพต่อขนาดที่น่าประทับใจและประสิทธิภาพที่ดีในงานการให้เหตุผลหลายขั้นตอน คณิตศาสตร์ การดึงข้อมูลแบบมีโครงสร้าง และงานความเข้าใจโค้ด อย่างไรก็ตาม สมาชิกในชุมชนได้แนะนำทางเลือกอื่นที่สอดคล้องกับแนวโน้มปัจจุบัน
ผมเลือก Phi เป็นโมเดลเริ่มต้นเพราะหลังจากทดสอบบ้างแล้ว ผมรู้สึกประหลาดใจอย่างจริงใจกับคุณภาพที่สูงเมื่อเทียบกับขนาดและความเร็ว การตอบสนองรู้สึกดีกว่าในงานการให้เหตุผลบางอย่าง แต่ทำงานบนฮาร์ดแวร์ที่น้อยกว่ามาก
ผู้ใช้หลายคนชี้ไปที่ Qwen 2.5 Coder ว่าเป็นมาตรฐานปัจจุบันสำหรับโมเดลขนาดเล็กที่เน้นโค้ด เพื่อตอบสนองต่อข้อเสนอแนะนี้ นักพัฒนาได้ให้คำมั่นที่จะเพิ่มการสนับสนุนสำหรับ Qwen 2.5 เป็นลำดับถัดไป โดยยอมรับคุณค่าในการเปรียบเทียบโมเดลที่แตกต่างกันเคียงข้างกันสำหรับงานเชลล์ในทางปฏิบัติ
ความท้าทายในการผสานรวมทางเทคนิค
ผู้ใช้บางคนรายงานปัญหาความเข้ากันได้เมื่อพยายามใช้ Open Codex กับโมเดลขนาดเล็กอื่นๆ ที่มีอยู่ผ่าน Ollama เช่น DeepSeek Coder v2 สิ่งนี้เน้นย้ำถึงความท้าทายทางเทคนิคในการสนับสนุนระบบนิเวศที่หลากหลายของโมเดลภาษาท้องถิ่น ซึ่งแต่ละโมเดลมีความต้องการทรัพยากรและความสามารถที่แตกต่างกัน
การมุ่งเน้นของนักพัฒนาที่มีต่อโมเดล Phi ดูเหมือนจะได้รับแรงจูงใจบางส่วนจากความกังวลเกี่ยวกับการเข้าถึงฮาร์ดแวร์ โดยการให้ความสำคัญกับโมเดลที่สามารถทำงานได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์ที่ไม่ซับซ้อน (แม้แต่รายงานว่าทำงานบน Raspberry Pi สำหรับเวอร์ชัน quantized ของ Phi-1.5 และ Phi-2) Open Codex ยังคงยึดมั่นในความมุ่งมั่นที่จะเป็นเครื่องมือท้องถิ่นอย่างแท้จริงและสามารถเข้าถึงได้โดยไม่ต้องใช้ฮาร์ดแวร์ที่มีประสิทธิภาพสูง
คุณสมบัติปัจจุบันและที่วางแผนไว้ของ Open Codex
คุณสมบัติปัจจุบัน:
- การแปลงภาษาธรรมชาติเป็นคำสั่ง Shell โดยใช้โมเดลในเครื่อง
- โหมดการโต้ตอบแบบครั้งเดียว
- รองรับหลายแพลตฟอร์ม (macOS, Linux, Windows)
- การยืนยันคำสั่งก่อนดำเนินการ
- การผสานกับคลิปบอร์ด
- การแสดงผลในเทอร์มินัลแบบมีสี
คุณสมบัติที่วางแผนไว้:
- โหมดโต้ตอบที่รับรู้บริบท
- TUI ด้วย textual หรือ rich
- รองรับโมเดล OSS เพิ่มเติม (รวมถึง Qwen 2.5)
- โหมดแชทแบบโต้ตอบเต็มรูปแบบ
- รองรับการเรียกใช้ฟังก์ชัน
- การป้อนข้อมูลด้วยเสียงผ่าน Whisper
- ประวัติคำสั่งและการยกเลิก
- ระบบปลั๊กอินสำหรับเวิร์กโฟลว์
การเปลี่ยนแปลงไปสู่เครื่องมือ AI แบบท้องถิ่น
Open Codex แสดงถึงแนวโน้มที่เพิ่มขึ้นของเครื่องมือ AI แบบท้องถิ่นอย่างเต็มรูปแบบที่ไม่ต้องการคีย์ API หรือการเชื่อมต่อกับคลาวด์ วิธีการนี้ให้ข้อได้เปรียบในด้านความเป็นส่วนตัว ต้นทุน และการปรับแต่ง ไม่เหมือนกับ OpenAI Codex ต้นฉบับที่เป็นแรงบันดาลใจ Open Codex ทำงานทั้งหมดบนเครื่องของผู้ใช้
การสนทนาในชุมชนยังเปิดเผยว่าในขณะที่ OpenAI Codex เพิ่งรวมการสนับสนุนสำหรับผู้ให้บริการหลายราย Open Codex น่าจะได้รับการพัฒนาก่อนการเปลี่ยนแปลงนี้ จังหวะเวลานี้อธิบายความแตกต่างทางสถาปัตยกรรมบางอย่างระหว่างระบบทั้งสอง แม้จะมีชื่อที่คล้ายกัน
ในขณะที่เครื่องมือ AI ยังคงพัฒนาต่อไป ความสมดุลระหว่างความสามารถของโมเดลและความต้องการด้านฮาร์ดแวร์ยังคงเป็นข้อพิจารณาสำคัญ แผนงานของ Open Codex รวมถึงการเพิ่มการสนับสนุนสำหรับโมเดลโอเพ่นซอร์สเพิ่มเติม โหมดแชทแบบโต้ตอบ การสนับสนุนการเรียกฟังก์ชัน และแม้แต่การป้อนข้อมูลด้วยเสียงผ่าน Whisper ซึ่งบ่งชี้ถึงความมุ่งมั่นในการขยายฟังก์ชันการทำงานในขณะที่ยังคงรักษาแนวทางที่เน้นความเป็นท้องถิ่นเป็นอันดับแรก
อ้างอิง: Open Codex