Google เปิดตัว Gemini CLI Agent โอเพนซอร์สสำหรับ Command Line Interface ของนักพัฒนา

ทีมบรรณาธิการ BigGo

Google เปิดตัว Gemini CLI Agent โอเพนซอร์สสำหรับ Command Line Interface ของนักพัฒนา

Google ได้เปิดเผยการเพิ่มเครื่องมือสำคัญในชุดเครื่องมือ AI ด้วยการแนะนำ Gemini CLI ซึ่งเป็นเอเจนต์ปัญญาประดิษฐ์แบบโอเพนซอร์สที่ออกแบบมาเฉพaะสำหรับ command-line interface เครื่องมือใหม่นี้แสดงถึงการเคลื่อนไหวเชิงกลยุทธ์เพื่อนำความสามารถ AI ขั้นสูงเข้าสู่สภาพแวดล้อม terminal ของนักพัฒนาโดยตรง โดยไม่จำเป็นต้องใช้แชทบอทแยกต่างหากหรือสภาพแวดล้อมการพัฒนาแบบบูรณาการสำหรับงานเขียนโค้ดหลายๆ อย่าง


แนะนำ Gemini CLI : ตัวแทน AI โอเพนซอร์สใหม่ของ Google ที่ออกแบบมาสำหรับอินเทอร์เฟซบรรทัดคำสั่ง

ขับเคลื่อนด้วยเทคโนโลยี AI ขั้นสูง

Gemini CLI ใช้โมเดลการใช้เหตุผล Gemini 2.5 Pro ของ Google เป็นเครื่องยนต์หลัก ซึ่งให้ผู้ใช้เข้าถึงหน้าต่างบริบทขนาดใหญ่ถึงหนึ่งล้านโทเค็น ความจุบริบทที่กว้างขวางนี้ช่วยให้ AI เข้าใจและทำงานกับโค้ดและเอกสารจำนวนมากได้พร้อมกัน เครื่องมือนี้ขยายไปเกินกว่าความสามารถพื้นฐานของโมเดลโดยการรวม Google Search เพื่อเข้าถึงข้อมูลแบบเรียลไทม์ ทำให้นักพัฒนามีข้อมูลปัจจุบันควบคู่ไปกับฐานความรู้ที่มีอยู่ของโมเดล

ข้อมูลจำเพาะทางเทคนิค

รุ่น: โมเดล Gemini 2.5 Pro reasoning
หน้าต่างบริบท: 1 ล้านโทเค็น
ข้อจำกัดการใช้งาน: 60 คำขอต่อนาที, 1,000 คำขอต่อวัน
การผสานรวม: Google Search , Model Context Protocol ( MCP )
คุณสมบัติเพิ่มเติม: เครื่องมือ AI Veo และ Imagen สำหรับการสร้างมัลติมีเดีย

สถาปัตยกรรมโอเพนซอร์สและความสามารถในการขยาย

ความปลอดภัยและความโปร่งใสยังคงเป็นหัวใจของปรัชญาการออกแบบของ Gemini CLI เครื่องมือนี้เป็นโอเพนซอร์สอย่างสมบูรณ์ ช่วยให้นักพัฒนาสามารถตรวจสอบโค้ดก่อนการติดตั้งและรับประกันการตรวจสอบความปลอดภัยจากเพื่อนร่วมงาน ระบบรองรับ Model Context Protocol ( MCP ) และข้อกำหนดเปิดอื่นๆ ที่กำลังเติบโต ช่วยให้ผู้ใช้สามารถเพิ่มแหล่งข้อมูลและส่วนขยายแบบกำหนดเองเพื่อปรับแต่งเครื่องมือให้เหมาะกับเวิร์กโฟลว์และความต้องการเฉพาะของตน

ความสามารถในการพัฒนาที่ครอบคลุม

Google วางตำแหน่ง Gemini CLI เป็นยูทิลิตี้อเนกประสงค์ที่ไปไกลกว่าการช่วยเหลือโค้ดแบบง่ายๆ เครื่องมือนี้ให้ความสามารถ AI ที่ทรงพลัง รวมถึงการเข้าใจโค้ด การจัดการไฟล์ การดำเนินการคำสั่ง และการแก้ไขปัญหาแบบไดนามิก นักพัฒนาสามารถเขียนโค้ด แก้ไขปัญหา และปรับปรุงเวิร์กโฟลว์โดยใช้คำสั่งภาษาธรรมชาติโดยตรงในสภาพแวดล้อม terminal นอกจากนี้ ระบบยังรวมความสามารถในการสร้างมัลติมีเดียผ่านเครื่องมือ AI Veo และ Imagen ของ Google ช่วยให้ผู้ใช้สามารถสร้างรูปภาพและวิดีโอเป็นส่วนหนึ่งของกระบวนการพัฒนา

การบูรณาการกับเครื่องมือพัฒนาที่มีอยู่

เอเจนต์ CLI ใหม่ทำงานร่วมกับ Gemini Code Assist สร้างระบบนิเวศการช่วยเหลือ AI แบบครบวงจรในสภาพแวดล้อมการพัฒนาที่แตกต่างกัน การบูรณาการนี้หมายความว่าไม่ว่านักพัฒนาจะชอบทำงานใน terminal หรือ IDE แบบดั้งเดิมอย่าง VSCode พวกเขาก็จะมีการเข้าถึงฟังก์ชันเอเจนต์ AI ที่สอดคล้องกัน Gemini Code Assist ได้รับการอัปเดตโหมดเอเจนต์เพื่อให้ตรงกับความสามารถที่เสนอโดยเวอร์ชัน CLI ทำให้มั่นใจในความเท่าเทียมของฟีเจอร์ในทุกแพลตฟอร์ม

การเปรียบเทียบคุณสมบัติหลัก

Gemini CLI: โอเพนซอร์ส ใช้งานผ่านเทอร์มินัล รองรับ context 1 ล้าน token ให้ทดลองใช้ฟรี
คู่แข่ง: Anthropic Claude , GitHub Copilot , Microsoft Windows Terminal AI
ข้อได้เปรียบ: มีโควต้าการใช้งานที่ใหญ่ที่สุดในอุตสาหกรรมตาม Google
การผสานรวม: ทำงานร่วมกับ Gemini Code Assist และ VSCode

การอนุญาตการใช้งานที่ใจกว้างและความพร้อมใช้งาน

Google เสนอ Gemini CLI เป็นการแสดงตัวอย่างฟรีผ่านบัญชี Google ส่วนบุคคล โดยให้สิ่งที่บริษัทอธิบายว่าเป็นการอนุญาตการใช้งานที่ใจกว้างที่สุดในอุตสาหกรรม ผู้ใช้ได้รับการเข้าถึงคำขอโมเดล 60 ครั้งต่อนาทีและ 1,000 คำขอต่อวันผ่านใบอนุญาต Gemini Code Assist ฟรี การจัดสรรที่มากมายนี้ทำให้เครื่องมือมีความสามารถในการแข่งขันกับโซลูชัน AI สำหรับการเขียนโค้ดอื่นๆ รวมถึง Claude ของ Anthropic , GitHub Copilot และการบูรณาการแชทบอท AI ของ Microsoft ใน Windows Terminal เวอร์ชันแสดงตัวอย่างพร้อมให้ติดตั้งทันที แม้ว่า Google ยังไม่ได้เปิดเผยแผนราคาสำหรับผู้ใช้ที่เกินขีดจำกัดปัจจุบันหรือสำหรับการเปิดตัวเต็มรูปแบบของเครื่องมือในที่สุด

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌