Google ได้เปิดตัว Gemini CLI GitHub Actions ซึ่งเป็นผู้ช่วยเขียนโค้ด AI ตัวใหม่ที่ผสานรวมเข้ากับ workflow ของ GitHub โดยตรง อย่างไรก็ตาม การเปิดตัวครั้งนี้ได้สร้างความสับสนอย่างมากในหมู่นักพัฒนาที่ประสบปัญหาในการทำความเข้าใจกับผลิตภัณฑ์ AI ของ Google ที่มีการแยกส่วนมากขึ้นเรื่อยๆ
วิกฤตเรื่องตัวตนผลิตภัณฑ์ทำให้นักพัฒนาหงุดหงิด
การตอบสนองจากชุมชนเผยให้เห็นความหงุดหงิดอย่างลึกซึ้งต่อแนวทางการพัฒนาผลิตภัณฑ์ AI ของ Google นักพัฒนาตั้งคำถามว่าผลิตภัณฑ์นี้เป็นเครื่องมือ command-line interface จริงๆ หรือเป็น GitHub Action หรือเป็นอย่างอื่น การตั้งชื่อได้สร้างความสับสนเป็นพิเศษเนื่องจากผลิตภัณฑ์นี้ไม่ทำงานเหมือน CLI แบบดั้งเดิมเมื่อใช้ผ่าน GitHub
นักพัฒนาที่มีประสบการณ์หลายคน รวมถึงผู้ที่มีประสบการณ์กับแพลตฟอร์ม Google มากกว่าทศวรรษ รายงานว่าไม่สามารถเข้าใจได้อย่างชัดเจนว่าผลิตภัณฑ์นี้ทำอะไรจริงๆ ออกแบบมาสำหรับใคร หรือราคาเท่าไหร่ ความสับสนนี้ขยายไปไกลกว่าผู้ใช้ทั่วไปไปถึงผู้จัดการวิศวกรรมที่มีงบประมาณ AI และกำลังมองหาเครื่องมือพัฒนาที่ดีกว่า
โซลูชันที่แข่งขันกันหลายตัวภายใน Ecosystem ของ Google
การเปิดตัวครั้งนี้เพิ่มเติมในสนามที่แออัดไปด้วยเครื่องมือเขียนโค้ด AI ของ Google อยู่แล้ว นักพัฒนาได้ระบุ coding agent จาก Google อย่างน้อยสามตัวที่แยกจากกัน ได้แก่ Jules (ที่ทำงานใน virtual machine), Gemini CLI ตัวเดิม (สำหรับการพัฒนาในเครื่อง), และตอนนี้ก็มี GitHub Actions variant นี้ แต่ละตัวทำงานในสภาพแวดล้อมที่แตกต่างกันและให้บริการ use case ที่ซ้อนทับกัน
การแยกส่วนนี้ได้นำไปสู่การวิพากษ์วิจารณ์ว่า Google ขาดวิสัยทัศน์ที่เป็นเอกภาพสำหรับเครื่องมือพัฒนา AI สถานการณ์นี้ยิ่งซับซ้อนขึ้นด้วยความซับซ้อนของการยืนยันตัวตน ซึ่งผลิตภัณฑ์ AI ของ Google ที่แตกต่างกันต้องการระบบ credential และระดับการสมัครสมาชิกที่แตกต่างกัน
การเปรียบเทียบเครื่องมือ AI สำหรับการเขียนโค้ดของ Google :
- Jules: ทำงานในสภาพแวดล้อม VM แบบอะซิงโครนัสบนการ checkout โค้ดแยกต่างหาก
- Gemini CLI: เครื่องมือเทอร์มินัลในเครื่อง การโต้ตอบแบบซิงโครนัสของผู้ใช้บนเครื่องของตัวเอง
- Gemini CLI GitHub Actions: ทำงานใน GitHub Action runners บนการ checkout แยกต่างหาก แบบคลาวด์เบส
ความซับซ้อนของการยืนยันตัวตนและการสมัครสมาชิก
จุดเจ็บปวดที่สำคัญที่ชุมชนเน้นย้ำคือโมเดลการสมัครสมาชิกที่ซับซ้อนของ Google ซึ่งแตกต่างจากคู่แข่งอย่าง Claude ที่เสนอการสมัครสมาชิกรายเดือนที่เข้าใจง่ายและครอบคลุมฟีเจอร์ทั้งหมด บริการ AI ของ Google ถูกแบ่งออกเป็นหลายแผนที่มีขอบเขตไม่ชัดเจน
เวอร์ชัน GitHub Actions ไม่สามารถยืนยันตัวตนโดยใช้ระบบ OAuth เดียวกับ Gemini CLI มาตรฐาน แต่ต้องใช้ API key จาก Google AI Studio แทน สิ่งนี้สร้างแรงเสียดทานเพิ่มเติมและจำกัดการเข้าถึงสำหรับระดับผู้ใช้บางกลุ่ม แม้ว่า Google จะอ้างถึงฟีเจอร์ความปลอดภัยระดับองค์กร
คุณสมบัติด้านความปลอดภัย:
- Workload Identity Federation (WIF) สำหรับการยืนยันตัวตนแบบไม่ต้องใช้ข้อมูลประจำตัว
- การจัดทำรายการคำสั่งที่อนุญาตเพื่อควบคุมคำสั่ง shell อย่างละเอียด
- การรวม OpenTelemetry เพื่อความโปร่งใสและการตรวจสอบที่สมบูรณ์
- การสร้างตัวตนแบบกำหนดเองพร้อมการควบคุมสิทธิ์อย่างแม่นยำ
ปัญหา Rate Limiting ขัดขวางการใช้งานจริง
นักพัฒนารายงานปัญหา rate limiting ที่รุนแรงซึ่งทำให้ tier ฟรีแทบไม่สามารถใช้งานได้สำหรับงานพัฒนาจริง ผู้ใช้อธิบายว่าถึงขีดจำกัดหลังจากเพียง 5-6 คำขอ โดยบางคนประสบปัญหาข้อจำกัดหลังจากงานที่ซับซ้อนเพียงครั้งเดียว สิ่งนี้ตรงกันข้ามอย่างสิ้นเชิงกับการอ้างของ Google เกี่ยวกับโควต้าฟรีที่ใจกว้าง
ปัญหา rate limiting มีปัญหาเป็นพิเศษสำหรับ autonomous coding agent ซึ่งอาจติดอยู่ใน loop หรือไม่สามารถทำงานให้เสร็จสิ้นเมื่อการเรียก API ถูกจำกัด นักพัฒนาบางคนได้หันไปสร้าง API key หลายตัวผ่านเพื่อนเพื่อหาทางแก้ไขข้อจำกัดเหล่านี้
สามเวิร์กโฟลว์หลักที่นำเสนอ:
- การคัดกรองปัญหาอัจฉริยะ: การวิเคราะห์อัตโนมัติ การติดป้ายกำกับ และการจัดลำดับความสำคัญของปัญหาใหม่
- การตรวจสอบ Pull Request แบบเร่งรัด: ข้อเสนอแนะเกี่ยวกับคุณภาพโค้ด รูปแบบ และความถูกต้องที่ขับเคลื่อนด้วย AI
- การทำงานร่วมกันแบบตามต้องการ: การกล่าวถึง @gemini-cli สำหรับการมอบหมายงานใน issues และ PRs
การผสานรวมที่จำกัดกับ Ecosystem ของ Google เอง
สิ่งที่น่าประหลาดใจที่สุดคือนักพัฒนาสังเกตว่า Gemini ทำงานได้ไม่ดีแม้แต่ภายใน product ecosystem ของ Google เอง ผู้ใช้รายงานว่า AI ไม่สามารถทำงานพื้นฐานได้ เช่น การสร้างนัดหมายในปฏิทิน การแก้ไข Google Docs นอกเหนือจากการแทรกข้อความง่ายๆ หรือการช่วยเหลือเกี่ยวกับสูตร Google Sheets อย่างมีประสิทธิภาพ
Gemini ไม่สามารถสร้างนัดหมายในปฏิทินระหว่างฉันกับคนอื่นเป็นเวลา 30 นาทีในสัปดาห์หน้าได้ ที่จริงแล้วมันยังสร้างนัดหมายไม่ได้เลย
ข้อจำกัดนี้ดูแปลกเป็นพิเศษเมื่อพิจารณาจากการเข้าถึงข้อมูลผู้ใช้อย่างกว้างขวางของ Google และชุดผลิตภัณฑ์ที่ผสานรวมของพวกเขา
การเปิดตัว Gemini CLI GitHub Actions แสดงถึงความพยายามของ Google ในการแข่งขันในพื้นที่ผู้ช่วยเขียนโค้ด AI แต่การดำเนินการได้เน้นย้ำถึงความท้าทายขององค์กรในวงกว้าง การตอบสนองจากชุมชนแสดงให้เห็นว่าแม้ว่า Google จะมีความสามารถ AI ที่แข็งแกร่ง แต่แนวทางการพัฒนาผลิตภัณฑ์และประสบการณ์ผู้ใช้ของพวกเขาต้องการการปรับปรุงอย่างมากเพื่อแข่งขันอย่างมีประสิทธิภาพกับคู่แข่งที่มีความเฉพาะเจาะจงมากกว่า
อ้างอิง: Meet your new Al coding teammate: Gemini CLI GitHub Actions