Google ได้เปิดให้บริการโมเดล Gemini 2.5 Flash และ Pro อย่างเป็นทางการ พร้อมกับเปิดตัวเวอร์ชัน Flash-Lite ใหม่ อย่างไรก็ตาม การประกาศครั้งนี้ได้จุดประกายการอภิปรายอย่างมากในชุมชนนักพัฒนา เนื่องจากการเพิ่มราคาอย่างมากที่ไม่ได้ถูกเน้นย้ำในโพสต์บล็อกอย่างเป็นทางการ
การเพิ่มราคาแบบซ่อนเร้นทำให้นักพัฒนาตกใจ
การเปลี่ยนผ่านจากเวอร์ชันพรีวิวสู่เวอร์ชันเสถียรได้นำมาซึ่งการเปลี่ยนแปลงราคาอย่างมากสำหรับ Gemini 2.5 Flash ค่าใช้จ่าย input เพิ่มขึ้นเป็นสองเท่าจาก 0.15 เหรียญสหรัฐเป็น 0.30 เหรียญสหรัฐต่อโทเค็นหนึ่งล้านตัว ในขณะที่ราคา output พุ่งขึ้นจาก 0.60 เหรียญสหรัฐเป็น 2.50 เหรียญสหรัฐต่อโทเค็นหนึ่งล้านตัวสำหรับโหมดที่ไม่ใช่ thinking - เพิ่มขึ้น 4 เท่า ชุมชนได้วิพากษ์วิจารณ์ Google ที่ลดความสำคัญของการเปลี่ยนแปลงเหล่านี้ โดยโพสต์บล็อกเพียงแค่กล่าวถึงการลดลงจาก 3.50 เหรียญสหรัฐเป็น 2.50 เหรียญสหรัฐสำหรับ output ของโหมด thinking เท่านั้น
ข่าวจริงคือ output ที่ไม่ใช่ thinking ตอนนี้แพงขึ้น 4 เท่า ซึ่งพวกเขาหลีกเลี่ยงการกล่าวถึงในบล็อกอย่างระมัดระวัง โดยเปรียบเทียบเฉพาะราคาของ thinking เท่านั้น
กลยุทธ์การตั้งราคานี้ส่งผลกระทบต่อนักพัฒนาที่สร้างแอปพลิเคชันในช่วงพรีวิว โดยเฉพาะผู้ที่ใช้โหมดที่ไม่ใช่ thinking สำหรับงานที่ต้องการความเร็ว เช่น voice AI หรือแอปพลิเคชันแบบเรียลไทม์
การเปลี่ยนแปลงราคา Gemini 2.5 Flash
เมตริก | ราคาช่วง Preview | ราคา Stable ใหม่ | การเพิ่มขึ้น |
---|---|---|---|
Input tokens | $0.15/ล้าน | $0.30/ล้าน | 2 เท่า |
Output (non-thinking) | $0.60/ล้าน | $2.50/ล้าน | 4.2 เท่า |
Output (thinking) | $3.50/ล้าน | $2.50/ล้าน | 0.7 เท่า (ลดลง) |
Audio tokens | $1.00/ล้าน | $1.00/ล้าน | ไม่เปลี่ยนแปลง |
Flash-Lite กลายเป็นทางเลือกประหยัด
Google ได้เปิดตัว Gemini 2.5 Flash-Lite ในฐานะตัวเลือกที่ประหยัดที่สุด โดยวางตำแหน่งให้แข่งขันกับโมเดล 2.0 Flash รุ่นเก่า เวอร์ชันใหม่นี้ยังคงมี context window 1 ล้านโทเค็นและความสามารถแบบ multimodal พร้อมเสนอเวลาตอบสนองที่เร็วกว่า มักจะต่ำกว่า 400 มิลลิวินาที อย่างไรก็ตาม การทดสอบเบื้องต้นแสดงให้เห็นว่าอาจไม่เทียบเท่าประสิทธิภาพของโมเดล Flash แบบเต็มสำหรับงานที่ซับซ้อน
ค่าใช้จ่ายในการประมวลผลเสียงก็เพิ่มขึ้นอย่างมากทั่วทุกโมเดล โดย Flash-Lite เรียกเก็บ 0.50 เหรียญสหรัฐต่อโทเค็นหนึ่งล้านตัว เมื่อเปรียบเทียบกับ 2.0 Flash-Lite รุ่นก่อนที่เรียกเก็บ 0.075 เหรียญสหรัฐ - แสดงถึงการเพิ่มขึ้น 6.3 เท่า
คุณสมบัติหลักของ Gemini 2.5 Flash-Lite
- หน้าต่างบริบท: 1 ล้านโทเค็น
- เวลาตอบสนong: โดยทั่วไปต่ำกว่า 400 มิลลิวินาที และต่ำสุดที่ 200 มิลลิวินาที
- ความสามารถ: รับข้อมูลแบบหลายรูปแบบ, การผสานรวมกับ Google Search, การรันโค้ด
- โหมดการคิด: มีให้ใช้งานพร้อมงบประมาณที่ปรับได้
- การวางตำแหน่ง: โมเดลที่คุ้มค่าที่สุดในตระกูล 2.5
ปฏิกิริยาของชุมชนแบ่งออกเรื่องคุณภาพโมเดล
ความคิดเห็นของนักพัฒนาเกี่ยวกับการอัปเดตล่าสุดของ Gemini แสดงผลลัพธ์ที่หลากหลาย ในขณะที่ผู้ใช้บางคนชื่นชมประสิทธิภาพการเขียนโค้ดที่ดีขึ้นและ context window ขนาดใหญ่ ผู้อื่นรายงานการลดลงของคุณภาพเมื่อเปรียบเทียบกับเวอร์ชันพรีวิวก่อนหน้า นักพัฒนาหลายคนสังเกตเห็นปัญหาเกี่ยวกับการตอบสนองที่ยาวเยิ่น การใส่คอมเมนต์มากเกินไปในโค้ดที่สร้างขึ้น และประสิทธิภาพที่ไม่สม่ำเสมอ
ระบบการจำกัดอัตราก็ได้รับการวิพากษ์วิจารณ์เช่นกัน โดยผู้ใช้บางคนไม่สามารถเข้าถึงระดับการใช้จ่ายที่สูงขึ้นเนื่องจากข้อจำกัดคำขอที่เข้มงวด ทำให้พวกเขาต้องกลับไปใช้คู่แข่งอย่าง OpenAI แม้จะชอบความสามารถทางเทคนิคของ Gemini มากกว่า
การเปรียบเทียบราคาการประมวลผลเสียง
โมเดล | ราคาต่อล้าน Token |
---|---|
Gemini 2.0 Flash-Lite | $0.075 |
Gemini 2.5 Flash-Lite | $0.50 |
การเพิ่มขึ้นของราคา | 6.3 เท่า |
การตั้งราคาเชิงกลยุทธ์สะท้อนการเติบโตของตลาด
การเพิ่มราคาสอดคล้องกับแนวโน้มอุตสาหกรรมที่กว้างขึ้น เมื่อบริษัท AI เปลี่ยนจากการดึงดูดลูกค้าอย่างรุกรานไปสู่โมเดลธุรกิจที่ยั่งยืน การตั้งราคาต่ำมากในช่วงแรกของ Google ช่วยสร้างตำแหน่งในตลาด แต่ตอนนี้บริษัทดูเหมือนจะมั่นใจพอที่จะเรียกเก็บราคาตลาด การเปลี่ยนแปลงนี้สะท้อนถึงภูมิทัศน์ AI ที่เติบโตแล้ว ซึ่งผู้ให้บริการกำลังสร้างสมดุลระหว่างการปรับปรุงประสิทธิภาพกับความต้องการผลกำไร
การเปลี่ยนแปลงเหล่านี้เน้นย้ำถึงความท้าทายที่ต่อเนื่องสำหรับนักพัฒนาที่สร้างบนโมเดลพรีวิว ซึ่งความมั่นคงของราคาไม่ได้รับการรับประกันจนกว่าจะมีการเปิดให้บริการทั่วไป เมื่อตลาด AI ยังคงพัฒนาต่อไป บริษัทต่างๆ ต้องชั่งน้ำหนักระหว่างประโยชน์ของความสามารถที่ล้ำสมัยกับความเสี่ยงของต้นทุนและเงื่อนไขที่เปลี่ยนแปลงได้