Google เพิ่มราคา Gemini 2.5 Flash สูงขึ้นถึง 4 เท่าอย่างเงียบๆ พร้อมเปิดตัวโมเดล Flash-Lite ใหม่

ทีมบรรณาธิการ BigGo
Google เพิ่มราคา Gemini 2.5 Flash สูงขึ้นถึง 4 เท่าอย่างเงียบๆ พร้อมเปิดตัวโมเดล Flash-Lite ใหม่

Google ได้เปิดให้บริการโมเดล Gemini 2.5 Flash และ Pro อย่างเป็นทางการ พร้อมกับเปิดตัวเวอร์ชัน Flash-Lite ใหม่ อย่างไรก็ตาม การประกาศครั้งนี้ได้จุดประกายการอภิปรายอย่างมากในชุมชนนักพัฒนา เนื่องจากการเพิ่มราคาอย่างมากที่ไม่ได้ถูกเน้นย้ำในโพสต์บล็อกอย่างเป็นทางการ

การเพิ่มราคาแบบซ่อนเร้นทำให้นักพัฒนาตกใจ

การเปลี่ยนผ่านจากเวอร์ชันพรีวิวสู่เวอร์ชันเสถียรได้นำมาซึ่งการเปลี่ยนแปลงราคาอย่างมากสำหรับ Gemini 2.5 Flash ค่าใช้จ่าย input เพิ่มขึ้นเป็นสองเท่าจาก 0.15 เหรียญสหรัฐเป็น 0.30 เหรียญสหรัฐต่อโทเค็นหนึ่งล้านตัว ในขณะที่ราคา output พุ่งขึ้นจาก 0.60 เหรียญสหรัฐเป็น 2.50 เหรียญสหรัฐต่อโทเค็นหนึ่งล้านตัวสำหรับโหมดที่ไม่ใช่ thinking - เพิ่มขึ้น 4 เท่า ชุมชนได้วิพากษ์วิจารณ์ Google ที่ลดความสำคัญของการเปลี่ยนแปลงเหล่านี้ โดยโพสต์บล็อกเพียงแค่กล่าวถึงการลดลงจาก 3.50 เหรียญสหรัฐเป็น 2.50 เหรียญสหรัฐสำหรับ output ของโหมด thinking เท่านั้น

ข่าวจริงคือ output ที่ไม่ใช่ thinking ตอนนี้แพงขึ้น 4 เท่า ซึ่งพวกเขาหลีกเลี่ยงการกล่าวถึงในบล็อกอย่างระมัดระวัง โดยเปรียบเทียบเฉพาะราคาของ thinking เท่านั้น

กลยุทธ์การตั้งราคานี้ส่งผลกระทบต่อนักพัฒนาที่สร้างแอปพลิเคชันในช่วงพรีวิว โดยเฉพาะผู้ที่ใช้โหมดที่ไม่ใช่ thinking สำหรับงานที่ต้องการความเร็ว เช่น voice AI หรือแอปพลิเคชันแบบเรียลไทม์

การเปลี่ยนแปลงราคา Gemini 2.5 Flash

เมตริก ราคาช่วง Preview ราคา Stable ใหม่ การเพิ่มขึ้น
Input tokens $0.15/ล้าน $0.30/ล้าน 2 เท่า
Output (non-thinking) $0.60/ล้าน $2.50/ล้าน 4.2 เท่า
Output (thinking) $3.50/ล้าน $2.50/ล้าน 0.7 เท่า (ลดลง)
Audio tokens $1.00/ล้าน $1.00/ล้าน ไม่เปลี่ยนแปลง

Flash-Lite กลายเป็นทางเลือกประหยัด

Google ได้เปิดตัว Gemini 2.5 Flash-Lite ในฐานะตัวเลือกที่ประหยัดที่สุด โดยวางตำแหน่งให้แข่งขันกับโมเดล 2.0 Flash รุ่นเก่า เวอร์ชันใหม่นี้ยังคงมี context window 1 ล้านโทเค็นและความสามารถแบบ multimodal พร้อมเสนอเวลาตอบสนองที่เร็วกว่า มักจะต่ำกว่า 400 มิลลิวินาที อย่างไรก็ตาม การทดสอบเบื้องต้นแสดงให้เห็นว่าอาจไม่เทียบเท่าประสิทธิภาพของโมเดล Flash แบบเต็มสำหรับงานที่ซับซ้อน

ค่าใช้จ่ายในการประมวลผลเสียงก็เพิ่มขึ้นอย่างมากทั่วทุกโมเดล โดย Flash-Lite เรียกเก็บ 0.50 เหรียญสหรัฐต่อโทเค็นหนึ่งล้านตัว เมื่อเปรียบเทียบกับ 2.0 Flash-Lite รุ่นก่อนที่เรียกเก็บ 0.075 เหรียญสหรัฐ - แสดงถึงการเพิ่มขึ้น 6.3 เท่า

คุณสมบัติหลักของ Gemini 2.5 Flash-Lite

  • หน้าต่างบริบท: 1 ล้านโทเค็น
  • เวลาตอบสนong: โดยทั่วไปต่ำกว่า 400 มิลลิวินาที และต่ำสุดที่ 200 มิลลิวินาที
  • ความสามารถ: รับข้อมูลแบบหลายรูปแบบ, การผสานรวมกับ Google Search, การรันโค้ด
  • โหมดการคิด: มีให้ใช้งานพร้อมงบประมาณที่ปรับได้
  • การวางตำแหน่ง: โมเดลที่คุ้มค่าที่สุดในตระกูล 2.5

ปฏิกิริยาของชุมชนแบ่งออกเรื่องคุณภาพโมเดล

ความคิดเห็นของนักพัฒนาเกี่ยวกับการอัปเดตล่าสุดของ Gemini แสดงผลลัพธ์ที่หลากหลาย ในขณะที่ผู้ใช้บางคนชื่นชมประสิทธิภาพการเขียนโค้ดที่ดีขึ้นและ context window ขนาดใหญ่ ผู้อื่นรายงานการลดลงของคุณภาพเมื่อเปรียบเทียบกับเวอร์ชันพรีวิวก่อนหน้า นักพัฒนาหลายคนสังเกตเห็นปัญหาเกี่ยวกับการตอบสนองที่ยาวเยิ่น การใส่คอมเมนต์มากเกินไปในโค้ดที่สร้างขึ้น และประสิทธิภาพที่ไม่สม่ำเสมอ

ระบบการจำกัดอัตราก็ได้รับการวิพากษ์วิจารณ์เช่นกัน โดยผู้ใช้บางคนไม่สามารถเข้าถึงระดับการใช้จ่ายที่สูงขึ้นเนื่องจากข้อจำกัดคำขอที่เข้มงวด ทำให้พวกเขาต้องกลับไปใช้คู่แข่งอย่าง OpenAI แม้จะชอบความสามารถทางเทคนิคของ Gemini มากกว่า

การเปรียบเทียบราคาการประมวลผลเสียง

โมเดล ราคาต่อล้าน Token
Gemini 2.0 Flash-Lite $0.075
Gemini 2.5 Flash-Lite $0.50
การเพิ่มขึ้นของราคา 6.3 เท่า

การตั้งราคาเชิงกลยุทธ์สะท้อนการเติบโตของตลาด

การเพิ่มราคาสอดคล้องกับแนวโน้มอุตสาหกรรมที่กว้างขึ้น เมื่อบริษัท AI เปลี่ยนจากการดึงดูดลูกค้าอย่างรุกรานไปสู่โมเดลธุรกิจที่ยั่งยืน การตั้งราคาต่ำมากในช่วงแรกของ Google ช่วยสร้างตำแหน่งในตลาด แต่ตอนนี้บริษัทดูเหมือนจะมั่นใจพอที่จะเรียกเก็บราคาตลาด การเปลี่ยนแปลงนี้สะท้อนถึงภูมิทัศน์ AI ที่เติบโตแล้ว ซึ่งผู้ให้บริการกำลังสร้างสมดุลระหว่างการปรับปรุงประสิทธิภาพกับความต้องการผลกำไร

การเปลี่ยนแปลงเหล่านี้เน้นย้ำถึงความท้าทายที่ต่อเนื่องสำหรับนักพัฒนาที่สร้างบนโมเดลพรีวิว ซึ่งความมั่นคงของราคาไม่ได้รับการรับประกันจนกว่าจะมีการเปิดให้บริการทั่วไป เมื่อตลาด AI ยังคงพัฒนาต่อไป บริษัทต่างๆ ต้องชั่งน้ำหนักระหว่างประโยชน์ของความสามารถที่ล้ำสมัยกับความเสี่ยงของต้นทุนและเงื่อนไขที่เปลี่ยนแปลงได้

อ้างอิง: We're expanding our Gemini 2.5 family of models