อุตสาหกรรมปัญญาประดิษฐ์กำลังเผชิญกับปัญหาการตั้งราคาที่เพิ่มมากขึ้น ซึ่งบังคับให้บริษัทต่าง ๆ ต้องยกเลิกรูปแบบการสมัครสมาชิกแบบไม่จำกัด และผลักดันให้ค่าใช้จ่ายสำหรับผู้ใช้สูงขึ้น แม้ว่าบริษัท AI จะสัญญาว่า token จะมีราคาถูกลงตามเวลา แต่ความเป็นจริงกลับซับซ้อนกว่านั้นมาก เนื่องจากรูปแบบความต้องการและพฤติกรรมการใช้งานสร้างเศรษฐศาสตr์ที่ไม่ยั่งยืน
ปัญหาของแผนไม่จำกัด
ปัญหาหลักอยู่ที่วิธีที่ผู้คนใช้บริการ AI จริง ๆ บริษัทต่าง ๆ เริ่มต้นด้วยการเสนอแผนไม่จำกัดหรือแผนที่มีขีดจำกัดสูง โดยคาดหวังว่าจะมีการใช้งานในระดับปานกลาง แต่พวกเขากลับค้นพบความจริงที่โหดร้าย: ผู้ใช้พาวเวอร์จำนวนเล็กน้อยใช้ทรัพยากรมากกว่าที่คาดการณ์ไว้อย่างมหาศาล สิ่งนี้สร้างสิ่งที่ผู้เชี่ยวชาญเรียกว่าการกระจายแบบ Zipf ที่ผู้ใช้ทั่วไปหลายพันคนอาจใช้ token เพียงไม่กี่ร้อย token ต่อวัน ในขณะที่กลุ่มผู้ใช้ที่ใช้ระบบอัตโนมัติหนักจำนวนเล็กน้อยกลับกินเผลอ token หลายสิบล้าน
การเปลี่ยนแปลงล่าสุดของ Claude ในแผนราคา 200 ดอลลาร์สหรัฐต่อเดือน เป็นตัวอย่างที่แสดงให้เห็นถึงความท้าทายนี้ แม้ว่าจะไม่เคยเป็นแผนไม่จำกัดจริง ๆ แต่ขีดจำกัดที่ใจกว้างของแผนนี้กลับไม่ยั่งยืนเมื่อผู้ใช้เริ่มใช้งานเซสชันการเขียนโค้ดแบบเข้มข้นและงานประมวลผลเอกสารขนาดใหญ่ บริษัทจึงถูกบังคับให้ใช้การควบคุมที่เข้มงวดกว่า ทำให้ผู้ใช้หลายคนผิดหวังกับข้อจำกัดการใช้งานที่เกิดขึ้นอย่างกะทันหัน
รูปแบบการกระจายตัวของการใช้งาน:
- ผู้ใช้ทั่วไปหลายพันคน: ใช้เพียงไม่กี่ร้อย token ต่อวัน
- กลุ่มเล็กของผู้ใช้หนัก: ใช้หลายสิบล้าน token ต่อเดือน
- ตัวอย่างการใช้งานสุดโต่ง: 10 พันล้าน token ต่อเดือน (เทียบเท่ากับหนังสือ War and Peace จำนวน 12,500 เล่ม)
- การกระจายตัวเป็นไปตามเส้นโค้งแบบ Zipf ทำให้การตั้งราคาแบบเหมาจ่ายไม่สามารถดำเนินการได้
ต้นทุนที่แท้จริงเบื้องหลังการตั้งราคา Token
แม้ว่าโมเดล AI รุ่นเก่าจะมีค่าใช้จ่ายในการรันที่ถูกลงตามเวลา แต่ชุมชนกลับย้ายไปใช้โมเดลใหม่ล่าสุดที่มีความสามารถมากที่สุดทันทีที่มีการเปิดตัว สิ่งนี้สร้างเป้าหมายที่เคลื่อนไหวสำหรับกลยุทธ์การตั้งราคา บริษัทต่าง ๆ พบว่าตัวเองอยู่ในสถานการณ์ที่ต้องตั้งราคาตามโมเดลล่าสุดที่มีราคาแพงที่สุด แทนที่จะเป็นโมเดลเก่าที่ราคาถูกกว่าซึ่งมีคนต้องการใช้จริง ๆ น้อยมาก
สถานการณ์กลายเป็นเรื่องซับซ้อนมากขึ้นกับผู้ช่วยการเขียนโค้ดและ AI agent ที่เผาผลาญ token ด้วยอัตราที่ไม่เคยมีมาก่อน ผู้ใช้รายงานว่าใช้เงิน 5 ดอลลาร์สหรัฐในเวลาเพียง 15 นาทีเมื่อใช้เครื่องมือเช่น Claude Code เนื่องจากแอปพลิเคชันเหล่านี้สร้าง context จำนวนมหาศาลและการโต้ตอบไปมาที่สะสมค่าใช้จ่ายได้อย่างรวดเร็ว
การเปรียบเทียบราคา Token:
- Claude Opus: $75 USD ต่อ token หนึ่งล้าน token
- Claude Sonnet: $15 USD ต่อ token หนึ่งล้าน token
- Claude Haiku: ระดับราคาที่ต่ำกว่าสำหรับงานง่ายๆ
- ตัวอย่างการใช้งาน: ใช้ไป $5 USD ใน 15 นาทีระหว่างเซสชันการเขียนโค้ดแบบเข้มข้น
ปัญหาความโปร่งใส
แหล่งที่มาสำคัญของความผิดหวังของผู้ใช้มาจากความไม่โปร่งใสของระบบการเรียกเก็บเงินแบบ token ผู้ใช้หลายคนมีปัญหาในการเข้าใจว่าพวกเขาใช้เงินไปเท่าไหร่หรือคาดการณ์ค่าใช้จ่ายรายเดือนของตนเอง ปัญหานี้ขยายไปเกิน AI ไปถึงบริการคลาวด์โดยทั่วไป ซึ่งบริษัทเช่น Amazon Web Services ได้สร้างระบบการเรียกเก็บเงินที่ซับซ้อนมากจนธุรกิจต่าง ๆ มักต้องจ้างผู้เชี่ยวชาญเพื่อเข้าใจใบแจ้งหนี้ของตนเอง
คุณสามารถตั้งการแจ้งเตือนการเรียกเก็บเงินและเขียนฟังก์ชัน lambda เพื่อตอบสนองและปิดใช้งานทรัพยากรได้ แน่นอนว่าพวกเขาไม่ได้ทำให้มันง่าย แต่ถ้าคุณไม่เรียนรู้วิธีใช้ขีดจำกัด คุณคาดหวังอะไร?
แนวทางของอุตสาหกรรมเกมต่อสกุลเงินเสมือนให้ภาพเปรียบเทียบที่น่าสนใจ - บริษัทต่าง ๆ จงใจทำให้ต้นทุนจริงไม่ชัดเจนโดยใช้ token หรือเครดิตแทนจำนวนเงินดอลลาร์โดยตรง ทำให้ผู้ใช้ติดตามการใช้จ่ายจริงได้ยากขึ้น
การค้นหารูปแบบที่ยั่งยืน
บริษัทต่าง ๆ กำลังทดลองกับแนวทางต่าง ๆ เพื่อแก้ไขวิกฤตการตั้งราคา บางบริษัทกำลังใช้ระบบแบ่งชั้นที่เปลี่ยนระหว่างโมเดล AI ที่แตกต่างกันโดยอัตโนมัติตามความซับซ้อนของงาน - ใช้โมเดลที่แพงเช่น Opus สำหรับการใช้เหตุผลที่ซับซ้อนและทางเลือกที่ถูกกว่าเช่น Haiku สำหรับงานง่าย ๆ บริษัทอื่น ๆ กำลังสำรวจแนวทางแบบผสมผสานที่รวมการประมวลผล AI เข้ากับวิธีการคอมพิวติ้งแบบดั้งเดิมเพื่อลดการใช้ token
ตลาดองค์กรนำเสนอความท้าทายที่แตกต่างกัน เนื่องจากธุรกิจมักชอบการตั้งราคาแบบคงที่ที่คาดการณ์ได้มากกว่ารูปแบบที่ใช้การใช้งานเป็นฐาน แม้ว่าพวกเขาจะจ่ายเงินมากกว่าก็ตาม อย่างไรก็ตาม ความแปรปรวนที่รุนแรงในรูปแบบการใช้งานทำให้บริษัท AI เกือบเป็นไปไม่ได้ที่จะเสนอแผนอัตราคงที่ที่ยั่งยืนโดยไม่สูญเสียเงินจากผู้ใช้หนักหรือตั้งราคาสูงจนผู้ใช้เบาไม่สามารถเข้าถึงได้
การเปลี่ยนแปลงแผนการสมัครสมาชิก:
- Claude Code : แผนรายเดือน $20-200 USD (เหมือนกับ Cursor )
- แผน "ไม่จำกัด" ก่อนหน้านี้มีการบังคับใช้ข้อจำกัดเซสชันละ 5 ชั่วโมง
- ข้อจำกัดแบบอ่อน 50 เซสชันต่อเดือน (มักไม่ได้บังคับใช้)
- แผนต่างๆ กำลังถูกปรับโครงสร้างใหม่เนื่องจากรูปแบบการใช้งานที่ไม่ยั่งยืน
มองไปข้างหน้า
วิกฤตการตั้งราคาในปัจจุบันสะท้อนถึงคำถามที่ลึกซึ้งกว่าเกี่ยวกับความยั่งยืนของรูปแบบธุรกิจของอุตสาหกรรม AI ขณะที่บริษัทต่าง ๆ เผาผลาญเงินทุนจำนวนมหาศาลเพื่อฝึกอบรมและให้บริการโมเดลที่มีพลังมากขึ้นเรื่อย ๆ แรงกดดันในการทำกำไรกำลังเพิ่มมากขึ้น ความตึงเครียดระหว่างความสามารถ ต้นทุน และการเข้าถึงนี้น่าจะเปลี่ยนแปลงวิธีการตั้งราคาและจัดแพ็กเกจบริการ AI ในปีที่จะมาถึง
การตอบสนองของชุมชนมีความหลากหลาย โดยผู้ใช้บางคนยอมรับการตั้งราคาตามการใช้งานว่ายุติธรรม ในขณะที่คนอื่น ๆ แสวงหาทางเลือกอื่นเช่นโมเดลที่โฮสต์เองหรือเปลี่ยนไปใช้ผู้ให้บริการอื่นตามต้นทุน การแก้ไขในท้ายที่สุดอาจต้องการการคิดใหม่ในเรื่องพื้นฐานเกี่ยวกับวิธีการส่งมอบและสร้างรายได้จากความสามารถของ AI
อ้างอิง: tokens are getting more expensive