การประมวลผล AI อาจไม่ใช่หลุมเงินอย่างที่ทุกคนอ้าง การวิเคราะห์ใหม่ชี้

ทีมชุมชน BigGo
การประมวลผล AI อาจไม่ใช่หลุมเงินอย่างที่ทุกคนอ้าง การวิเคราะห์ใหม่ชี้

การวิเคราะห์ต้นทุนโดยละเอียดของการดำเนินงานการประมวลผล AI ได้จุดประกายการถกเถียงอย่างรุนแรงในชุมชนเทคโนโลยี โดยท้าทายความเชื่อที่แพร่หลายว่าบริษัทอย่าง OpenAI และ Anthropic กำลังสูญเสียเงินอย่างมหาศาลในทุกคำขอของผู้ใช้ การวิเคราะห์ชี้ให้เห็นว่าต้นทุนการประมวลผลดิบสำหรับการรันโมเดล AI อาจต่ำกว่าที่คิดกันโดยทั่วไปมาก ซึ่งอาจเปลี่ยนแปลงความเข้าใจของเราเกี่ยวกับเศรษฐศาสตร์ AI

การสำรวจความเป็นไปได้ทางการเงินของการดำเนินงาน AI inference สำหรับบริษัทอย่าง OpenAI และ Anthropic
การสำรวจความเป็นไปได้ทางการเงินของการดำเนินงาน AI inference สำหรับบริษัทอย่าง OpenAI และ Anthropic

คณิตศาสตร์เบื้องหลังต้นทุนการประมวลผล AI

การวิเคราะห์แบ่งการประมวลผลออกเป็นสองระยะที่แตกต่างกันซึ่งมีโครงสร้างต้นทุนที่แตกต่างกันอย่างมาก การประมวลผลข้อมูลเข้า ซึ่งโมเดลใช้ข้อความหรือบริบทจำนวนมาก ดำเนินการด้วยต้นทุนส่วนเพิ่มที่เกือบเป็นศูนย์เนื่องจากความสามารถในการประมวลผลแบบขนาน อย่างไรก็ตาม การสร้างผลลัพธ์ต้องการการสร้างโทเค็นแบบลำดับและมีต้นทุนที่สูงกว่ามาก - แพงกว่าประมาณ 1,000 เท่าต่อโทเค็นเมื่อเทียบกับการประมวลผลข้อมูลเข้า

โดยใช้ราคาเช่า GPU H100 ปัจจุบันที่ 2 ดอลลาร์สหรัฐต่อชั่วโมงเป็นพื้นฐาน การคำนวณชี้ให้เห็นว่าโทเค็นข้อมูลเข้าต้นทุนประมาณ 0.003 ดอลลาร์สหรัฐต่อล้านโทเค็น ในขณะที่โทเค็นผลลัพธ์ต้นทุนประมาณ 3.08 ดอลลาร์สหรัฐต่อล้านโทเค็น ความไม่สมมาตรอย่างมหาศาลนี้อธิบายได้ว่าทำไมแอปพลิเคชัน AI บางตัวจึงมีกำไรสูง ในขณะที่บางตัวต่อสู้กับเศรษฐศาสตร์หน่วย

GPU H100 เป็นหน่วยประมวลผลกราฟิกระดับไฮเอนด์ที่ออกแบบมาเฉพาะสำหรับงาน AI โดยมีหน่วยความจำและความสามารถในการประมวลผลเฉพาะทาง

การเปรียบเทียบต้นทุนต่อล้าน Token:

  • Input tokens: ~$0.003 USD (การประมวลผลแบบขนาน)
  • Output tokens: ~$3.08 USD (การสร้างแบบต่อเนื่อง)
  • อัตราส่วนต้นทุน: ความแตกต่างประมาณ 1,000 เท่าระหว่าง input และ output

ชุมชนโต้แย้งตัวเลข

การวิเคราะห์ได้รับการวิพากษ์วิจารณ์อย่างมากจากผู้สังเกตการณ์ในอุตสาหกรรมที่ตั้งคำถามเกี่ยวกับสมมติฐานพื้นฐาน ผู้แสดงความคิดเห็นหลายคนชี้ให้เห็นว่าการคำนวณดูเหมือนจะอิงจากโมเดล R1 ของ DeepSeek ซึ่งเป็นที่รู้จักในด้านประสิทธิภาพที่ยอดเยี่ยมเมื่อเทียบกับโมเดลชั้นนำอื่นๆ นักวิจารณ์โต้แย้งว่าสิ่งนี้สร้างภาพที่ดีเกินไปซึ่งไม่สะท้อนต้นทุนที่แท้จริงที่บริษัท AI ใหญ่ๆ เผชิญ

นอกจากนี้ รากฐานทางคณิตศาสตร์ยังถูกตรวจสอบอย่างละเอียด ผู้ตรวจสอบทางเทคนิคคนหนึ่งสังเกตว่าการคำนวณโทเค็นข้อมูลเข้าดูเหมือนจะผิดพลาดด้วยตัวประกอบอย่างน้อย 1,000 ซึ่งชี้ให้เห็นว่าต้นทุนจริงอาจสูงกว่าที่ประเมินไว้อย่างมาก การวิเคราะห์ยังสมมติว่ามีการใช้ฮาร์ดแวร์อย่างสมบูรณ์แบบตลอดเวลา ซึ่งไม่ค่อยเกิดขึ้นในการดำเนินงานจริง

ช้างในห้องของต้นทุนการฝึก

บางทีแง่มุมที่ถกเถียงกันมากที่สุดของการอภิปรายคือต้นทุนใดที่ควรรวมเข้าไปเมื่อประเมินความสามารถในการทำกำไรของ AI การวิเคราะห์ต้นฉบับมุ่งเน้นไปที่ต้นทุนการประมวลผลเท่านั้น โดยจงใจไม่รวมค่าใช้จ่ายมหาศาลที่เกี่ยวข้องกับการฝึกโมเดลใหม่ แนวทางนี้ได้รับการเปรียบเทียบกับแนวทางการบัญชีที่น่าสงสัย โดยนักวิจารณ์โต้แย้งว่าเป็นเหมือนการประเมินความสามารถในการทำกำไรของอาคารอพาร์ตเมนต์โดยไม่สนใจการชำระเงินกู้

อย่างไรก็ตาม ผู้สนับสนุนการวิเคราะห์โต้แย้งว่าการแยกต้นทุนการประมวลผลออกจากการลงทุนการฝึกให้ข้อมูลเชิงลึกที่มีค่าเกี่ยวกับเศรษฐศาสตร์หน่วย พวกเขายืนยันว่าการเข้าใจว่าบริการ AI สามารถดำเนินการได้อย่างมีกำไรในแต่ละคำขอหรือไม่นั้นมีความสำคัญต่อการประเมินความยั่งยืนระยะยาว แม้ว่าบริษัทจะขาดทุนโดยรวมในปัจจุบันเนื่องจากการใช้จ่ายด้านการวิจัยและพัฒนา

หลักฐานในโลกจริงชี้ไปทั้งสองทาง

การถกเถียงมีความซับซ้อนจากคำแถลงที่ขัดแย้งกันของผู้นำอุตสาหกรรม CEO ของ OpenAI Sam Altman เพิ่งอ้างว่าบริษัทจะมีกำไรหากไม่มีต้นทุนการฝึก ซึ่งชี้ให้เห็นว่าการดำเนินงานการประมวลผลมีกำไรจริงๆ อย่างไรก็ตาม เขายังยอมรับว่าสมาชิก OpenAI Pro กำลังทำให้เกิดการสูญเสียเพราะพวกเขาใช้บริการมากกว่าที่คาดไว้

ในขณะเดียวกัน การมีอยู่ของผู้ให้บริการ API จำนวนมากที่เสนอบริการ AI ในราคาที่ต่ำมากสนับสนุนข้อโต้แย้งที่ว่าต้นทุนการประมวลผลอาจจัดการได้ ผู้ให้บริการบางรายเสนอโมเดลบางตัวฟรีทั้งหมด ซึ่งจะเป็นไปไม่ได้หากต้นทุนพื้นฐานสูงเกินไป

การวิเคราะห์แผนการสมัครสมาชิก:

  • ChatGPT Plus ($20 USD/เดือน): ประมาณการต้นทุนจริง $3 USD (มาร์กอัพ 5-6 เท่า)
  • Claude Code Max 5 ($100 USD/เดือน): ประมาณการต้นทุนจริง $4.92 USD (มาร์กอัพ 20.3 เท่า)
  • Claude Code Max 10 ($200 USD/เดือน): ประมาณการต้นทุนจริง $16.89 USD (มาร์กอัพ 11.8 เท่า)

ผลกระทบต่ออุตสาหกรรม AI

หากการวิเคราะห์พิสูจน์ว่าถูกต้อง มันอาจเปลี่ยนแปลงวิธีที่เรามองความยั่งยืนทางการเงินของอุตสาหกรรม AI อย่างพื้นฐาน เรื่องเล่าปัจจุบันเกี่ยวกับการเผาผลาญเงินสดที่ไม่ยั่งยืนอาจถูกพูดเกินจริง โดยเฉพาะสำหรับแอปพลิเคชันที่ใช้บริบทข้อมูลเข้าจำนวนมากในขณะที่สร้างผลลัพธ์น้อยที่สุด - ซึ่งเป็นรูปแบบที่เห็นในผู้ช่วยเขียนโค้ดและเครื่องมือวิเคราะห์เอกสาร

อย่างไรก็ตาม การวิเคราะห์ยังเน้นย้ำว่าทำไมแอปพลิเคชัน AI บางตัวจึงยังคงแพง การสร้างวิดีโอ ซึ่งต้องการการผลิตผลลัพธ์มหาศาลจากข้อมูลเข้าน้อยที่สุด เผชิญกับเศรษฐศาสตร์ที่โหดร้ายภายใต้โครงสร้างต้นทุนนี้ สิ่งนี้อธิบายการกำหนดราคาพรีเมียมและข้อจำกัดการใช้งานที่เราเห็นในบริการ AI วิดีโอในปัจจุบัน

การถกเถียงที่กำลังดำเนินอยู่สะท้อนความไม่แน่นอนที่กว้างขึ้นเกี่ยวกับเศรษฐศาสตร์ AI ขณะที่อุตสาหกรรมเติบโต แม้ว่าต้นทุนการประมวลผลอาจจัดการได้มากกว่าที่กลัว แต่การลงทุนมหาศาลที่จำเป็นสำหรับการฝึกโมเดลที่แข่งขันได้ยังคงสร้างแรงกดดันทางการเงินทั่วทั้งภาคส่วน

อ้างอิง: Are OpenAI and Anthropic Really Losing Money on Inference?