OpenAI เปิดตัวโมเดลแบบ Open-Weight รุ่นแรกในรอบหกปีด้วย GPT-OSS ที่สามารถรันในเครื่องได้

ทีมบรรณาธิการ BigGo
OpenAI เปิดตัวโมเดลแบบ Open-Weight รุ่นแรกในรอบหกปีด้วย GPT-OSS ที่สามารถรันในเครื่องได้

หลังจากมุ่งเน้นไปที่โมเดลแบบกรรมสิทธิ์เท่านั้นมานานกว่าหกปี OpenAI ได้เปลี่ยนกลยุทธ์อย่างสำคัญด้วยการเปิดตัวโมเดลภาษาแบบ open-weight รุ่นแรกนับตั้งแต่ GPT-2 โมเดล GPT-OSS ใหม่นี้เป็นการเปลี่ยนแปลงจากแนวทางแบบ closed-source ที่ใช้มาเมื่อเร็วๆ นี้ โดยให้นักพัฒนาและนักวิจัยสามารถดาวน์โหลด ปรับแต่ง และรันโมเดล AI ขั้นสูงในเครื่องได้โดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต

โมเดลสองรุ่นสำหรับการใช้งานที่แตกต่างกัน

OpenAI ได้เปิดตัว GPT-OSS ในสองรูปแบบเพื่อรองรับความต้องการด้านการประมวลผลและการใช้งานที่หลากหลาย โมเดลขนาดใหญ่ gpt-oss-120b มีพารามิเตอร์ 120 พันล้านตัวและให้ประสิทธิภาพเทียบเคียงกับโมเดลกรรมสิทธิ์ o3 และ o4-mini ของ OpenAI โดยต้องใช้ GPU ของ Nvidia เพียงตัวเดียวในการทำงาน ส่วนโมเดลขนาดเล็ก gpt-oss-20b มีพารามิเตอร์ 20 พันล้านตัวและออกแบบมาเพื่อการเข้าถึงที่กว้างขึ้น สามารถรันได้อย่างมีประสิทธิภาพบนอุปกรณ์ผู้บริโภคที่มีหน่วยความจำเพียง 16GB โมเดลทั้งสองรวมความสามารถในการใช้เหตุผลแบบ chain-of-thought ที่คล้ายกับที่เปิดตัวครั้งแรกในโมเดล o1 ของ OpenAI ทำให้สามารถแก้ปัญหาที่ซับซ้อนทีละขั้นตอนแทนที่จะให้ผลลัพธ์ทันที

การเปรียบเทียบข้อมูลจำเพาะของโมเดล

โมเดล พารามิเตอร์ ความต้องการหน่วยความจำ การเปรียบเทียบประสิทธิภาพ
gpt-oss-120b 120 พันล้าน GPU Nvidia เดี่ยว คล้ายคลึงกับโมเดล o3 และ o4-mini
gpt-oss-20b 20 พันล้าน หน่วยความจำ 16GB ขึ้นไป คล้ายคลึงกับโมเดล o3-mini

ความสามารถที่ครอบคลุมเกินกว่าการสร้างข้อความ

โมเดล GPT-OSS ขยายไปไกลกว่าการสร้างข้อความธรรมดา โดยเสนอชุดความสามารถขั้นสูงที่ทำให้เป็นเครื่องมือ AI ที่หลากหลาย โมเดลที่ใช้ข้อความเท่านั้นเหล่านี้สามารถเรียกดูเว็บ รันโค้ด เรียกใช้โมเดลบนคลาวด์เพื่อช่วยเหลือในงานเฉพาะ และทำงานเป็น AI agent ที่สามารถนำทางแอปพลิเคชันซอฟต์แวร์ได้ ต่างจาก ChatGPT ที่ต้องการการเชื่อมต่ออินเทอร์เน็ตตลอดเวลา โมเดล GPT-OSS สามารถทำงานได้แบบออฟไลน์ทั้งหมดและอยู่หลังไฟร์วอลล์ขององค์กร ตอบสนองความต้องการที่สำคัญขององค์กรที่มีข้อกำหนดด้านความปลอดภัยของข้อมูลที่เข้มงวด

ความสามารถหลัก

  • การใช้เหตุผลแบบ chain-of-thought (คล้ายกับโมเดล o1 )
  • ฟังก์ชันการเรียกดูเว็บ
  • การประมวลผลโค้ด
  • การรวมโมเดลบนคลาวด์
  • การนำทางซอฟต์แวร์ AI agent
  • ความสามารถในการทำงานแบบออฟไลน์
  • การติดตั้งที่เข้ากันได้กับไฟร์วอลล์

การตอบสนองเชิงกลยุทธ์ต่อการแข่งขันในตลาด

การเปิดตัวครั้งนี้เกิดขึ้นในขณะที่ OpenAI เผชิญกับการแข่งขันที่รุนแรงขึ้นในพื้นที่โมเดลแบบ open-weight โดยเฉพาะหลังจากความสำเร็จของโมเดลแบบเปิดที่คุ้มค่าของสตาร์ตอัพจีน DeepSeek เมื่อต้นปีนี้ CEO Sam Altman ยอมรับว่า OpenAI อยู่ในด้านที่ผิดของประวัติศาสตร์เกี่ยวกับการเปิดตัวโมเดลแบบเปิด และเน้นย้ำถึงความสำคัญของการให้แน่ใจว่านวัตกรรมใน AI แบบ open-weight เกิดขึ้นภายในสหรัฐอเมริกาบนพื้นฐานของค่านิยมประชาธิปไตย การเปลี่ยนกลยุทธ์นี้ยังทำให้ OpenAI สามารถแข่งขันได้โดยตรงกับซีรีส์ Llama ของ Meta ซึ่งครองตลาด open-weight มาตั้งแต่ปี 2023

การทดสอบความปลอดภัยและการประเมินความเสี่ยงอย่างเข้มงวด

OpenAI ได้นำโปรโตคอลการทดสอบความปลอดภัยที่ครอบคลุมที่สุดมาใช้สำหรับโมเดล GPT-OSS บริษัทได้ทำการประเมินเฉพาะทางเพื่อประเมินสถานการณ์การใช้งานในทางที่ผิด รวมถึงการ fine-tune โมเดลภายในองค์กรในพื้นที่เสี่ยงเพื่อวัดความสามารถที่อันตรายสูงสุดของพวกมัน นักวิจัยด้านความปลอดภัย Eric Wallace อธิบายว่าทีมได้ผลักดันโมเดลให้ถึงขีดจำกัดในหมวดความเสี่ยงต่างๆ และสุดท้ายได้ข้อสรุปว่าโมเดลเหล่านี้ไม่ได้ไปถึงระดับภัยคุกคามที่น่ากังวลตามกรอบการเตรียมพร้อมของ OpenAI บริษัทความปลอดภัยภายนอกก็ได้เข้าร่วมในกระบวนการประเมิน โดยตรวจสอบความเสี่ยงที่อาจเกิดขึ้นในด้านความปลอดภัยไซเบอร์และการพัฒนาอาวุธชีวภาพ

การอนุญาตเชิงพาณิชย์และความพร้อมใช้งาน

โมเดล GPT-OSS ทั้งสองมีให้ภายใต้ใบอนุญาต Apache 2.0 ซึ่งเปิดให้ใช้งานเชิงพาณิชย์ การแจกจ่าย และการรวมเข้ากับโครงการซอฟต์แวร์ที่มีใบอนุญาตอื่น การเลือกใช้ใบอนุญาตนี้สอดคล้องกับมาตรฐานอุตสาหกรรมที่ใช้โดยโมเดลแบบ open-weight หลักอื่นๆ จากบริษัทต่างๆ เช่น Qwen ของ Alibaba และ Mistral โมเดลเหล่านี้สามารถดาวน์โหลดได้ทันทีจากแพลตฟอร์มหลายแห่งรวมถึง Hugging Face, Databricks, Microsoft Azure และ Amazon Web Services ให้จุดเข้าถึงและตัวเลือกการใช้งานที่หลากหลายแก่นักพัฒนา

การออกใบอนุญาตและความพร้อมใช้งาน

ใบอนุญาต: Apache 2.0

  • อนุญาตให้ใช้งานเชิงพาณิชย์
  • อนุญาตให้แจกจ่ายต่อ
  • สามารถรวมเข้ากับซอฟต์แวร์ที่มีใบอนุญาตอื่นได้

แพลตฟอร์มดาวน์โหลด:

  • Hugging Face
  • Databricks
  • Microsoft Azure
  • Amazon Web Services

เกณฑ์มาตรฐานประสิทธิภาพและข้อได้เปรียบด้านต้นทุน

ตามที่นักวิจัยของ OpenAI กล่าว โมเดล GPT-OSS แสดงคะแนนเกณฑ์มาตรฐานที่แข็งแกร่งมากในการประเมินต่างๆ โมเดลเวอร์ชัน 120 พันล้านพารามิเตอร์มีประสิทธิภาพคล้ายคลึงกับโมเดลกรรมสิทธิ์ o3 และ o4-mini ของ OpenAI และยังเหนือกว่าในการประเมินเฉพาะบางด้าน นอกเหนือจากประสิทธิภาพโดยตรง OpenAI เน้นย้ำถึงข้อได้เปรียบของโมเดลในด้านความหน่วงและต้นทุนการดำเนินงาน โดยเฉพาะสำหรับองค์กรที่ต้องประมวลผลข้อมูลจำนวนมากหรือรักษาการดำเนินงาน AI อย่างต่อเนื่องโดยไม่มีค่าธรรมเนียม API ที่เกิดขึ้นซ้ำ

ผลกระทบในอนาคตต่อกลยุทธ์ของ OpenAI

แม้ว่า OpenAI จะยังไม่ได้ผูกพันกับตารางเวลาการเปิดตัวเป็นประจำสำหรับ GPT-OSS เวอร์ชันในอนาคต บริษัทมองว่าโมเดลเหล่านี้เป็นส่วนเสริมมากกว่าการแข่งขันกับบริการแบบเสียเงินของตน ผู้ร่วมก่อตั้ง Greg Brockman อธิบายว่าโมเดลแบบ open-weight มีจุดแข็งที่แตกต่างอย่างมากเมื่อเปรียบเทียบกับผลิตภัณฑ์กรรมสิทธิ์ ซึ่งบ่งชี้ว่า OpenAI วางแผนที่จะรักษาแนวทางคู่ขนานที่ให้บริการทั้งนักพัฒนาโอเพนซอร์สและลูกค้าองค์กรที่ต้องการโซลูชันแบบโฮสต์ กลยุทธ์นี้สะท้อนถึงการยอมรับของบริษัทว่าการลดอุปสรรคในการเข้าถึง AI ขับเคลื่อนนวัตกรรมและเปิดให้เกิดแอปพลิเคชันที่ไม่คาดคิดซึ่งเป็นประโยชน์ต่อระบบนิเวศเทคโนโลยีในวงกว้าง