โมเดล AI ใหม่ของ Apple แสดงศักยภาพที่น่าสนใจ แต่ Siri ยังคงมีปัญหากับงานพื้นฐาน

ทีมชุมชน BigGo
โมเดล AI ใหม่ของ Apple แสดงศักยภาพที่น่าสนใจ แต่ Siri ยังคงมีปัญหากับงานพื้นฐาน

Apple ได้เผยแพร่รายละเอียดทางเทคนิคเกี่ยวกับโมเดลภาษาพื้นฐานใหม่สองตัวที่ขับเคลื่อน Apple Intelligence แต่ช่องว่างระหว่างความสำเร็จในการวิจัยและประสิทธิภาพในโลกแห่งความจริงยังคงกว้างอย่างน่าหงุดหงิดสำหรับผู้ใช้หลายคน

บริษัทได้แนะนำโมเดลบนอุปกรณ์ขนาด 3 พันล้านพารามิเตอร์ที่ปรับให้เหมาะสมสำหรับ Apple silicon และโมเดลเซิร์ฟเวอร์ขนาดใหญ่กว่าที่สร้างขึ้นบนสถาปัตยกรรมที่เป็นนวัตกรรม โมเดลทั้งสองอ้างว่าสามารถเทียบเท่าหรือเหนือกว่าทางเลือกโอเพนซอร์สที่เปรียบเทียบได้ในเบนช์มาร์ก ขณะที่ Apple เน้นย้ำแนวทางปฏิบัติ AI ที่มีความรับผิดชอบ รวมถึงการคลานเว็บอย่างมีจริยธรรมและการปกป้องความเป็นส่วนตัวของผู้ใช้

ข้อมูลจำเพาะของโมเดล Apple Intelligence

  • โมเดลในอุปกรณ์: ~3B พารามิเตอร์ ปรับให้เหมาะสมสำหรับชิป Apple silicon
  • โมเดลเซิร์ฟเวอร์: ขยายได้ด้วยสถาปัตยกรรม Parallel-Track Mixture-of-Experts (PT-MOE)
  • คุณสมบัติหลัก: การแชร์ KV-cache การฝึกอบรมแบบ 2-bit quantization-aware
  • ความสามารถที่รองรับ: หลายภาษา หลายรูปแบบ การเข้าใจภาพ การเรียกใช้เครื่องมือ
  • ฮาร์ดแวร์: ทำงานบน Apple Neural Engine (ANE) เพื่อประสิทธิภาพ

ประสิทธิภาพในโลกแห่งความจริงยังไม่เป็นไปตามสัญญาทางเทคนิค

แม้จะมีความก้าวหน้าทางเทคนิคของ Apple ผู้ใช้ยังคงประสบปัญหาความล้มเหลวของฟังก์ชันพื้นฐานกับ Siri คำของ่ายๆ เช่น การแปลงอุณหภูมิพร้อมคำถามที่ซับซ้อนมักส่งผลให้เกิดการค้นหาเว็บแทนที่จะเป็นคำตอบโดยตรง คำสั่งการตั้งตัวจับเวลาบางครั้งให้ผลลัพธ์การค้นหาเว็บแทนที่จะตั้งตัวจับเวลาจริงๆ ซึ่งเน้นย้ำถึงการขาดการเชื่อมต่อระหว่างความสามารถการวิจัยของ Apple และฟีเจอร์ที่นำไปใช้งาน

การอภิปรายในชุมชนเผยให้เห็นว่าแม้โมเดลของ Apple จะแสดงคุณค่าทางเทคนิค แต่การนำไปใช้งานจริงยังคงไม่สม่ำเสมอ ผู้ใช้ตั้งคำถามว่าทำไมการวิจัย AI ขั้นสูงไม่ได้แปลงเป็นฟังก์ชันการทำงานในชีวิตประจำวันที่เชื่อถือได้บนอุปกรณ์ของพวกเขา

การเข้าถึงสำหรับนักพัฒนาสร้างโอกาสใหม่

Apple ได้ทำให้โมเดล 3B พารามิเตอร์พร้อมใช้งานสำหรับนักพัฒนาผ่าน iOS 26 beta ช่วยให้สามารถผสานรวมโดยตรงผ่าน Foundation Models framework ที่เน้น Swift ใหม่ การทดสอบเบื้องต้นแสดงให้เห็นว่าโมเดลสามารถทำงานเป็นแชทบอทอเนกประสงค์ได้แม้ในโหมดเครื่องบิน ซึ่งแสดงให้เห็นความสามารถบนอุปกรณ์ที่แท้จริง

โมเดลทำงานบน Neural Engine (ANE) ของ Apple แทนที่จะเป็น GPU ซึ่งช่วยรักษาอายุแบตเตอรี่ในขณะที่รักษาประสิทธิภาพที่เหมาะสม นักพัฒนาสามารถเลือกระหว่างการประมวลผลบนอุปกรณ์ Private Cloud Compute หรือการผสานรวม ChatGPT ขึ้นอยู่กับความต้องการของพวกเขา

*Neural Engine (ANE): ชิปพิเศษของ Apple ที่ออกแบบมาสำหรับงานแมชชีนเลิร์นนิง ปรับให้เหมาะสมสำหรับประสิทธิภาพมากกว่าความเร็วดิบ

ตัวเลือกการรวมระบบสำหรับนักพัฒนา

  • เฟรมเวิร์ก: เฟรมเวิร์ก Foundation Models ที่เน้น Swift เป็นหลัก
  • ตัวเลือกการปรับใช้: บนอุปกรณ์, Private Cloud Compute, การรวมระบบ ChatGPT
  • ความสามารถ: การสร้างแบบมีคำแนะนำ, การเรียกใช้เครื่องมือแบบจำกัด, การปรับแต่งด้วย LoRA adapter
  • ความพร้อมใช้งาน: iOS 26 beta (นักพัฒนาและ public beta)
  • ประสิทธิภาพ: เวลาในการสร้างประมาณ 3 วินาทีสำหรับงานพื้นฐาน
นักพัฒนากำลังหารือเกี่ยวกับการรวมโมเดลภาษาใหม่ของ Apple ในสภาพแวดล้อมการทำงานร่วมกัน
นักพัฒนากำลังหารือเกี่ยวกับการรวมโมเดลภาษาใหม่ของ Apple ในสภาพแวดล้อมการทำงานร่วมกัน

แนวทางที่เน้นความเป็นส่วนตัวทำให้ Apple แตกต่าง

ความมุ่งมั่นของ Apple ต่อการพัฒนา AI อย่างมีความรับผิดชอบรวมถึงการปฏิเสธที่จะใช้ข้อมูลส่วนตัวของผู้ใช้สำหรับการฝึกอบรมและการปฏิบัติตามโปรโตคอล robots.txt สำหรับการคลานเว็บ จุดยืนด้านจริยธรรมนี้ตรงข้ามกับแนวทางของคู่แข่งบางราย แม้ว่าจะยังมีคำถามเกี่ยวกับความร่วมมือของ Apple กับ OpenAI และผลกระทบต่อการอ้างสิทธิ์ความเป็นส่วนตัวของพวกเขา

การเน้นย้ำของบริษัทเกี่ยวกับการประมวลผลบนอุปกรณ์และสถาปัตยกรรม Private Cloud Compute แสดงให้เห็นความพยายามที่แท้จริงในการสร้างสมดุลระหว่างความสามารถ AI กับความเป็นส่วนตัวของผู้ใช้ แม้ว่าการนำไปใช้งานในปัจจุบันจะไม่ได้ให้ประสบการณ์ผู้ใช้ที่ราบรื่นเสมอไป

ในขณะที่การวิจัยทางเทคนิคของ Apple แสดงให้เห็นศักยภาพและแนวทางที่เน้นความเป็นส่วนตัวของพวกเขาสมควรได้รับการยอมรับ การทดสอบที่แท้จริงอยู่ที่การลดช่องว่างระหว่างความสำเร็จในห้องปฏิบัติการและความน่าเชื่อถือในชีวิตประจำวันที่ผู้ใช้คาดหวังจากอุปกรณ์ของพวกเขา ความพร้อมใช้งานของโมเดลเหล่านี้สำหรับนักพัฒนาอาจเร่งการปรับปรุง แต่ผู้ใช้ยังคงรอ AI ที่ทำงานได้อย่างราบรื่นตามที่การตลาดของ Apple แนะนำ

อ้างอิง: Apple Intelligence Foundation Language Models Tech Report 2025