Apple เปิดเผยข้อมูล "Baltra" ชิป AI เซิร์ฟเวอร์ กำหนดเปิดตัวปี 2027 มุ่งเน้นงาน Inference ใช้เทคโนโลยี 3nm จาก TSMC

ทีมบรรณาธิการ BigGo
Apple เปิดเผยข้อมูล "Baltra" ชิป AI เซิร์ฟเวอร์ กำหนดเปิดตัวปี 2027 มุ่งเน้นงาน Inference ใช้เทคโนโลยี 3nm จาก TSMC

กลยุทธ์การออกแบบชิปของตัวเองของ Apple เป็นเสาหลักของความสำเร็จ มันขับเคลื่อนทุกอย่างตั้งแต่ iPhone ไปจนถึง MacBook ตอนนี้ รายงานใหม่ชี้ให้เห็นว่าบริษัทกำลังยกระดับการบูรณาการแนวตั้งนี้ไปอีกขั้น โดยมุ่งเป้าไปที่หัวใจของการคำนวณยุคใหม่ นั่นคือศูนย์ข้อมูล AI ข้อมูลที่รั่วไหลออกมาชี้ไปที่ "Baltra" ซึ่งเป็นชิปเซิร์ฟเวอร์ AI แบบกำหนดเองตัวแรกของ Apple ซึ่งแสดงถึงการเปลี่ยนแปลงครั้งสำคัญในวิธีที่ยักษ์ใหญ่ด้านเทคโนโลยีวางแผนที่จะจัดการกับความต้องการด้านการคำนวณอันมหาศาลของบริการ AI ที่กำลังเติบโต

ข้อมูลจำเพาะหลัก & ไทม์ไลน์ (อ้างอิงจากรายงาน):

  • ชื่อรหัสภายใน: Baltra
  • ประเภท: ชิปเซิร์ฟเวอร์ AI (เน้นการอนุมาน)
  • พันธมิตร: Broadcom (สำหรับเทคโนโลยีเครือข่าย)
  • โหนดกระบวนการ: TSMC 3nm N3E (ตามข่าวลือ)
  • จุดเน้นทางสถาปัตยกรรมหลัก: ความหน่วงต่ำ, throughput สูง, การดำเนินการ INT8
  • กำหนดการเปิดตัวเป้าหมาย: 2027
  • วัตถุประสงค์: ใช้ขับเคลื่อนงานอนุมานของ "Apple Intelligence" บนระบบคลาวด์

จุดเริ่มต้นของโปรเจกต์ Baltra

การมีอยู่ของ "Baltra" ถูกพูดถึงครั้งแรกในรายงานช่วงฤดูใบไม้ผลิปี 2024 ซึ่งบ่งชี้ว่า Apple กำลังร่วมมือกับพันธมิตรด้านเซมิคอนดักเตอร์อย่าง Broadcom ในการพัฒนาซีพูเซิร์ฟเวอร์ AI ในบ้าน ข้อมูลล่าสุดที่รั่วไหลออกมาได้ยืนยันไทม์ไลน์นี้ โดยชี้ว่าชิปดังกล่าวอยู่บนเส้นทางที่จะถูกนำไปใช้งานในปี 2027 การเคลื่อนไหวนี้ถูกมองว่าเป็นขั้นตอนสำคัญสำหรับ Apple ในการลดการพึ่งพาฮาร์ดแวร์จากบุคคลที่สาม โดยเฉพาะจากผู้นำในอุตสาหกรรมอย่าง Nvidia และได้มาซึ่งการควบคุมประสิทธิภาพ ประสิทธิภาพการใช้พลังงาน และต้นทุนของโครงสร้างพื้นฐาน AI แบบคลาวด์ของตัวเองมากขึ้น การร่วมมือกับ Broadcom ตามรายงานมุ่งเน้นไปที่การผสานรวมเทคโนโลยีเครือข่ายขั้นสูง ซึ่งเป็นส่วนประกอบสำคัญสำหรับการเชื่อมต่อชิปเหล่านี้หลายพันตัวเข้าด้วยกันในคลัสเตอร์เซิร์ฟเวอร์ทรงพลัง

ชิปที่สร้างขึ้นเพื่อการทำงาน ไม่ใช่การสร้างสรรค์

บางทีแง่มุมที่เปิดเผยมากที่สุดของโปรเจกต์ Baltra คือโฟกัสการออกแบบเฉพาะเจาะจงของมัน แตกต่างจากตัวเร่ง AI แบบอเนกประสงค์ที่ใช้สำหรับฝึกฝนโมเดลขนาดใหญ่ ชิปของ Apple ถูกออกแบบมาเป็นหลักสำหรับ "การอนุมาน" หรือ Inference ซึ่งเป็นกระบวนการที่โมเดล AI ที่ผ่านการฝึกฝนแล้วทำงานตามข้อมูลใหม่ เช่น การประมวลผลคำขอของผู้ใช้เพื่อสรุปอีเมลหรือสร้างภาพ ทางเลือกเชิงกลยุทธ์นี้สอดคล้องกับข้อตกลงที่ Apple รายงานว่าจะมีกับ Google ซึ่งจะจ่ายเงินประมาณ 1 พันล้านดอลลาร์สหรัฐต่อปีเพื่อรับสิทธิ์ใช้งานเวอร์ชันที่ปรับแต่งแล้วของโมเดล Gemini ขนาด 3 ล้านล้านพารามิเตอร์ เพื่อขับเคลื่อนคุณสมบัติคลาวด์ของ "Apple Intelligence" ด้วยการโอนย้ายงานที่แพงมหาศาลและซับซ้อนอย่างการฝึกโมเดลให้กับ Google Apple จึงสามารถมุ่งความพยายามด้านซิลิคอนของตนไปที่การปรับให้เหมาะสมสำหรับการทำงานของโมเดลที่ฝึกไว้ล่วงหน้าเหล่านี้อย่างรวดเร็ว มีประสิทธิภาพ และมีความหน่วงต่ำสำหรับผู้ใช้หลายพันล้านคน

บริบทเชิงกลยุทธ์:

  • การฝึกฝนโมเดลเทียบกับการอนุมานผล: รายงานระบุว่า Apple ไม่ได้ออกแบบ Baltra สำหรับการฝึกฝนโมเดล AI โดยมีข้อตกลงแยกต่างหากกับ Google เพื่อใช้โมเดล Gemini ที่ปรับแต่งเอง (ค่าใช้จ่าย: ~1 พันล้านดอลลาร์สหรัฐ/ปี)
  • การผสานแนวตั้ง: Baltra เป็นส่วนหนึ่งของการขยายพอร์ตโฟลิโอชิปที่กว้างขึ้นของ Apple ซึ่งรวมถึง: ซีรีส์ A (iPhone/iPad) ซีรีส์ M (Mac) C1 (โมเด็ม 5G) ซีรีส์ W (บลูทูธ/Wi-Fi)
    • อนุพันธ์ซีรีส์ S ที่อาจเกิดขึ้นสำหรับแว่นตา AI

ลำดับความสำคัญทางสถาปัตยกรรมและความได้เปรียบด้านการผลิต

คำสั่งที่เน้นการอนุมานนี้เป็นตัวกำหนดสถาปัตยกรรมหลักของ Baltra ชิปสำหรับการฝึกฝนให้ความสำคัญกับปริมาณงานการคำนวณดิบและการคำนวณความแม่นยำสูง (เช่น FP16 หรือ FP32) เพื่อจัดการกับชุดข้อมูลขนาดใหญ่ ในทางตรงกันข้าม ชิปสำหรับการอนุมานอย่าง Baltra จะเน้นที่ความหน่วงต่ำ — ความเร็วในการประมวลผลคำขอ — และปริมาณงานสูงสำหรับจัดการคำขอของผู้ใช้พร้อมกันนับล้าน ในการบรรลุเป้าหมายนี้ การออกแบบคาดว่าจะใช้ประโยชน์จากรูปแบบข้อมูลความแม่นยำต่ำ เช่น INT8 (จำนวนเต็ม 8 บิต) อย่างมาก วิธีการนี้ช่วยลดการใช้พลังงานและขนาดชิปได้อย่างมีนัยสำคัญ ในขณะที่ยังคงความแม่นยำเพียงพอสำหรับงานอนุมาน ซึ่งแปลโดยตรงเป็นเวลาในการตอบสนองที่เร็วขึ้นสำหรับผู้ใช้ปลายทางและต้นทุนการดำเนินงานที่ต่ำลงสำหรับ Apple นอกจากนี้ ยังมีข่าวลือว่าชิปจะถูกผลิตด้วยกระบวนการผลิตขั้นสูงรุ่นที่สอง 3nm "N3E" ของ TSMC ซึ่งจะให้ประสิทธิภาพและประสิทธิภาพการใช้พลังงานที่ดีที่สุดในระดับเดียวกันเมื่อเปิดตัว

จักรวรรดิซิลิคอนที่ขยายวงกว้างขึ้น

Baltra ไม่ใช่โปรเจกต์ที่แยกออกมา แต่เป็นส่วนหนึ่งของการขยายตัวอย่างไม่หยุดยั้งของพอร์ตโฟลิโอชิปแบบกำหนดเองของ Apple นอกเหนือจากชิปซีรีส์ A และซีรีส์ M ที่ผู้บริโภคใช้งานแล้ว Apple ยังเป็นที่รู้กันว่ากำลังพัฒนาโมเด็ม 5G ของตัวเอง (ชิป C1) และได้ติดตั้งชิป Wi-Fi และ Bluetooth แบบกำหนดเองแล้ว เมื่อมองไปข้างหน้า ข่าวลือชี้ให้เห็นว่าชิปอนุพันธ์ของชิปซีรีส์ S จาก Apple Watch อาจเป็นกำลังให้กับแว่นตา AI ที่คาดการณ์ไว้ของบริษัท ซึ่งมีกำหนดเปิดตัวในปีหน้า การพัฒนา Baltra แสดงให้เห็นว่าความทะเยอทะยานของ Apple ขยายออกไปเกินกว่าอุปกรณ์ในมือคุณ ไปยังฟาร์มเซิร์ฟเวอร์ขนาดใหญ่ที่ขับเคลื่อนบริการบนนั้น โดยมุ่งหมายที่จะควบคุมทุกโหนดเทคโนโลยีที่สำคัญในระบบนิเวศของตน

ผลกระทบต่อภูมิทัศน์ฮาร์ดแวร์ AI

การเข้าสู่สนามชิปเซิร์ฟเวอร์ AI แบบกำหนดเองของ Apple แม้ว่าในตอนแรกจะมุ่งเน้นความต้องการของตัวเอง เป็นสัญญาณของแนวโน้มที่เพิ่มขึ้นของผู้ให้บริการคลาวด์รายใหญ่ที่ออกแบบซิลิคอนของตัวเอง แม้ว่าความโดดเด่นของ Nvidia ในการฝึก AI จะไม่น่าถูกท้าทายในเร็วๆ นี้ แต่ตลาดสำหรับการอนุมานมีความแตกแยกมากกว่าและพร้อมสำหรับการปรับให้เหมาะสม หากประสบความสำเร็จ Baltra อาจให้ข้อได้เปรียบทางการแข่งขันที่ไม่เหมือนใครแก่ Apple นั่นคือฮาร์ดแวร์และซอฟต์แวร์ที่ผสานรวมอย่างแน่นหนา ซึ่งมอบประสบการณ์ AI ที่รวดเร็ว เป็นส่วนตัวมากขึ้น และอาจมีต้นทุนที่คุ้มค่ากว่าผ่านระบบนิเวศอุปกรณ์ของตน หน้าต่างการเปิดตัวในปี 2027 ให้เวลาอุตสาหกรรมอย่างเพียงพอที่จะเฝ้าดูว่าโปรเจกต์ที่ทะเยอทะยานนี้จะพัฒนาอย่างไร ขณะที่ Apple ทำงานอย่างเงียบๆ เพื่อสร้างสมองสำหรับอนาคตอันชาญฉลาดของตน