ทำไมการคำนวณแบบไตรภาคจึงหวนคืนสู่แวดวง AI ไม่ใช่ CPU

ทีมชุมชน BigGo
ทำไมการคำนวณแบบไตรภาคจึงหวนคืนสู่แวดวง AI ไม่ใช่ CPU

สำหรับหลายทศวรรษที่ผ่านมา การคำนวณแบบไตรภาค (Trinary computing) ซึ่งใช้สามสถานะแทนที่จะเป็นสองสถานะแบบไบนารี ยังคงเป็นเพียงความฝันทางทฤษฎี และมักถูกมองข้ามว่าไม่สามารถนำไปปฏิบัติได้จริง แม้แนวคิดเรื่องคอมพิวเตอร์ที่สร้างขึ้นจากพื้นฐานของ ใช่ ไม่ใช่ และ อาจจะ จะทำให้ผู้เชี่ยวชาญด้านเทคโนโลยีหลงใหล แต่ขณะนี้ การปฏิวัติอย่างเงียบ ๆ กำลังเกิดขึ้นในสถานที่ที่น่าประหลาดใจ นั่นคือ ปัญญาประดิษฐ์ ชุมชนกำลังถกเถียงกันอย่างจริงจังว่า แนวคิดเฉพาะทางนี้กำลังจะมีช่วงเวลาของมันแล้วหรือไม่ แต่ไม่ใช่ในการคำนวณทั่วไป หากแต่เป็นในโลกเฉพาะทางของแมชชีนเลิร์นนิง

ความดึงดูดใจและอุปสรรคทางวิศวกรรมของสามสถานะ

ข้อได้เปรียบทางปรัชญาของตรรกะแบบไตรภาคเป็นสิ่งที่ปฏิเสธไม่ได้ มันเสนอคำศัพท์พื้นฐานที่สมบูรณ์ยิ่งขึ้น ก้าวข้ามการเลือกแบบไบนารีอย่างง่ายไปสู่การรวมสถานะที่สาม ซึ่งมักถูกตีความว่า อาจจะ หรือ ไม่สนใจ อย่างไรก็ตาม การแปลงแนวคิดที่สง่างามนี้ให้เป็นฮาร์ดแวร์ทางกายภาพนั้นพิสูจน์แล้วว่าท้าทายอย่างยิ่ง หัวใจของปัญหาอยู่ที่ความเสถียร คอมพิวเตอร์ไบนารีสมัยใหม่มีประสิทธิภาพสูงเพราะสร้างขึ้นบนระบบสองเสถียร (Bistable systems) ซึ่งเป็นส่วนประกอบที่โดยธรรมชาติต้องการอยู่ในหนึ่งในสองสถานะที่แตกต่างกัน เช่น สวิตช์เปิด/ปิด ธรรมดา การออกแบบระบบสามเสถียร (Tristable system) ที่เชื่อถือได้ ซึ่งสามารถรักษาสามสถานะแยกจากกันได้อย่างชัดเจนและสม่ำเสมอนั้นยากกว่ามาก

ทรานซิสเตอร์โดยทั่วไปจะมีการกระจายพลังงานสถิตต่ำที่สุดหากอยู่ในสถานะเปิดเต็มที่หรือปิดเต็มที่ สถานะกลางแบบอนาล็อกนั้นยอดเยี่ยมหากคุณกำลังพยายามประมวลผลค่าต่อเนื่อง แต่จากนั้นคุณจะถูกบังคับให้ใช้กระแสไบอัสเพื่อรักษาสถานะกลางไว้... ชิปที่มีทรานซิสเตอร์หลายพันล้านตัวไม่สามารถทำงานได้อย่างสมเหตุสมผลหากทรานซิสเตอร์ส่วนใหญ่อยู่ในโหมดอนาล็อก มันจะละลายเป็นตะกรันได้ง่ายๆ

หลักการทางกายภาพพื้นฐานนี้อธิบายว่าทำไมระบบไบนารีจึงครองตำแหน่งสูงสุด การสร้างสถานะที่สามที่แตกต่างกันมักต้องเพิ่มช่วงแรงดันไฟฟ้า ซึ่งสามารถเพิ่มการใช้พลังงานเป็นสี่เท่าเพียงเพื่อรักษาความแตกต่างที่ชัดเจนระหว่างสถานะ ขณะที่ทรานซิสเตอร์หดเล็กลงจนใกล้ระดับอะตอม ความท้าทายก็ยิ่งเพิ่มขึ้น โดยเอฟเฟกต์ควอนตัม เช่น ควอนตัมทันเนลิง (Quantum Tunneling) ทำให้การรักษาสถานะใดๆ ให้สะอาดยากขึ้น แม้การทดลองในอดีตเช่นคอมพิวเตอร์ Setun ของโซเวียตจะพิสูจน์แล้วว่าการคำนวณแบบไตรภาคเป็นไปได้ แต่มูลค่าการออกแบบที่เพิ่มขึ้นทำให้มันไม่สามารถแข่งขันได้สำหรับการใช้งานทั่วไป

แนวคิดหลักของการคำนวณแบบไตรภาค

  • Ternary/Ternary: ระบบเลขฐานสาม ซึ่งตรงข้ามกับระบบเลขฐานสอง (binary)
  • Trit: หน่วยพื้นฐานของข้อมูลในระบบไตรภาค คล้ายกับ "bit" ในระบบไบนารี
  • Ternary Quantization: ในด้าน AI คือกระบวนการจำกัดค่าน้ำหนักของโมเดลให้เหลือเพียงสามค่า ได้แก่ -1, 0 และ +1
  • BitNet b1.58: ตัวอย่างของสถาปัตยกรรมโมเดลภาษาขนาดใหญ่สมัยใหม่ที่ใช้น้ำหนักแบบไตรภาค

ที่ที่ไตรภาคพบจุดยืน: แมชชีนเลิร์นนิง

ในขณะที่ความฝันเรื่อง CPU ไตรภาคอเนกประสงค์ยังคงห่างไกล สถาปัตยกรรมนี้กำลังพบการประยุกต์ใช้ที่ทรงพลังและปฏิบัติได้จริงในการฝึกโมเดลภาษาขนาดใหญ่ (Large Language Models - LLMs) นักวิจัยค้นพบว่า น้ำหนัก (Weights) จำนวนมาก ซึ่งเป็นค่าตัวเลขที่โครงข่ายประสาทเทียมปรับเปลี่ยนระหว่างการเรียนรู้ ในโมเดลที่มีความสามารถนั้น สามารถทำให้ง่ายขึ้นได้อย่างมาก แทนที่จะเป็นตัวเลขทศนิยมความแม่นยำสูง 32 บิต น้ำหนักเหล่านี้มักสามารถแสดงได้ด้วยค่าเพียง -1, 0 และ +1

แนวทางนี้ ซึ่งเรียกว่า Ternary Quantization เป็นพื้นฐานสำหรับสถาปัตยกรรมโมเดลใหม่ที่มีประสิทธิภาพสูงอย่าง BitNet b1.58 ประโยชน์ที่ได้มีมากมาย โมเดลที่มีน้ำหนักแบบไตรภาคมีขนาดเล็กกว่ามาก ต้องการหน่วยความจำและพื้นที่จัดเก็บน้อยลง ที่สำคัญกว่านั้น การคำนวณที่เกี่ยวข้องจะง่ายลงอย่างมาก การคูณด้วย -1, 0 หรือ +1 สามารถลดลงเหลือเพียงการบวก การลบ หรือข้ามการดำเนินการไปเลยทั้งหมด นำไปสู่การเพิ่มประสิทธิภาพการคำนวณอย่างมากและใช้พลังงานต่ำลง สิ่งนี้ทำให้การรันโมเดล AI ที่ทรงพลังบนฮาร์ดแวร์ที่ประสิทธิภาพต่ำกว่าเป็นความจริงที่จับต้องได้

ความท้าทายด้านซอฟต์แวร์อันมหาศาลของโลกไตรภาค

การอภิปรายชี้ให้เห็นว่า แม้ฮาร์ดแวร์ไตรภาคจะมีความเป็นไปได้ ระบบนิเวศซอฟต์แวร์ก็สร้างอุปสรรคอันใหญ่หลวง โลกดิจิทัลทั้งหมดของเราถูกสร้างขึ้นบนรากฐานของตรรกะไบนารี โปรเซสเซอร์ถูกออกแบบมาเพื่อจัดการกับค่าที่มีขนาดเป็นเลขยกกำลังสองอย่างมีประสิทธิภาพ ภาษาการเขียนโปรแกรมของเรา ตั้งแต่แอสเซมบลีไปจนถึง Python สันนิษฐานว่าเป็นโลกไบนารี จำนวนเต็ม ตัวเลขทศนิยม และแม้แต่การดำเนินการแบบบูลีนที่ง่ายที่สุด ล้วนต้องได้รับการทบทวนใหม่สำหรับเครื่องไตรภาค

การเปลี่ยนไปใช้ฐานสามจะทำให้ความรู้ทางวิศวกรรมซอฟต์แวร์ที่สะสมมาหลายทศวรรษและไลบรารีนับไม่ถ้วนล้าสมัย ดังที่ผู้แสดงความคิดเห็นหนึ่งระบุว่า ตัวดำเนินการระดับบิต (Bitwise Operators) ในระบบไตรภาคแทบจะเป็นไปไม่ได้ที่วิศวกรทั่วไปจะเข้าใจได้ ฉันทามติคือต้นทุนในการสร้างโครงสร้างพื้นฐานดิจิทัลทั้งหมดของเราขึ้นใหม่ตั้งแต่ต้นนั้นสูงเกินกว่าจะเอาชนะได้ในปัจจุบัน โดยเฉพาะเมื่อประโยชน์สำหรับงานอเนกประสงค์ทั่วไปยังไม่ได้รับการพิสูจน์

การใช้งานจริง vs. อุปสรรคทางทฤษฎี

ด้าน สถานะการใช้งานระบบ Trinary/Multi-State
โมเดล AI/ML ใช้งานจริง การควอนไทเซชันแบบ Ternary (เช่น BitNet b1.58) เพื่อการประมวลผลที่มีประสิทธิภาพ
CPU สำหรับใช้งานทั่วไป ทฤษฎี/ไม่เป็นไปได้จริง มีอุปสรรคทางด้านวิศวกรรมซอフต์แวร์และฮาร์ดแวร์อย่างมหาศาล
หน่วยความจำ ใช้กันทั่วไป QLC NAND flash เก็บข้อมูล 4 บิต (16 สถานะ) ต่อเซลล์เพื่อความหนาแน่น
การส่งข้อมูล ใช้กันทั่วไป การส่งสัญญาณแบบ PAM4/PAM8 ใช้ระดับแอมพลิจูดหลายระดับเพื่อความเร็ว

อนาคตคือการผสมผสาน ไม่ใช่ไตรภาคล้วน

การอภิปรายที่กำลังดำเนินอยู่ชี้ให้เห็นว่าอนาคตของการคำนวณไม่ใช่การเปลี่ยนแปลงทั้งหมดจากไบนารีเป็นไตรภาค แต่เรากำลังมุ่งไปสู่สภาพแวดล้อมที่ผสมผสานและมีความเชี่ยวชาญมากขึ้น เราอาจจะเห็น CPU แบบไบนารียังคงครองตำแหน่งสำหรับงานอเนกประสงค์ทั่วไป ขณะที่ส่วนประกอบเฉพาะทาง เช่น ตัวเร่ง AI ที่จัดการกับรูปแบบไตรภาคหรือรูปแบบตัวเลขควอนไทซ์อื่นๆ โดยธรรมชาติ กำลังพบเห็นได้ทั่วไปมากขึ้น

สิ่งนี้กำลังเกิดขึ้นแล้วในด้านอื่นๆ เทคโนโลยีเช่น QLC NAND Flash Storage (ซึ่งจัดเก็บ 4 บิตต่อเซลล์) และการส่งสัญญาณ PAM (Pulse Amplitude Modulation) ในการเชื่อมต่อภายในความเร็วสูง แสดงให้เห็นว่าการใช้ระดับแรงดันไฟฟ้าหลายระดับสำหรับการจัดเก็บและส่งข้อมูลที่มีความหนาแน่นสูงนั้นเป็นไปได้ในทางปฏิบัติในที่ที่เหมาะสม การคำนวณแบบไตรภาคอาจไม่ได้ยึดครองโลก แต่มันพบช่องทางที่สำคัญอย่างยิ่งซึ่งกำลังช่วยกำหนดอนาคตของปัญญาประดิษฐ์

สรุป

ความฝันของการคำนวณแบบไตรภาคไม่ใช่แค่การทดลองทางความคิดเชิงปรัชญาอีกต่อไป มันกำลังถูกฟื้นคืนชีพและได้รับการยืนยันอย่างแข็งขันในสาขา AI ซึ่งประโยชน์ด้านประสิทธิภาพของมันสำคัญเกินกว่าจะมองข้าม การอภิปรายในชุมชนเผยให้เห็นเส้นทางที่ชัดเจน: บทบาทของไตรภาคไม่ใช่เพื่อแทนที่ไบนารี แต่เพื่อเสริมกำลังมัน ทำให้เกิดโปรเซสเซอร์เฉพาะทางรุ่นใหม่ที่มีประสิทธิภาพและทรงพลัง ซึ่งจะขับเคลื่อนแอปพลิเคชัน AI ในวันพรุ่งนี้

หมายเหตุ: Ternary หมายถึงระบบเลขฐาน-3 โดยใช้สามสถานะที่แตกต่างกัน (มักเป็น -1, 0, +1)

อ้างอิง: The trinary dream endures