โลกเทคโนโลยีกำลังคึกคักไปด้วยการถกเถียงที่น่าสนใจ: ระบบ AI สมัยใหม่อย่าง ChatGPT ที่น่าประทับใจนั้นไม่ใช่เพราะเป็นตัวแทนของวิศวกรรมที่สง่างาม แต่เพราะเป็นวิธีแก้ปัญหาที่ทรงพลังสำหรับความล้มเหลวในการจัดระเบียบข้อมูลอย่างเหมาะสมที่ผ่านมาหลายทศวรรษ การถกเถียงนี้ได้จุดประกายการอภิปรายอย่างเข้มข้นเกี่ยวกับว่าเราได้เลือกเส้นทางที่ถูกต้องในประวัติศาสตร์คอมพิวเตอร์หรือไม่
ปัญหาหลัก: โครงสร้าง กับ การค้นหา
การอภิปรายมุ่งเน้นไปที่การเปลี่ยนแปลงพื้นฐานในการจัดการข้อมูล แทนที่จะสร้างระบบที่จัดระเบียบดีพร้อมโครงสร้างที่ชัดเจน อุตสาหกรรมได้เลือกแนวทางค้นหาทุกอย่างซ้ำแล้วซ้ำเล่า Google Drive เป็นตัวอย่างของรูปแบบนี้ - แทนที่จะสร้างเครื่องมือจัดระเบียบไฟล์ที่ดีกว่า Google เพียงเพิ่มความสามารถในการค้นหาที่ทรงพลังและบอกผู้ใช้ให้ทิ้งทุกอย่างลงในโฟลเดอร์
รูปแบบเดียวกันนี้ปรากฏอยู่ทุกที่ เว็บไซต์อีคอมเมิร์ซใส่คีย์เวิร์ดในหน้าสินค้าจนล้นเหลือแทนที่จะสร้างการนำทางที่มีตรรกะ บริษัทต่างๆ ใช้แชทบอทแทนที่จะเขียนเอกสารที่ชัดเจน ผลลัพธ์คือโลกดิจิทัลที่การค้นหาข้อมูลต้องใช้อัลกอริทึมการค้นหาที่ซับซ้อนมากขึ้นแทนที่จะเป็นการจัดระเบียบที่เข้าใจง่าย
ทำไม Semantic Web จึงไม่เกิดขึ้น
ชุมชนได้ระบุเหตุผลหลักหลายประการว่าทำไม semantic web - วิสัยทัศน์ของข้อมูลที่มีโครงสร้างและอ่านได้ด้วยเครื่องจักรทั่วอินเทอร์เน็ต - จึงไม่เป็นจริง แรงจูงใจทางเศรษฐกิจมีบทบาทสำคัญ บริษัทต่างๆ มีท่าทีที่เปิดเผยในการต่อต้านการทำให้ข้อมูลที่มีค่าของพวกเขาถูกดึงข้อมูลได้ง่ายโดยคู่แข่ง ดังที่นักพัฒนาคนหนึ่งกล่าวว่า ธุรกิจต้องการให้ผู้เยี่ยมชมเห็นโฆษณาของพวกเขา ไม่ใช่ให้เนื้อหาของพวกเขาถูกบอทบริโภคและนำไปบรรจุใหม่โดยบริษัทอื่น
ความท้าทายทางเทคนิคก็เกิดขึ้นเช่นกัน เนื้อหาเว็บถูกสร้างโดยมนุษย์ ไม่ใช่วิศวกร ทำให้มาตรฐานที่สม่ำเสมอยากที่จะบังคับใช้ เบราว์เซอร์เลือกความยืดหยุ่นมากกว่าการปฏิบัติตามอย่างเคร่งครัด โดยแสดงหน้าเว็บในแบบพยายามอย่างดีที่สุดแทนที่จะทำลายเว็บไซต์ที่ไม่สอดคล้องกับมาตรฐาน
*Semantic web: วิสัยทัศน์สำหรับ World Wide Web ที่ข้อมูลมีโครงสร้างและเชื่อมโยงในรูปแบบที่ทำให้เครื่องจักรอ่านได้ง่าย ช่วยให้การประมวลผลข้อมูลฉลาดขึ้น
การเปรียบเทียบกระบวนทัศน์การคอมพิวติ้งในอดีต:
- วิสัยทัศน์ช่วงปี 1990-2000: เว็บเชิงความหมายที่มีโครงสร้างพร้อมข้อมูลที่เชื่อมโยงกัน
- ความเป็นจริงในปัจจุบัน: ข้อมูลที่ไม่มีโครงสร้างถูกประมวลผลด้วยอัลกอริทึมการค้นหาที่ทรงพลัง
- แนวทาง AI: การจดจำรูปแบบแบบ brute-force ผ่านข้อมูลที่วุ่นวาย
- เส้นทางทางเลือก: ฐานความรู้ที่มีโครงสร้างพร้อมการสืบค้นที่มีประสิทธิภาพ
วิธีแก้ปัญหาแบบใช้กำลังดุร้าย
ระบบ AI สมัยใหม่อย่าง large language model เป็นตัวแทนของสิ่งที่หลายคนมองว่าเป็นวิธีแก้ปัญหาแบบใช้กำลังดุร้ายสำหรับความล้มเหลวในการจัดระเบียบเหล่านี้ แทนที่จะต้องการข้อมูลที่มีโครงสร้าง ระบบเหล่านี้สแกนเว็บที่วุ่นวายและสร้างแผนที่ความหมายชั่วคราวทั่วทุกอย่าง พวกมันสามารถตอบคำถามที่ซับซ้อนหลายขั้นตอนที่จะทำให้เครื่องมือค้นหาแบบดั้งเดิมสับสน แต่ด้วยต้นทุนการคำนวณที่มหาศาล
LLM ทำให้สิ่งเหล่านี้กลับมามีชีวิตชีวาสำหรับเรา ทำให้พวกมันน่าดึงดูดใจมากขึ้น หากคุณเคยชินกับการแทะผลไม้แห้ง พวกมันดูน่าทึ่งมาก แต่ยังมีงานอีกมากที่ต้องทำ
ความขัดแย้งนี้ไม่ได้หลุดจากสายตานักพัฒนาที่จำได้ว่าเมื่อคอมพิวเตอร์กำลังเร็วขึ้นแต่กลับใช้งานยากขึ้น ในขณะที่เครื่องสมัยใหม่สามารถทำการดำเนินการหลายพันครั้งต่อวินาที เราได้ลงทุนหลายพันล้านในระบบที่ขับเคลื่อนด้วย GPU ที่สามารถจำลองความเข้าใจภาษาได้แต่ดิ้นรนกับงานพื้นฐานอย่างการนับตัวอักษรในคำ
แนวคิดทางเทคนิคหลักที่กล่าวถึง:
- Semantic Web: ข้อมูลเว็บที่มีโครงสร้างและเครื่องจักรสามารถอ่านได้ พร้อมการเชื่อมโยงที่หลากหลาย
- Large Language Models (LLMs): ระบบ AI ที่ประมวลผลและสร้างข้อความที่เหมือนมนุษย์
- Vector Databases: ระบบจัดเก็บข้อมูลสำหรับการแสดงข้อมูลที่เข้ากันได้กับ AI
- Knowledge Graphs: เครือข่ายโครงสร้างของข้อมูลที่เชื่อมโยงกัน
![]() |
---|
ภาพรวมที่สร้างโดย AI แสดงให้เห็นความสามารถในการสังเคราะห์ข้อมูลของระบบ AI สมัยใหม่ |
มองไปข้างหน้า: โครงสร้าง หรือ ความยืดหยุ่น?
การถกเถียงเผยให้เห็นการแบ่งแยกทางปรัชญาที่ลึกซึ้งในการคำนวณ บางคนโต้แย้งว่าหากเราประสบความสำเร็จในการสร้างฐานความรู้ที่เชื่อมโยงทางความหมายที่มีโครงสร้างที่เหมาะสม เราสามารถตอบคำถามที่ซับซ้อนได้โดยใช้พลังการคำนวณที่น้อยกว่ามากในขณะที่รักษาข้อมูลให้เข้าถึงได้และเข้าใจได้
คนอื่นๆ โต้แย้งว่ามุมมองนี้ไม่สมจริง ระบบที่ซับซ้อนเกี่ยวข้องกับผู้มีส่วนได้ส่วนเสียหลายคนที่มีแรงจูงใจที่แข่งขันกัน การคาดหวังให้ทุกคนปฏิบัติตามมาตรฐานที่สมบูรณ์แบบนั้นเพิกเฉยต่อธรรมชาติของมนุษย์และความเป็นจริงที่ยุ่งเหยิงของวิธีที่เทคโนโลยีถูกสร้างและใช้งานจริง
การอภิปรายมีผลกระทบในทางปฏิบัติต่อการพัฒนา AI ในปัจจุบัน บริษัทบางแห่งกำลังสำรวจว่าระบบ AI สามารถช่วยสร้างกราฟความรู้ที่มีโครงสร้างที่มนุษย์ล้มเหลวในการสร้างด้วยตนเองหรือไม่ ซึ่งอาจรวมสิ่งที่ดีที่สุดของทั้งสองแนวทาง
ว่า AI เป็นตัวแทนของชัยชนะทางวิศวกรรมหรือผ้าพันแผลที่แพงสำหรับสถาปัตยกรรมข้อมูลที่ไม่ดียังคงถูกถกเถียงอย่างเข้มข้น สิ่งที่ชัดเจนคือการสนทนานี้สะท้อนคำถามที่กว้างขึ้นเกี่ยวกับวิธีที่เราต้องการให้อนาคตดิจิทัลของเราทำงาน - และว่าเรากำลังสร้างระบบที่ตอบสนองความต้องการของมนุษย์อย่างแท้จริงหรือเป็นเพียงการสาธิตเทคโนโลยีที่น่าประทับใจ
อ้างอิง: Al is impressive because we've failed at semantic web and personal computing