ความอับอายของ ChatGPT ในเกมหมากรุกเผยข้อจำกัดของ AI ขณะที่ฟีเจอร์ปรับแต่งส่วนบุคคลแสดงให้เห็นศักยภาพ

ทีมบรรณาธิการ BigGo

ความอับอายของ ChatGPT ในเกมหมากรุกเผยข้อจำกัดของ AI ขณะที่ฟีเจอร์ปรับแต่งส่วนบุคคลแสดงให้เห็นศักยภาพ

ChatGPT ของ OpenAI ได้แสดงให้เห็นทั้งข้อจำกัดและความสามารถในการทดสอบครั้งล่าสุด โดยเผยให้เห็นช่องว่างที่สำคัญในการใช้เหตุผลเชิงพื้นที่ ขณะเดียวกันก็แสดงให้เห็นฟีเจอร์การปรับแต่งส่วนบุคคลที่ได้รับการปรับปรุง ประสบการณ์ที่ตรงกันข้ามนี้เน้นย้ำถึงสถานะปัจจุบันของโมเดลภาษาขนาดใหญ่และการประยุกต์ใช้ในทางปฏิบัติ

หายนะครั้งใหญ่ในเกมหมากรุก

ความมั่นใจของ ChatGPT กลายเป็นจุดล้มเหลวเมื่อมันอาสาเล่นหมากรุกกับโปรแกรม Video Chess ของ Atari 2600 ปี 1977 AI ประกาศอย่างมั่นใจว่าจะเอาชนะเอนจิ้นหมากรุกดั้งเดิมที่ทำงานด้วยโปรเซสเซอร์เพียง 1.19 MHz และคิดไปข้างหน้าเพียง 1-2 ตา แต่กลับกัน ChatGPT ได้รับความพ่ายแพ้อย่างน่าอับอายที่ใช้เวลา 90 นาทีในการแก้ไขและให้คำแนะนำอย่างต่อเนื่องจากวิศวกร Robert Caruso

ประสิทธิภาพของ AI นั้นแย่มาก มันสับสนระหว่างเรือกับโบสถ์ พลาดการโจมตีเบี้ยพื้นฐาน และสูญเสียการติดตามตำแหน่งของหมากบนกระดานซ้ำแล้วซ้ำเล่า แม้เมื่อได้รับสัญลักษณ์หมากรุกมาตรฐานแทนที่จะพึ่งพาไอคอนนามธรรมของ Atari , ChatGPT ยังคงทำผิดพลาดเบื้องต้นที่จะทำให้สมาชิกชมรมหมากรุกเกรดสามรู้สึกอับอาย AI ต้องการการแทรกแซงอย่างต่อเนื่องเพื่อป้องกันการเดินที่ผิดกฎและรักษาการรับรู้กระดานที่แย่ตลอดการแข่งขัน

ปัญหาการเล่นหมากรุกของ ChatGPT :

สับสนระหว่างเรือกับโคน
พลาดการโจมตีแบบง่าย ๆ ของเบี้ย
สูญเสียการติดตามตำแหน่งของหมากรุกซ้ำ ๆ
ต้องการการแทรกแซงจากมนุษย์อย่างต่อเนื่องเป็นเวลา 90 นาที
พยายามเดินหมากที่ผิดกฎ
ไม่สามารถรักษาสถานะของกระดานให้สอดคล้องกันได้

ปัญหาบริบทและความจำ

ความล้มเหลวในหมากรุกเผยให้เห็นจุดอ่อนพื้นฐานในเทคโนโลยี LLM ปัจจุบัน ความไม่สามารถของ ChatGPT ในการรักษาสถานะกระดานที่สอดคล้องกันจากตาต่อตาทำให้เกิดคำถามร้ายแรงเกี่ยวกับความสามารถในการรักษาบริบทสำคัญในการสนทนา ข้อจำกัดนี้ขยายไปเกินกว่าเกมสู่การประยุกต์ใช้ในทางปฏิบัติที่การรักษาข้อมูลที่ถูกต้องตลอดการโต้ตอบที่ยาวนานเป็นสิ่งจำเป็น

แม้จะมีช่วงเวลาของการให้คำแนะนำเชิงกลยุทธ์ที่มั่นคงเป็นครั้งคราวเมื่อมีมุมมองที่ถูกต้องของกระดาน ChatGPT มักแนะนำให้เดินหมากที่ถูกจับไปแล้วหรือให้คำแนะนำที่ไร้สาระ ความสามารถในการใช้เหตุผลเชิงพื้นที่ของ AI ดูเหมือนจะจำกัดอย่างรุนแรง ดิ้นรนกับความต้องการพื้นฐานในการติดตามตำแหน่งวัตถุในพื้นที่จำกัด

ข้อมูลจำเพาะของ Atari 2600 Video Chess :

วางจำหน่าย: 1977
โปรเซสเซอร์: CPU 1.19 MHz
หน่วยความจำ: 4KB (เป็นสองเท่าของมาตรฐาน 2KB สำหรับเกม VCS)
กลยุทธ์: การคำนวณการเดินที่ดีที่สุดแบบ brute force
ความลึกในการคิด: คิดล่วงหน้า 1-2 ตา
ไม่มีการวางแผนกลยุทธ์โดยรวม

เรื่องราวความสำเร็จของการปรับแต่งส่วนบุคคล

ตรงกันข้ามกับประสิทธิภาพหมากรุก ChatGPT แสดงความสามารถที่น่าประทับใจเมื่อใช้ประโยชน์จากข้อมูลส่วนบุคคลที่ปรับแต่ง การทดสอบล่าสุดของฟีเจอร์การปรับแต่งของแพลตฟอร์มเผยให้เห็นว่า AI สามารถรวมรายละเอียดส่วนบุคคลเพื่อเพิ่มประสบการณ์ผู้ใช้ได้อย่างมีประสิทธิภาพเพียงใด ผู้ใช้ตอนนี้สามารถแบ่งปันข้อมูลชีวประวัติ ความชอบ และรายละเอียดบริบทที่ ChatGPT จดจำและอ้างอิงในการสนทนาในอนาคต

ระบบการปรับแต่งส่วนบุคคลช่วยให้ผู้ใช้สามารถสร้างคำแนะนำแบบกำหนดเอง บันทึกความทรงจำ และเปิดใช้งานการอ้างอิงประวัติการแชท เมื่อกำหนดค่าอย่างถูกต้อง ChatGPT สามารถทำให้ผู้ใช้ประหลาดใจโดยการรวมรายละเอียดส่วนบุคคลอย่างสร้างสรรค์โดยไม่ต้องแจ้งอย่างชัดเจน ในตัวอย่างหนึ่ง AI รวมแมวของผู้ใช้ชื่อ Mr. Giggles ในเรื่องราวนิยายวิทยาศาสตร์เกี่ยวกับ tachyons โดยแสดงให้เห็นการตระหนักรู้บริบทและการประยุกต์ใช้ข้อมูลที่เก็บไว้อย่างสร้างสรรค์

คุณสมบัติการปรับแต่งส่วนบุคคลของ ChatGPT:

คำแนะนำที่กำหนดเองสำหรับความต้องการของผู้ใช้
ระบบบันทึกความทรงจำ
การอ้างอิงประวัติการสนทนา
การรวมรายละเอียดส่วนบุคคลโดยอัตโนมัติ
คำแนะนำร้านอาหารและสถานที่
การสร้างเพลย์ลิสต์เพลงพร้อมลิงก์โดยตรง
การรวมเรื่องราวสร้างสรรค์โดยใช้ข้อมูลส่วนบุคคล


โลโก้ที่มีการออกแบบเป็นสัญลักษณ์แห่งนวัตกรรมและการเชื่อมต่อ สะท้อนคุณสมบัติการปรับแต่งเฉพาะบุคคลที่น่าประทับใจของ ChatGPT

การประยุกต์ใช้ในทางปฏิบัติและข้อจำกัด

ฟีเจอร์การปรับแต่งส่วนบุคคลแสดงประโยชน์ใช้สอยที่แท้จริงในการโต้ตอบประจำวัน ChatGPT สามารถแนะนำร้านอาหารตามอาหารโปรดและสถานที่ สร้างเพลย์ลิสต์ที่มีศิลปินที่ชื่นชอบ และแม้กระทั่งรวมรายการทีวีที่รักใส่ในคำอธิบายการศึกษา ความสามารถเหล่านี้แสดงให้เห็นว่าเทคโนโลยีเก่งในการจับคู่รูปแบบและการสังเคราะห์เชิงสร้างสรรค์เมื่อทำงานกับข้อมูลที่มีโครงสร้างดีและเป็นการประกาศ

อย่างไรก็ตาม ผู้ใช้ควรใช้ความระมัดระวังเมื่อแบ่งปันข้อมูลส่วนบุคคล ในขณะที่ OpenAI อ้างว่ามีการทำให้ข้อมูลไม่ระบุตัวตนและการเข้าถึงของพนักงานที่จำกัด แนวทางที่รอบคอบเกี่ยวข้องกับการแบ่งปันเฉพาะข้อมูลที่คนหนึ่งจะสบายใจที่จะเปิดเผยต่อคนอื่น ความสมดุลระหว่างประโยชน์ของการปรับแต่งส่วนบุคคลและข้อกังวลด้านความเป็นส่วนตัวยังคงเป็นการพิจารณาสำคัญสำหรับผู้ใช้

ผลกระทบในวงกว้าง

ประสบการณ์ที่ตรงกันข้ามเหล่านี้เผยให้เห็นขอบเขตปัจจุบันของเทคโนโลยี LLM ChatGPT เก่งในการประมวลผลภาษา การสังเคราะห์เชิงสร้างสรรค์ และการทำงานกับข้อมูลที่ระบุอย่างชัดเจน แต่ดิ้นรนกับการใช้เหตุผลเชิงพื้นที่ การติดตามสถานะ และการแก้ปัญหาแบบเรียลไทม์ที่ต้องการโมเดลทางจิตที่สอดคล้องกัน

หายนะหมากรุกทำหน้าที่เป็นการเตือนใจที่ถ่อมตัวว่าแม้จะมีความสามารถด้านภาษาที่น่าประทับใจ ระบบ AI ปัจจุบันมีจุดบอดที่สำคัญ ในขณะที่ผู้สนับสนุน AI อาจยกเลิกหมากรุกว่าอยู่นอกขอบเขตที่ตั้งใจของ LLM ปัญหาพื้นฐานของการรักษาบริบทและความสอดคล้องเชิงตรรกะส่งผลต่อการประยุกต์ใช้ในทางปฏิบัติหลายอย่าง จุดแข็งและจุดอ่อนของเทคโนโลยีแนะนำว่าผู้ใช้ควรใช้ประโยชน์จาก ChatGPT สำหรับความสามารถที่แสดงให้เห็นแล้วในขณะที่ยังคงตระหนักถึงข้อจำกัดพื้นฐาน

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌