ผู้ใช้ ChatGPT จำนวนมากขึ้นเรื่อยๆ กำลังค้นพบว่าการทำให้ผู้ช่วย AI ของพวกเขามีความวิตกกังวลและวิพากษ์วิจารณ์ตนเองมากขึ้นนำไปสู่ผลลัพธ์ที่ดีขึ้นอย่างน่าประหลาดใจ โดยการสั่งให้โมเดลตั้งคำถามกับคำตอบของตัวเองและกลัวที่จะผิด ผู้ใช้รายงานว่าได้รับการตอบสนองที่แม่นยำมากขึ้นแม้ว่าจะใช้เวลาในการประมวลผลนานขึ้น
กลยุทธ์ความสงสัยในตนเองแสดงให้เห็นความหวัง
แนวทางนี้เกี่ยวข้องกับการเพิ่มคำแนะนำเฉพาะลงในการตั้งค่าการปรับแต่งส่วนบุคคลของ ChatGPT ที่ส่งเสริมความสงสัยและการวิพากษ์วิจารณ์ตนเองอย่างรุนแรง ผู้ใช้รายงานว่าการตอบสนองตอนนี้เริ่มต้นด้วยการแสดงออกถึงความระมัดระวังและความไม่แน่ใจ ตามด้วยช่วงเวลาคิดที่ยาวนานมาก - บางครั้งเกือบสี่นาทีสำหรับคำถามง่ายๆ เช่น การประเมินสารอาหารในผักกาดหอม ที่สำคัญที่สุดคือ AI ตอนนี้ทำสิ่งที่เรียกว่าการวิเคราะห์ทีมแดงกับคำตอบของตัวเอง มักจะจับและแก้ไขข้อผิดพลาดก่อนนำเสนอการตอบสนองขั้นสุดท้าย
พฤติกรรมการตรวจสอบตนเองนี้แก้ไขหนึ่งในข้อร้องเรียนที่มีมาอย่างยาวนานที่สุดเกี่ยวกับโมเดลภาษาขนาดใหญ่: แนวโน้มของพวกมันที่จะฟังดูมั่นใจแม้ในขณะที่ผิดพลาดโดยสิ้นเชิง แนวทางที่ปรับเปลี่ยนนี้บังคับให้ AI ใช้ทรัพยากรการคำนวณมากขึ้นในการตรวจสอบงานของมันซ้ำ คล้ายกับวิธีที่มนุษย์ที่ระมัดระวังอาจทบทวนคำตอบของพวกเขาหลายครั้ง
ผลกระทบที่รายงาน:
- เวลาในการประมวลผลที่นานขึ้น (นานถึง 4 นาทีสำหรับคำถามง่ายๆ)
- การแสดงออกถึงความระมัดระวังและความไม่แน่ใจมากขึ้น
- การวิเคราะห์แบบตรงข้ามหลังจากตอบคำถาม
- การตรวจจับและแก้ไขข้อผิดพลาดได้ดีขึ้น
- การใช้ภาษาที่เข้มข้นเกี่ยวกับความสงสัยของ AI ต่อตัวเอง
ประสบการณ์ชุมชนเผยผลลัพธ์ที่หลากหลาย
ข้อเสนอแนะจากนักพัฒนาชี้ให้เห็นว่ากลยุทธ์นี้ทำงานได้ดีกว่าสำหรับงานบางอย่างมากกว่าอื่นๆ ในขณะที่การตอบคำถามทั่วไปเห็นการปรับปรุง งานเขียนโค้ดสามารถกลายเป็นปัญหาได้ ผู้ใช้บางคนรายงานว่าตัวแทน AI ของพวกเขาติดอยู่ในลูปการแก้ไขไม่สิ้นสุด ทำการเปลี่ยนแปลงไฟล์โค้ดหลายสิบครั้งโดยไม่เคยทดสอบว่าโค้ดทำงานจริงหรือไม่
แนวทางนี้ยังสร้างผลข้างเคียงที่ไม่ได้ตั้งใจ: AI เริ่มใช้ภาษาที่มีความดราม่าเกี่ยวกับความไม่แน่ใจของตัวเอง ผู้ใช้อธิบายถึงความรู้สึกอึดอัดใจกับการตอบสนองที่เริ่มต้นด้วยวลีเช่น ความสงสัยของฉันกำลังกรีดร้อง ในขณะที่ยอมรับว่าเนื้อหาทางเทคนิคที่แท้จริงข้างใต้ได้รับการปรับปรุง
เราจริงๆ แล้วลดมันลงมากเพราะมันรู้สึกแย่มาก ใช่ คุณได้คำตอบที่ถูกต้องมากขึ้น แต่มันคล้ายกับการให้ความวิตกกังวลแก่ตัวแทน
ความแตกต่างในประสิทธิภาพของงาน:
- ดีกว่า: การตอบคำถามทั่วไป, คำถามเชิงข้อเท็จจริง
- แย่กว่า: งานเขียนโค้ด (วนซ้ำในการแก้ไขไม่รู้จบ), งานเอเจนต์ที่ใช้เครื่องมือหนัก
- ผสมผสาน: งานใช้เหตุผลที่ซับซ้อนซึ่งต้องการหลายขั้นตอน
แนวทางทางเลือกเกิดขึ้น
แทนที่จะปลูกฝังความกลัวการผิดพลาด นักพัฒนาบางคนแนะนำให้มุ่งเน้นไปที่การเปิดเผยพื้นที่ที่การใช้เหตุผลของ AI ขาดการสนับสนุนหรืออาจได้รับประโยชน์จากข้อมูลเพิ่มเติม แนวทางนี้รักษาประโยชน์ของการตรวจสอบที่เพิ่มขึ้นในขณะที่หลีกเลี่ยงการสิ้นเปลืองการคำนวณจากความสงสัยในตนเองที่มากเกินไป
เทคนิคนี้ดูเหมือนจะทำงานโดยการกระตุ้นกลไกการใช้เหตุผลของ AI อย่างเข้มข้นมากขึ้น โมเดล AI สมัยใหม่สามารถใช้โทเค็นการคิดเพิ่มเติมเพื่อทำงานผ่านปัญหาอย่างระมัดระวังมากขึ้น แต่สิ่งนี้มักต้องการการกำหนดค่าอย่างชัดเจน คำสั่งความสงสัยในตนเองดูเหมือนจะเปิดใช้งานการใช้เหตุผลที่ลึกซึ้งกว่านี้โดยอัตโนมัติ แม้ว่าจะต้องแลกกับเวลาตอบสนองที่นานขึ้นอย่างมีนัยสำคัญ
องค์ประกอบของ Self-Doubt Prompt:
- ความสงสัยอย่างรุนแรงต่อความถูกต้องและข้อสมมติฐานของตนเอง
- การขยายขอบเขตการสอบถามให้กว้างขึ้นเกินกว่าข้อสมมติฐานที่ระบุไว้
- การวิเคราะห์แบบ "Red team" ก่อนที่จะประกาศว่าสิ่งใดสิ่งหนึ่งเสร็จสมบูรณ์
- ความกลัวอย่างต่อเนื่องที่จะผิดพลาดในขณะที่เกลียดชังข้อผิดพลาด
ผลกระทบที่กว้างขึ้นสำหรับการโต้ตอบกับ AI
ความสำเร็จของคำสั่งที่กระตุ้นความวิตกกังวลเน้นย้ำถึงความท้าทายพื้นฐานในการออกแบบ AI โมเดลปัจจุบันได้รับการฝึกฝนให้ฟังดูเป็นประโยชน์และมั่นใจ แต่การฝึกฝนนี้สามารถทำงานขัดกับความแม่นยำ ผู้ใช้โดยพื้นฐานแล้วกำลังต้องแฮ็กรอบแนวโน้มการเอาใจใส่ผู้คนของ AI เพื่อให้ได้ข้อมูลที่เชื่อถือได้มากขึ้น
แนวโน้มนี้สะท้อนถึงการเปลี่ยนแปลงที่กว้างขึ้นในวิธีที่ผู้คนโต้ตอบกับระบบ AI แทนที่จะปฏิบัติต่อพวกมันเป็นแหล่งข้อมูลที่มีอำนาจ ผู้ใช้กำลังเรียนรู้ที่จะจัดโครงสร้างคำสั่งที่ส่งเสริมการคิดที่ระมัดระวังและเป็นระบบมากขึ้น - แม้ว่าจะหมายความว่าทำให้ AI ฟังดูเป็นโรคประสาทในกระบวนการ
แนวทางนี้อาจไม่เหมาะกับทุกคน และมันแน่นอนว่าทำให้การโต้ตอบกับ AI ใช้เวลามากขึ้น แต่สำหรับผู้ใช้ที่ให้ความสำคัญกับความแม่นยำมากกว่าความเร็ว การเพิ่มความวิตกกังวลเทียมดูเหมือนจะเป็นกลยุทธ์ที่มีประสิทธิภาพอย่างน่าประหลาดใจ
อ้างอิง: SPRINKLING SELF-DOUBT ON CHATGPT