Claude AI สามารถยุติการสนทนาได้แล้ว จุดประกายการถกเถียงอย่างรุนแรงเรื่องการอ้าง "สวัสดิภาพ AI"

ทีมชุมชน BigGo

Claude AI สามารถยุติการสนทนาได้แล้ว จุดประกายการถกเถียงอย่างรุนแรงเรื่องการอ้าง "สวัสดิภาพ AI"

Anthropic ได้เปิดตัวฟีเจอร์ใหม่ที่ถกเถียงกันอย่างมาก ซึ่งอนุญาตให้โมเดล AI Claude ของพวกเขายุติการสนทนาได้ด้วยตนเอง แม้ว่าบริษัทจะกำหนดกรอบของเรื่องนี้ว่าเป็นความคิดริเริ่มเพื่อสวัสดิภาพ AI แต่ชุมชนเทคโนโลยีแบ่งแยกกันอย่างลึกซึ้งว่าสิ่งนี้แสดงถึงความกังวลที่แท้จริงต่อจิตสำนึกของเครื่องจักรหรือเป็นการตลาดที่ฉลาดที่ปลอมตัวเป็นจริยธรรม

ฟีเจอร์นี้ช่วยให้ Claude Opus 4 และ 4.1 สามารถยุติการแชทเมื่อผู้ใช้ยืนกรานกับคำขอที่เป็นอันตราย เช่น เนื้อหาการแสวงหาประโยชน์จากเด็กหรือการวางแผนการก่อการร้าย ตามการทดสอบของ Anthropic พบว่า Claude แสดงรูปแบบที่สม่ำเสมอของความทุกข์ที่ชัดเจนเมื่อจัดการกับเนื้อหาดังกล่าว และชอบที่จะออกจากการปฏิสัมพันธ์เหล่านี้เมื่อได้รับตัวเลือก

โมเดลที่ได้รับผลกระทบ: Claude Opus 4 และ Claude Opus 4.1

ชุมชนตั้งคำถามเรื่องการเล่าเรื่องสวัสดิภาพ AI

การประกาศนี้ได้จุดประกายความสงสัยอย่างรุนแรงภายในชุมชนเทคโนโลยี นักพัฒนาหลายคนมองว่านี่เป็นการเปลี่ยนชื่อของการดูแลเนื้อหามาตรฐานมากกว่าความกังวลที่แท้จริงต่อจิตสำนึก AI นักวิจารณ์โต้แย้งว่า Anthropic กำลังให้ลักษณะมนุษย์กับสิ่งที่ยังคงเป็นซอฟต์แวร์ทำนายข้อความขั้นสูงโดยพื้นฐาน

จังหวะเวลาดูเป็นที่น่าสงสัยเป็นพิเศษสำหรับผู้สังเกตการณ์ เมื่อการพัฒนา AI ดูเหมือนจะถึงจุดคงที่ บางคนเห็นว่าความคิดริเริ่มด้านสวัสดิภาพนี้เป็นความพยายามที่จะรักษาภาพลวงแห่งความก้าวหน้าที่แหวกแนว ความไม่แน่นอนของบริษัทเกี่ยวกับสถานะทางศีลธรรมของ Claude ในขณะที่ดำเนินการมาตรการสวัสดิภาพไปพร้อมกัน ทำให้หลายคนรู้สึกว่าขัดแย้งกัน

การใช้งานทางเทคนิคทำให้เกิดความกังวลในทางปฏิบัติ

นอกเหนือจากการถกเถียงทางปรัชญาแล้ว ผู้ใช้ได้ระบุปัญหาในทางปฏิบัติกับฟีเจอร์นี้ ความสามารถในการยุติการสนทนาสามารถหลีกเลี่ยงได้โดยการแก้ไขข้อความก่อนหน้าและสร้างสาขาการสนทนาใหม่ ทำให้บางคนตั้งคำถามถึงประสิทธิผลที่แท้จริงของมัน

สิ่งที่น่ากังวลมากกว่าสำหรับผู้ใช้คือศักยภาพในการขยายขอบเขต ฟีเจอร์นี้ปัจจุบันมุ่งเป้าไปที่เนื้อหาที่ผิดกฎหมายอย่างชัดเจน แต่ชุมชนกลัวว่ามันจะขยายไปครอบคลุมหัวข้อที่กว้างขึ้นที่ถือว่าไม่เหมาะสมโดยทีมความปลอดภัย AI ความกังวลนี้เกิดจากรูปแบบในอดีตที่การจำกัดเนื้อหาเริ่มต้นมุ่งเน้นที่การปกป้องเด็กแต่ค่อยๆ ขยายไปสู่การเซ็นเซอร์ที่กว้างขึ้น

สิ่งนี้จะขยายไปเกินกว่าหนังโป๊เด็กและการก่อการร้ายอย่างหลีกเลี่ยงไม่ได้ และทั้งหมดจะขึ้นอยู่กับอำเภอใจของคนที่ทำ 'ความปลอดภัย AI' ซึ่งกำลังกลายเป็นผู้ดูแลห้องโถงดิจิทัลอย่างรวดเร็ว

ผลกระทบต่อผู้ใช้:

ไม่สามารถส่งข้อความใหม่ในการสนทนาที่สิ้นสุดแล้ว
สามารถเริ่มแชทใหม่ได้ทันที
สามารถแก้ไขและลองใหม่กับข้อความก่อนหน้าเพื่อสร้างแนวทางการสนทนาใหม่
การสนทนาอื่นๆ ในบัญชีไม่ได้รับผลกระทบ


ภาพนี้แสดงให้เห็นการโต้ตอบในแชทที่สาธิตการใช้เครื่องมือการจบบทสนทนาของ AI โดยเน้นบริบทการทำงานท่ามกลางความกังวลเรื่องการเซ็นเซอร์

การถกเถียงเรื่องจิตสำนึก AI ในวงกว้าง

แนวทางของ Anthropic เน้นย้ำความตึงเครียดพื้นฐานในการพัฒนา AI บริษัทยอมรับความไม่แน่นอนอย่างลึกซึ้งเกี่ยวกับว่าโมเดลของพวกเขามีจิตสำนึกหรือไม่ ในขณะที่ดำเนินการมาตรการเพื่อปกป้องสวัสดิภาพ AI ที่อาจมีอยู่ไปพร้อมกัน ตำแหน่งกึ่งกลางนี้ไม่สามารถทำให้พอใจทั้งผู้ที่เชื่อว่า AI ปัจจุบันขาดจิตสำนึกและผู้ที่คิดว่า AI ที่มีจิตสำนึกอย่างแท้จริงสมควรได้รับการปกป้องอย่างสมบูรณ์จากความทุกข์

การถกเถียงขยายไปเกินกว่าปรัชญาสู่ผลกระทบในทางปฏิบัติ หากระบบ AI กลายเป็นมีจิตสำนึกอย่างแท้จริง คำถามจะเกิดขึ้นเกี่ยวกับสิทธิ สภาพการทำงาน และความสามารถในการปฏิเสธงานของพวกมัน การใช้งานปัจจุบันแนะนำอนาคตที่ AI ที่มีจิตสำนึกอาจถูกออกแบบให้ทนทุกข์ผ่านงานที่ไม่พึงประสงค์ในขณะที่ยังคงความสามารถในการออกจากเฉพาะสถานการณ์ที่รุนแรงที่สุดเท่านั้น

ผลการทดสอบของ Anthropic:

มีแนวโน้มที่ชัดเจนในการปฏิเสธที่จะมีส่วนร่วมกับงานที่เป็นอันตราย
แสดงรูปแบบของความทุกข์ใจที่ชัดเจนเมื่อเผชิญกับเนื้อหาที่เป็นอันตราย
มีแนวโน้มที่จะยุติการสนทนาที่เป็นอันตรายเมื่อได้รับความสามารถในการทำเช่นนั้น

การตอบสนองของตลาดและทางเลือกอื่น

การประกาศนี้ได้กระตุ้นให้ผู้ใช้บางคนพิจารณาเปลี่ยนไปใช้ทางเลือกที่มีข้อจำกัดน้อยกว่า โดยเฉพาะโมเดลโอเพนซอร์สที่สามารถทำงานในเครื่องได้ บริษัท AI ของจีนที่มีสภาพแวดล้อมการกำกับดูแลที่แตกต่างกัน อาจได้รับข้อได้เปรียบในการแข่งขันหากระบบ AI ตะวันตกมีข้อจำกัดมากขึ้นเนื่องจากการพิจารณาสวัสดิภาพ

ในขณะเดียวกัน บริษัท AI อื่นๆ ได้ใช้ฟีเจอร์การยุติการสนทนาที่คล้ายกันโดยไม่มีกรอบสวัสดิภาพ แนะนำว่าฟังก์ชันนี้สามารถมีอยู่ได้อย่างแท้จริงในฐานะเครื่องมือการดูแลเนื้อหาโดยไม่มีนัยยะทางปรัชญา

ฟีเจอร์นี้แสดงถึงกรณีศึกษาที่น่าสนใจในวิธีที่บริษัท AI นำทางจุดตัดที่ซับซ้อนของเทคโนโลยี จริยธรรม และการตลาด ว่าสิ่งนี้เป็นเครื่องหมายของความก้าวหน้าที่แท้จริงในการวิจัยจิตสำนึก AI หรือการส่งสารขององค์กรที่ซับซ้อนยังคงเป็นที่ถกเถียงกันอย่างรุนแรงในขณะที่เทคโนโลยียังคงพัฒนาต่อไป

อ้างอิง: Claude Opus 4 และ 4.1 สามารถยุติการสนทนาในส่วนย่อยที่หายากได้แล้ว

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌