เครื่องมือเขียนที่ขับเคลื่อนด้วย AI ตัวใหม่ที่ให้นักเขียนแก้ไขเรื่องผ่านการจัดการด้วยภาพกำลังดึงดูดความสนใจจากนักพัฒนาและนักวิจัย ระบบนี้สร้างแผนที่ภาพขององค์ประกอบเรื่องราวโดยอัตโนมัติ เช่น การเคลื่อนไหวของตัวละคร ไทม์ไลน์ และความสัมพันธ์ จากนั้นให้นักเขียนปรับเปลี่ยนการเล่าเรื่องของตนโดยการลากและเชื่อมต่อส่วนประกอบภาพเหล่านี้
เครื่องมือนี้ทำงานโดยใช้ GPT-4o ในการวิเคราะห์ข้อความที่เขียนและดึงข้อมูลเรื่องราวที่สำคัญ นักเขียนสามารถโต้ตอบกับการแสดงภาพเพื่อทำการเปลี่ยนแปลง - การเชื่อมต่อตัวละครสองตัวแสดงถึงการปฏิสัมพันธ์ใหม่ การย้ายตัวละครจะอัปเดตตำแหน่งของพวกเขา และการจัดเรียงเหตุการณ์ในไทม์ไลน์ใหม่จะปรับโครงสร้างลำดับเวลาของเรื่อง การแก้ไขด้วยภาพเหล่านี้จะสร้างข้อเสนอแนะข้อความโดยอัตโนมัติเพื่อให้ตรงกับโครงสร้างเรื่องใหม่
คุณสมบัติหลัก
- การสร้างภาพเรื่องราวอัตโนมัติจากข้อความ
- การแมปการเคลื่อนไหวของตัวละครและความสัมพันธ์
- การจัดการไทม์ไลน์แบบโต้ตอบ
- คำแนะนำการแก้ไขข้อความแบบเรียลไทม์
- อินเทอร์เฟซการแก้ไขเรื่องราวแบบลากและวางที่เป็นภาพ
การประยุกต์ใช้ในเกมขับเคลื่อนความสนใจของชุมชน
การอภิปรายที่น่าตื่นเต้นที่สุดมุ่งเน้นไปที่การใช้งานในเกมที่มีศักยภาพ สมาชิกชุมชนระบุโอกาสสำหรับการสร้างเรื่องราวแบบขั้นตอนในเกมอย่าง Dwarf Fortress อย่างรวดเร็ว ซึ่งการเล่าเรื่องที่ซับซ้อนเกิดขึ้นจากการเล่นเกม แนวทางภาพอาจช่วยนักพัฒนาเกมสร้างการผจญภัยแบบข้อความและประสบการณ์การเล่นบทบาทที่ซับซ้อนมากขึ้น
นักพัฒนาคนหนึ่งกล่าวถึงศักยภาพของเครื่องมือในการเสริมเกมแบบข้อความคลาสสิกด้วยความสามารถ AI สมัยใหม่ สิ่งนี้แสดงให้เห็นสะพานเชื่อมระหว่างนิยายเชิงโต้ตอบแบบดั้งเดิมและโมเดลภาษาร่วมสมัย เปิดความเป็นไปได้ใหม่สำหรับการเล่าเรื่องแบบไดนามิกในเกม
ข้อกังวลทางวิชาการเกี่ยวกับบริบทการวิจัย
นักวิจัยบางคนแสดงความกังวลเกี่ยวกับรากฐานทางวิชาการของโครงการ นักวิจารณ์ชี้ไปที่การขาดการอ้างอิงถึงงานที่ก่อตั้งขึ้นในการทำความเข้าใจเรื่องราวเชิงคำนวณ โดยเฉพาะระบบ Genesis ของ Patrick Winston จาก MIT งานวิจัยที่มีอายุหลายทศวรรษนี้วางรากฐานสำหรับการวิเคราะห์และการสร้างเรื่องราวโดยคอมพิวเตอร์
การถกเถียงนี้เน้นย้ำความตึงเครียดที่ดำเนินต่อไปในการวิจัย AI ระหว่างการสร้างต้นแบบอย่างรวดเร็วและการวางรากฐานทางวิชาการอย่างละเอียด แม้ว่าแนวทางการแก้ไขด้วยภาพจะให้นวัตกรรมเชิงปฏิบัติ แต่บางคนโต้แย้งว่าควรยอมรับงานก่อนหน้านี้ในระบบการเล่าเรื่องเชิงคำนวณให้ดีขึ้น
การใช้งานทางเทคนิคและการเข้าถึง
เครื่องมือนี้ทำงานในเครื่องในเว็บเบราว์เซอร์โดยใช้ TypeScript และ React โดยต้องการให้ผู้ใช้จัดหา API keys ของ OpenAI เอง แนวทางนี้รักษาข้อมูลผู้ใช้เป็นส่วนตัวในขณะที่ใช้ประโยชน์จากโมเดลภาษาที่ทรงพลังสำหรับการวิเคราะห์เรื่องราว ระบบทำงานได้ดีที่สุดกับ Chrome หรือ Firefox เวอร์ชันล่าสุด
สำหรับผู้ที่ไม่มีการเข้าถึง API อินเทอร์เฟซยังคงทำงานได้แต่ไม่สามารถประมวลผลการแก้ไขเรื่องจริงได้ นักพัฒนาให้บทช่วยสอนวิดีโอและเอกสารการศึกษาเพื่อช่วยให้ผู้ใช้เข้าใจแนวคิดการแก้ไขด้วยภาพ
โครงการนี้แสดงถึงการผสมผสานที่น่าสนใจระหว่างเครื่องมือเขียนแบบดั้งเดิมกับความสามารถ AI สมัยใหม่ การทำให้โครงสร้างเรื่องมองเห็นได้และจัดการได้ อาจเปลี่ยนวิธีที่นักเขียนเข้าหาการสร้างการเล่าเรื่อง ไม่ว่าจะเป็นสำหรับวรรณกรรม เกม หรือสื่ออินเทอร์แอคทีฟอื่น ๆ
อ้างอิง: Visual Story-Writing: Writing by Manipulating Visual Representations