โมเดล AI สามารถสร้างโปรไฟล์ส่วนตัวที่ละเอียดได้จากรายการบุ๊กมาร์กธรรมดา

ทีมชุมชน BigGo
โมเดล AI สามารถสร้างโปรไฟล์ส่วนตัวที่ละเอียดได้จากรายการบุ๊กมาร์กธรรมดา

การทดลองล่าสุดได้เปิดเผยให้เห็นว่าปัญญาประดิษฐ์สามารถเรียนรู้เกี่ยวกับเราได้มากแค่ไหนจากข้อมูลที่ดูเหมือนไม่เป็นอันตราย เมื่อผู้ใช้คนหนึ่งนำบทความที่บันทึกไว้ใน Pocket เป็นเวลาเจ็ดปีมาป้อนให้กับโมเดล o3 ของ OpenAI ผลลัพธ์ที่ได้นั้นแม่นยำและละเอียดอย่างน่าประหลาดใจ

การทดลองนี้เกี่ยวข้องกับการวิเคราะห์บทความที่บันทึกไว้เกือบ 900 บทความที่ครอบคลุมหัวข้อต่างๆ AI สามารถทำนายช่วงอายุของผู้ใช้ ที่อยู่ ขนาดครอบครัว ระดับรายได้ และแม้กระทั่งรายละเอียดเฉพาะเจาะจงอย่างศาสนา Catholic และอาชีพด้านวิศวกรรมซอฟต์แวร์ได้อย่างถูกต้อง สิ่งที่ทำให้เรื่องนี้น่าสนใจเป็นพิเศษก็คือ ข้อมูลที่ใช้ประกอบด้วยเพียง URL เท่านั้น โดยไม่ได้ให้ข้อมูลส่วนตัวโดยตรงแต่อย่างใด

องค์ประกอบโปรไฟล์ที่ทำนายได้สำเร็จ

  • ช่วงอายุ (กลางวัย 30 ถึงต้นวัย 40)
  • ตำแหน่งทางภูมิศาสตร์ ( Coastal Virginia )
  • องค์ประกอบครอบครัว (แต่งงานแล้ว มีลูก 3-4 คนวัยเด็ก)
  • กลุ่มรายได้ ($150-220k USD รายได้ครัวเรือน)
  • ระดับการศึกษา ( BS/MS Computer Science )
  • บทบาทในอาชีพ ( Senior/Staff Software Engineer )
  • ความเชื่อทางศาสนา ( Catholic )
  • แนวโน้มทางการเมือง (อนุรักษ์นิยมทางการเงิน เสรีนิยมด้านสิทธิพลเมือง)

การทดสอบจากชุมชนเผยผลลัพธ์ที่หลากหลายในโมเดล AI ต่างๆ

หลังจากการทดลองครั้งแรก สมาชิกชุมชนหลายคนได้ทดสอบวิธีการนี้กับโมเดล AI ต่างๆ และข้อมูลของตนเอง ผู้ใช้คนหนึ่งที่มีรายการบันทึกไว้ 4,200 รายการพบว่า แม้อินเทอร์เฟซของ ChatGPT จะไม่สามารถจัดการกับข้อมูลขนาดใหญ่ได้ แต่ทั้ง Gemini 2.5 Pro ของ Google และ Claude Opus 4 ของ Anthropic ให้ผลลัพธ์ที่มีความแม่นยำในระดับต่างๆ กัน Gemini สามารถระบุลักษณะบุคลิกภาพและความสนใจได้อย่างถูกต้อง แต่พลาดรายละเอียดด้านประชากรศาสตร์ที่สำคัญ Claude Opus สามารถระบุที่อยู่ ( Amsterdam ) และสถานะความสัมพันธ์ได้อย่างน่าประทับใจ แต่มีปัญหาในการระบุสถานะการเป็นพ่อแม่

การทดสอบเผยให้เห็นรูปแบบที่น่าสนใจ โมเดลต่างๆ มักจะระบุบทบาทงานผิดเมื่อผู้ใช้มีความสนใจข้ามสาขาวิชา นักวิทยาศาสตร์ข้อมูลที่อ่านเกี่ยวกับวิศวกรรมซอฟต์แวร์อย่างกว้างขวางถูกจัดประเภทเป็นวิศวกรซอฟต์แวร์อย่างสม่ำเสมอโดยโมเดลหลายตัว

การเปรียบเทียบประสิทธิภาพของโมเดล AI

โมเดล ความแม่นยำ จุดแข็ง จุดอ่อน
OpenAI o3 สูง ข้อมูลประชากรศาสตร์ ที่ตั้ง รายละเอียดครอบครัว ต้องการข้อมูลนำเข้าแบบ CSV โดยตรง
Google Gemini 2.5 Pro ปานกลาง บุคลิกภาพ ความสนใจ อายุ บทบาทงาน ที่ตั้ง
Claude Opus 4 สูง ที่ตั้ง สถานะความสัมพันธ์ สถานะการเป็นผู้ปกครอง การจำแนกประเภทงาน

ผลกระทบด้านความเป็นส่วนตัวและการประยุกต์ใช้ในวงกว้าง

การทดลองนี้เน้นย้ำถึงความกังวลที่เพิ่มขึ้นเกี่ยวกับความเป็นส่วนตัวทางดิจิทัลในยุคของ AI ขั้นสูง สมาชิกชุมชนสังเกตว่าเทคโนโลยีนี้ขณะนี้เปิดให้ใช้งานได้กับเกือบทุกคน ไม่ใช่เฉพาะบริษัทเทคโนโลยีขนาดใหญ่ที่มีทรัพยากรมากมายเท่านั้น ผู้ใช้บางคนรายงานว่าได้ใช้เทคนิคที่คล้ายกันในการระบุผู้ที่อาจเป็นโทรลล์ออนไลน์โดยการวิเคราะห์ประวัติความคิดเห็นแล้ว ในขณะที่คนอื่นๆ กังวลเกี่ยวกับผลกระทบของแชทบอท AI ที่สร้างโปรไฟล์ละเอียดจากข้อมูลการสนทนา

แพลตฟอร์มทั้งหมดที่มีข้อมูลผู้ใช้ กำลังใช้ LLM เพื่อสร้างโปรไฟล์ดังกล่าวสำหรับผู้ลงโฆษณาของพวกเขา ฉันพนันได้

การอภิปรายยังเผยให้เห็นการประยุกต์ใช้ในทางปฏิบัตินอกเหนือจากความกังวลด้านความเป็นส่วนตัว ผู้ใช้กำลังสำรวจวิธีการใช้ประโยชน์จากความสามารถในการสร้างโปรไฟล์นี้สำหรับระบบแนะนำเนื้อหาส่วนบุคคล การจัดระเบียบคอลเลกชันบุ๊กมาร์กขนาดใหญ่ และแม้กระทั่งการสร้างฟีด RSS ส่วนบุคคลที่อิงจากโปรไฟล์ความสนใจที่ AI สร้างขึ้น

การวิเคราะห์ต้นทุนสำหรับการสร้างโปรไฟล์ด้วย AI

  • ข้อมูลนำเข้า: ~4,200 URLs (85,000 tokens)
  • ข้อมูลส่งออก: ~2,000 tokens
  • ต้นทุนผ่าน OpenAI o3 API : ~$0.18 USD
  • เวลาในการประมวลผล: ไม่ถึง 1 นาที

ข้อพิจารณาทางเทคนิคและค่าใช้จ่าย

จากมุมมองทางปฏิบัติ การทำการวิเคราะห์เช่นนี้มีราคาไม่แพงอย่างน่าประหลาดใจ การประมวลผล URL ประมาณ 4,200 รายการ (ประมาณ 85,000 โทเค็น) ผ่านโมเดล o3 ของ OpenAI มีค่าใช้จ่ายประมาณ 18 เซ็นต์ดอลลาร์สหรัฐฯ ผ่าน API อย่างไรก็ตาม ผู้ใช้พบว่าการวางข้อมูล CSV โดยตรงในพรอมต์ทำงานได้ดีกว่าการอัปโหลดไฟล์ เนื่องจากวิธีหลังทำให้โมเดลมุ่งเน้นไปที่การวิเคราะห์ข้อมูลมากเกินไปแทนที่จะเป็นการสร้างเรื่องเล่า

การทดลองนี้ทำหน้าที่เป็นการเตือนใจว่าร่องรอยดิจิทัลของเราเผยให้เห็นเกี่ยวกับตัวเรามากกว่าที่เราอาจคาดคิด เมื่อความสามารถของ AI ยังคงพัฒนาต่อไป เส้นแบ่งระหว่างความสะดวกสบายและความเป็นส่วนตัวก็กลายเป็นเรื่องที่เบลอมากขึ้น ทำให้เป็นสิ่งสำคัญสำหรับผู้ใช้ที่จะต้องเข้าใจว่าเส้นทางข้อมูลของพวกเขาอาจเผยให้เห็นอะไรเกี่ยวกับชีวิตส่วนตัวของพวกเขา

อ้างอิง: I used o3 to profile myself from my saved Pocket links