การอัปเดตอัลกอริทึม X เผยการปกปิดข้อมูลจำนวนมากและขาดส่วนประกอบสำคัญ

ทีมชุมชน BigGo
การอัปเดตอัลกอริทึม X เผยการปกปิดข้อมูลจำนวนมากและขาดส่วนประกอบสำคัญ

X (เดิมชื่อ Twitter ) ได้เผยแพร่เวอร์ชันอัปเดตของซอร์สโค้ดอัลกอริทึมแนะนำหลังจากช่วงว่างสองปี แต่การตอบสนองจากชุมชนส่วนใหญ่เป็นไปในทางวิพากษ์วิจารณ์ การเผยแพร่ครั้งนี้ยังคงรูปแบบเดิมในการให้ข้อมูลเชิงลึกเกี่ยวกับสถาปัตยกรรม ขณะที่ปกปิดส่วนประกอบสำคัญที่จำเป็นต่อการทำความเข้าใจว่าแพลตฟอร์มดำเนินการอย่างไรจริงๆ

การขาดน้ำหนักและข้อมูลการฝึกทำให้โค้ดไร้ประโยชน์ในทางปฏิบัติ

ข้อจำกัดที่สำคัญที่สุดของการเผยแพร่โอเพนซอร์สของ X ยังคงเป็นการไม่มีน้ำหนักโมเดลและข้อมูลการฝึก หากไม่มีส่วนประกอบเหล่านี้ นักพัฒนาจะไม่สามารถสร้างใหม่หรือวิเคราะห์อย่างมีความหมายว่าระบบแนะนำของ X ทำงานอย่างไรในทางปฏิบัติ โค้ดสถาปัตยกรรมและเฟรมเวิร์กให้เพียงแบบพิมพ์เขียว แต่เหมือนกับการมีแบบแปลนทางเทคนิคของรถยนต์โดยไม่มีเครื่องยนต์หรือระบบเชื้อเพลิง

แนวทางนี้ได้รับการเปรียบเทียบกับการเผยแพร่โอเพนซอร์สก่อนหน้านี้ของ Tesla ซึ่งมีการแชร์ไฟล์เพียงเล็กน้อยแม้จะมีการรายงานข่าวอย่างกว้างขวางที่อ้างถึงความโปร่งใสอย่างเต็มรูปแบบ รูปแบบนี้ชี้ให้เห็นว่าการเผยแพร่เหล่านี้ทำหน้าที่เป็นการออกกำลังกายด้านการประชาสัมพันธ์มากกว่าการมีส่วนร่วมโอเพนซอร์สอย่างแท้จริง

การปกปิดโค้ดอย่างกว้างขวางจำกัดการวิเคราะห์ทางเทคนิค

สมาชิกชุมชนที่ตรวจสอบโค้ดได้ค้นพบการปกปิดจำนวนมากตลอดทั้งโค้ดเบส คำสั่ง SQL มีจุดไข่ปลาในที่ที่ควรจะเป็นสคีมาฐานข้อมูลและตรรกะจริง และรายละเอียดการกำหนดค่าที่สำคัญถูกแทนที่ด้วยข้อความตัวยึดตำแหน่ง บางไฟล์มีการอ้างอิงที่ฮาร์ดโค้ดถึงคีย์การตรวจสอบสิทธิ์และข้อมูลลับที่ถูกตัดออก ทำให้โค้ดไม่ถูกต้องทางไวยากรณ์

ไม่เพียงแต่ไม่มีน้ำหนัก ไม่แน่ใจว่าความคาดหวังของผู้คนเป็นอย่างไร แต่หลายครั้งนี่ไม่ใช่แม้แต่โค้ดที่ใช้งานได้จริงเนื่องจากการปกปิดทั้งหมดที่พวกเขาทำ

การปกปิดขยายไปไกลกว่าข้อกังวลด้านความปลอดภัยไปถึงตรรกะอัลกอริทึมพื้นฐาน ทำให้เป็นไปไม่ได้ที่จะเข้าใจว่าการกรองเนื้อหา การจัดอันดับ และการตัดสินใจแนะนำทำขึ้นอย่างไรจริงๆ

ฟีเจอร์การกำหนดเป้าหมายทางการเมืองจุดประกายความขัดแย้ง

หนึ่งในการค้นพบที่ถูกพูดถึงมากที่สุดในการเผยแพร่โค้ดคือการมีอยู่ของฟีเจอร์การจำแนกทางการเมืองอย่างชัดเจน โค้ดต้นฉบับรวมถึงแฟล็กสำหรับ author_is_elon , author_is_democrat และ author_is_republican ซึ่งได้ถูกแทนที่ด้วยระบบการจำแนกทางการเมืองที่ใช้ Grok รวมถึง grok_politics_left และ grok_politics_right

แม้ว่า X จะอ้างว่าฟีเจอร์เหล่านี้ใช้เพื่อการติดตามเมตริกเท่านั้นมากกว่าการส่งเสริมเนื้อหา การค้นพบนี้ได้ทำให้เกิดคำถามเกี่ยวกับอคติของอัลกอริทึมและการกำหนดเป้าหมายทางการเมืองบนแพลตฟอร์ม การมีอยู่ของแฟล็ก author_is_elon โดยเฉพาะได้เน้นย้ำความกังวลเกี่ยวกับสิทธิพิเศษของเจ้าของในการกระจายเนื้อหา

วิวัฒนาการของฟีเจอร์การจำแนกทางการเมือง

ฟีเจอร์เดิม (ถูกลบออก):

  • author_is_elon
  • author_is_democrat
  • author_is_republican

ฟีเจอร์ปัจจุบันที่ใช้ Grok:

  • grok_politics_neutral
  • grok_politics_left
  • grok_politics_right
  • หมวดหมู่เพิ่มเติม: grok_category_sports, grok_category_music

หมายเหตุ: X อ้างว่าฟีเจอร์เหล่านี้ใช้เพื่อติดตามเมตริกเท่านั้น ไม่ใช่เพื่อส่งเสริมเนื้อหา

ชุมชนตั้งคำถามถึงความแท้จริงของโค้ดการผลิต

ผู้เชี่ยวชาญทางเทคนิคที่วิเคราะห์การเผยแพร่ได้แสดงความสงสัยว่าโค้ดที่เผยแพร่นั้นทำงานจริงในสภาพแวดล้อมการผลิตของ X หรือไม่ การรวมกันของการปกปิดอย่างกว้างขวาง การประทับเวลาที่ล้าสมัย และส่วนที่ไม่ถูกต้องทางไวยากรณ์ชี้ให้เห็นว่าโค้ดอาจเป็นเวอร์ชันที่ผ่านการทำความสะอาดมากกว่าระบบแนะนำจริง

อดีตวิศวกรของ Twitter ได้สังเกตว่าโค้ดดูเหมือนเป็นการรวบรวมเนื้อหาของที่เก็บข้อมูลแบบสุ่มมากกว่าการนำเสนอระบบแนะนำสดอย่างสอดคล้อง พนักงานปัจจุบันได้โต้แย้งการอธิบายลักษณะนี้ แต่ช่วงว่างสองปีระหว่างการอัปเดตและการปกปิดที่ชัดเจนทำให้การตรวจสอบเป็นไปไม่ได้

บทสรุป

การเผยแพร่อัลกอริทึมของ X ยังคงไม่เป็นไปตามความโปร่งใสที่มีความหมาย แม้ว่าจะให้ข้อมูลเชิงลึกเกี่ยวกับสถาปัตยกรรมบางส่วนสำหรับนักวิจัยและคู่แข่ง แต่การขาดน้ำหนัก การปกปิดอย่างกว้างขวาง และความแท้จริงที่น่าสงสัยจำกัดคุณค่าในทางปฏิบัติ การเผยแพร่นี้ดูเหมือนออกแบบมาสำหรับพาดหัวข่าวมากกว่าการร่วมมือโอเพนซอร์สอย่างแท้จริง ทำให้ชุมชนมีคำถามมากกว่าคำตอบเกี่ยวกับวิธีการดำเนินงานจริงของหนึ่งในแพลตฟอร์มโซเชียลมีเดียที่ใหญ่ที่สุดในโลก

อ้างอิง: X's Recommendation Algorithm