X (เดิมชื่อ Twitter ) ได้เผยแพร่เวอร์ชันอัปเดตของซอร์สโค้ดอัลกอริทึมแนะนำหลังจากช่วงว่างสองปี แต่การตอบสนองจากชุมชนส่วนใหญ่เป็นไปในทางวิพากษ์วิจารณ์ การเผยแพร่ครั้งนี้ยังคงรูปแบบเดิมในการให้ข้อมูลเชิงลึกเกี่ยวกับสถาปัตยกรรม ขณะที่ปกปิดส่วนประกอบสำคัญที่จำเป็นต่อการทำความเข้าใจว่าแพลตฟอร์มดำเนินการอย่างไรจริงๆ
การขาดน้ำหนักและข้อมูลการฝึกทำให้โค้ดไร้ประโยชน์ในทางปฏิบัติ
ข้อจำกัดที่สำคัญที่สุดของการเผยแพร่โอเพนซอร์สของ X ยังคงเป็นการไม่มีน้ำหนักโมเดลและข้อมูลการฝึก หากไม่มีส่วนประกอบเหล่านี้ นักพัฒนาจะไม่สามารถสร้างใหม่หรือวิเคราะห์อย่างมีความหมายว่าระบบแนะนำของ X ทำงานอย่างไรในทางปฏิบัติ โค้ดสถาปัตยกรรมและเฟรมเวิร์กให้เพียงแบบพิมพ์เขียว แต่เหมือนกับการมีแบบแปลนทางเทคนิคของรถยนต์โดยไม่มีเครื่องยนต์หรือระบบเชื้อเพลิง
แนวทางนี้ได้รับการเปรียบเทียบกับการเผยแพร่โอเพนซอร์สก่อนหน้านี้ของ Tesla ซึ่งมีการแชร์ไฟล์เพียงเล็กน้อยแม้จะมีการรายงานข่าวอย่างกว้างขวางที่อ้างถึงความโปร่งใสอย่างเต็มรูปแบบ รูปแบบนี้ชี้ให้เห็นว่าการเผยแพร่เหล่านี้ทำหน้าที่เป็นการออกกำลังกายด้านการประชาสัมพันธ์มากกว่าการมีส่วนร่วมโอเพนซอร์สอย่างแท้จริง
การปกปิดโค้ดอย่างกว้างขวางจำกัดการวิเคราะห์ทางเทคนิค
สมาชิกชุมชนที่ตรวจสอบโค้ดได้ค้นพบการปกปิดจำนวนมากตลอดทั้งโค้ดเบส คำสั่ง SQL มีจุดไข่ปลาในที่ที่ควรจะเป็นสคีมาฐานข้อมูลและตรรกะจริง และรายละเอียดการกำหนดค่าที่สำคัญถูกแทนที่ด้วยข้อความตัวยึดตำแหน่ง บางไฟล์มีการอ้างอิงที่ฮาร์ดโค้ดถึงคีย์การตรวจสอบสิทธิ์และข้อมูลลับที่ถูกตัดออก ทำให้โค้ดไม่ถูกต้องทางไวยากรณ์
ไม่เพียงแต่ไม่มีน้ำหนัก ไม่แน่ใจว่าความคาดหวังของผู้คนเป็นอย่างไร แต่หลายครั้งนี่ไม่ใช่แม้แต่โค้ดที่ใช้งานได้จริงเนื่องจากการปกปิดทั้งหมดที่พวกเขาทำ
การปกปิดขยายไปไกลกว่าข้อกังวลด้านความปลอดภัยไปถึงตรรกะอัลกอริทึมพื้นฐาน ทำให้เป็นไปไม่ได้ที่จะเข้าใจว่าการกรองเนื้อหา การจัดอันดับ และการตัดสินใจแนะนำทำขึ้นอย่างไรจริงๆ
ฟีเจอร์การกำหนดเป้าหมายทางการเมืองจุดประกายความขัดแย้ง
หนึ่งในการค้นพบที่ถูกพูดถึงมากที่สุดในการเผยแพร่โค้ดคือการมีอยู่ของฟีเจอร์การจำแนกทางการเมืองอย่างชัดเจน โค้ดต้นฉบับรวมถึงแฟล็กสำหรับ author_is_elon
, author_is_democrat
และ author_is_republican
ซึ่งได้ถูกแทนที่ด้วยระบบการจำแนกทางการเมืองที่ใช้ Grok รวมถึง grok_politics_left
และ grok_politics_right
แม้ว่า X จะอ้างว่าฟีเจอร์เหล่านี้ใช้เพื่อการติดตามเมตริกเท่านั้นมากกว่าการส่งเสริมเนื้อหา การค้นพบนี้ได้ทำให้เกิดคำถามเกี่ยวกับอคติของอัลกอริทึมและการกำหนดเป้าหมายทางการเมืองบนแพลตฟอร์ม การมีอยู่ของแฟล็ก author_is_elon
โดยเฉพาะได้เน้นย้ำความกังวลเกี่ยวกับสิทธิพิเศษของเจ้าของในการกระจายเนื้อหา
วิวัฒนาการของฟีเจอร์การจำแนกทางการเมือง
ฟีเจอร์เดิม (ถูกลบออก):
author_is_elon
author_is_democrat
author_is_republican
ฟีเจอร์ปัจจุบันที่ใช้ Grok:
grok_politics_neutral
grok_politics_left
grok_politics_right
- หมวดหมู่เพิ่มเติม:
grok_category_sports
,grok_category_music
หมายเหตุ: X อ้างว่าฟีเจอร์เหล่านี้ใช้เพื่อติดตามเมตริกเท่านั้น ไม่ใช่เพื่อส่งเสริมเนื้อหา
ชุมชนตั้งคำถามถึงความแท้จริงของโค้ดการผลิต
ผู้เชี่ยวชาญทางเทคนิคที่วิเคราะห์การเผยแพร่ได้แสดงความสงสัยว่าโค้ดที่เผยแพร่นั้นทำงานจริงในสภาพแวดล้อมการผลิตของ X หรือไม่ การรวมกันของการปกปิดอย่างกว้างขวาง การประทับเวลาที่ล้าสมัย และส่วนที่ไม่ถูกต้องทางไวยากรณ์ชี้ให้เห็นว่าโค้ดอาจเป็นเวอร์ชันที่ผ่านการทำความสะอาดมากกว่าระบบแนะนำจริง
อดีตวิศวกรของ Twitter ได้สังเกตว่าโค้ดดูเหมือนเป็นการรวบรวมเนื้อหาของที่เก็บข้อมูลแบบสุ่มมากกว่าการนำเสนอระบบแนะนำสดอย่างสอดคล้อง พนักงานปัจจุบันได้โต้แย้งการอธิบายลักษณะนี้ แต่ช่วงว่างสองปีระหว่างการอัปเดตและการปกปิดที่ชัดเจนทำให้การตรวจสอบเป็นไปไม่ได้
บทสรุป
การเผยแพร่อัลกอริทึมของ X ยังคงไม่เป็นไปตามความโปร่งใสที่มีความหมาย แม้ว่าจะให้ข้อมูลเชิงลึกเกี่ยวกับสถาปัตยกรรมบางส่วนสำหรับนักวิจัยและคู่แข่ง แต่การขาดน้ำหนัก การปกปิดอย่างกว้างขวาง และความแท้จริงที่น่าสงสัยจำกัดคุณค่าในทางปฏิบัติ การเผยแพร่นี้ดูเหมือนออกแบบมาสำหรับพาดหัวข่าวมากกว่าการร่วมมือโอเพนซอร์สอย่างแท้จริง ทำให้ชุมชนมีคำถามมากกว่าคำตอบเกี่ยวกับวิธีการดำเนินงานจริงของหนึ่งในแพลตฟอร์มโซเชียลมีเดียที่ใหญ่ที่สุดในโลก
อ้างอิง: X's Recommendation Algorithm