iNaturalist เก็บโมเดล AI ไว้เป็นความลับแม้ได้รับการสนับสนุนจากชุมชน จุดประกายการถ่ายเทเรื่องวิทยาศาสตร์เปิด

ทีมชุมชน BigGo
iNaturalist เก็บโมเดล AI ไว้เป็นความลับแม้ได้รับการสนับสนุนจากชุมชน จุดประกายการถ่ายเทเรื่องวิทยาศาสตร์เปิด

แพลตฟอร์มระบุชนิดสิ่งมีชีวิตยอดนิยม iNaturalist ได้เผยแพร่เอกสารทางเทคนิคสำหรับ computer vision API ของพวกเขา แต่การเคลื่อนไหวนี้ได้จุดประกายการถกเถียงอย่างรุนแรงเกี่ยวกับความเป็นเจ้าของข้อมูลและความโปร่งใสทางวิทยาศาสตร์อีกครั้ง แม้ว่าองค์กรจะทำให้โมเดลขนาดเล็กพร้อมใช้งานสาธารณะ แต่โมเดลการจำแนกชนิดพันธุ์แบบเต็มรูปแบบของพวกเขายังคงถูกล็อกไว้ โดยอ้างถึงข้อกังวลเรื่องทรัพย์สินทางปัญญาและนโยบายขององค์กร

การตัดสินใจนี้ได้สร้างความตึงเครียดในชุมชนวิทยาศาสตร์ โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่า iNaturalist ดำเนินงานในฐานะองค์กรไม่แสวงหาผลกำไรที่ได้รับทุนหลักจากการบริจาคและทุนอุดหนุน แพลตฟอร์มนี้พึ่พาอย่างมากกับการสนับสนุนจากอาสาสมัครผู้ใช้ที่ถ่ายภาพและระบุชนิดพันธุ์ทั่วโลก ซึ่งเป็นการให้แรงงานฟรีเพื่อฝึกโมเดล AI ที่ซับซ้อน

ภาพรวมทางการเงินของ iNaturalist ปี 2024:

  • รายได้รวม: 4.71 ล้านดอลลาร์สหรัฐ
  • แหล่งเงินทุน: 94% มาจากการบริจาคและแหล่งเงินทุนเพื่อการกุศล
  • ขนาดพนักงาน: พนักงานเต็มเวลาประมาณ 20 คน
  • อัตราการบริจาคของผู้ใช้: 0.24% ของผู้ใช้ทำการบริจาค
  • ผู้ให้ทุนหลัก: Gordon and Betty Moore Foundation, NSF, National Geographic Society

ปัญหาวิทยาศาสตร์เปิด

ความขัดแย้งหลักมีจุดศูนย์กลางอยู่ที่สิ่งที่หลายคนมองว่าเป็นความไม่สอดคล้องพื้นฐานระหว่างความโปร่งใสของข้อมูลเข้าและผลลัพธ์ สมาชิกชุมชนโต้แย้งว่าเมื่ออาสาสมัครสนับสนุนเวลา ความเชี่ยวชาญ และข้อมูลของพวกเขาให้กับแพลตฟอร์มไม่แสวงหาผลกำไรอย่างเสรี โมเดล AI ที่เกิดขึ้นควรจะพร้อมใช้งานสำหรับการใช้งานทางวิทยาศาสตร์ในวงกว้าง ความรู้สึกนี้สะท้อนถึงความกังวลที่เพิ่มขึ้นเกี่ยวกับองค์กรที่ได้ประโยชน์จากการสนับสนุนชุมชนแบบเปิดในขณะที่เก็บผลลัพธ์ที่มีค่าที่สุดไว้เป็นกรรมสิทธิ์

การถกเถียงกลายเป็นเรื่องซับซ้อนมากขึ้นเมื่อพิจารณาโครงสร้างการระดมทุนของ iNaturalist ด้วยรายได้ที่รายงานว่า 4.71 ล้านดอลลาร์สหรัฐฯ ในปี 2024 กว่า 94% มาจากแหล่งการกุศลรวมถึง Gordon and Betty Moore Foundation, National Science Foundation และ National Geographic Society นักวิจารณ์โต้แย้งว่าการพึ่งพาแหล่งทุนสาธารณะและไม่แสวงหาผลกำไรอย่างหนักควรมาพร้อมกับภาระผูกพันในการเปิดเผยผลงานวิจัย

ข้อจำกัดทางเทคนิคและช่องว่างระดับภูมิภาค

นอกเหนือจากการถกเถียงเชิงปรัชญาแล้ว ข้อจำกัดเชิงปฏิบัติของระบบปัจจุบันได้เกิดขึ้นผ่านการอภิปรายของชุมชน ผู้ใช้รายงานความลำเอียงระดับภูมิภาคที่สำคัญในโมเดล AI โดยมีจุดอ่อนเฉพาะในการระบุพันธุ์พื้นเมืองจากภูมิภาคเช่น ออสเตรเลีย ระบบดูเหมือนจะทำงานได้ดีกว่ากับพันธุ์รุกรานที่ได้รับการจัดทำเอกสารอย่างกว้างขวางในข้อมูลการฝึก

ที่นี่ใน ออสเตรเลีย ฉันรู้ว่าพืชเป็นพันธุ์รุกรานเมื่อ iNaturalist/Seek สามารถระบุได้ มันไม่ดีกับพืชพื้นเมือง ออสเตรเลีย ดังนั้นฉันจึงอยากสร้างโซลูชันท้องถิ่น

ความลำเอียงทางภูมิศาสตร์นี้เน้นย้ำว่าโมเดลปิดสามารถทำให้ช่องว่างความรู้ยืดเยื้อแทนที่จะแก้ไขพวกมัน นักวิจัยและสถาบันท้องถิ่นที่อาจปรับปรุงความสามารถในการระบุระดับภูมิภาคได้ไม่สามารถเข้าถึงและปรับใช้เทคโนโลยีพื้นฐาน

คำถามเรื่องความยั่งยืน

ผู้สนับสนุนแนวทางปัจจุบันของ iNaturalist ยกความกังวลที่สมเหตุสมผลเกี่ยวกับความยั่งยืนระยะยาว ด้วยผู้ใช้เพียง 0.24% ที่ทำการบริจาคเงิน การพึ่งพาทุนอุดหนุนจากมูลนิธิใหญ่ ๆ อย่างหนักของแพลตฟอร์มอาจไม่ยั่งยืนไปตลอดกาล บางคนโต้แย้งว่าการรักษาการควบคุมกรรมสิทธิ์เหนือโมเดล AI อาจให้กระแสรายได้ในอนาคตผ่านการให้ใบอนุญาตแก่สถาบันวิจัยหรือการประยุกต์ใช้เชิงพาณิชย์

อย่างไรก็ตาม ศักยภาพเชิงพาณิชย์นี้สร้างคำถามจริยธรรมของตัวเอง หากองค์กรไม่แสวงหาผลกำไรวางแผนที่จะสร้างรายได้จากโมเดลที่ฝึกด้วยการสนับสนุนของอาสาสมัคร ผู้สนับสนุนควรมีเสียงในการตัดสินใจนั้นหรือไม่? ความตึงเครียดระหว่างความต้องการความยั่งยืนและหลักการวิทยาศาสตร์เปิดยังคงไม่ได้รับการแก้ไข

การถกเถียงสะท้อนถึงความท้าทายที่กว้างขึ้นที่เผชิญกับจุดตัดระหว่างวิทยาศาสตร์ที่ขับเคลื่อนโดยชุมชนและความยั่งยืนขององค์กร เมื่อ AI กลายเป็นศูนย์กลางของการวิจัยทางวิทยาศาสตร์มากขึ้น คำถามเกี่ยวกับความเป็นเจ้าของข้อมูล การเข้าถึงโมเดล และสิทธิของชุมชนน่าจะกลายเป็นเรื่องเร่งด่วนมากขึ้นในหลายสาขา

อ้างอิง: computervision