โมเดล AI ดาวเทียมสำเร็จในการระบุตำแหน่งพืชหนามจากอวกาศพร้อมการตรวจสอบในพื้นที่จริง

ทีมชุมชน BigGo
โมเดล AI ดาวเทียมสำเร็จในการระบุตำแหน่งพืชหนามจากอวกาศพร้อมการตรวจสอบในพื้นที่จริง

นักวิจัยได้สาธิตสำเร็จว่าปัญญาประดิษฐ์สามารถระบุพันธุ์พืชเฉพาะจากภาพถ่ายดาวเทียมได้ ซึ่งถือเป็นความก้าวหน้าสำคัญในเทคโนโลยีการตรวจรู้จากระยะไกล โมเดลตรวจจับพืชหนามของ Gabriel Mahler ที่ผสมผสานข้อมูลดาวเทียมกับการเรียนรู้ของเครื่องได้พิสูจน์ความแม่นยำอย่างน่าทึ่งในระหว่างการทดสอบภาคสนามในโลกจริงรอบ ๆ Cambridge ประเทศอังกฤษ

ทีมวิจัยได้พัฒนาโมเดลของพวกเขาโดยใช้ TESSERA embeddings ซึ่งเป็นเทคนิคการบีบอัดข้อมูลที่ซับซ้อนที่แปลงการสังเกตการณ์ดาวเทียมหลายครั้งของตำแหน่งใด ๆ บนโลกให้เป็นเวกเตอร์ข้อมูล 128 มิติที่กะทัดรัด วิธีการนี้จับภาพคุณสมบัติเชิงเวลาและสเปกตรัมของพืชพรรณตลอดทั้งปี สร้างลายนิ้วมือที่เป็นเอกลักษณ์สำหรับพืชประเภทต่าง ๆ

ข้อมูลจำเพาะของโมเดล TESSERA :

  • ความละเอียด: 10 เมตรต่อพิกเซล
  • การบีบอัดข้อมูล: 50-100 การสังเกตการณ์จากดาวเทียม → เวกเตอร์ 128 มิติ
  • แหล่งข้อมูลนำเข้า: ข้อมูลดาวเทียม Sentinel 1 และ 2 (optical + SAR)
  • ช่วงเวลาครอบคลุม: ลายเซ็นสเปกตรัม-เชิงเวลาตลอดทั้งปี
  • ใบอนุญาต: Apache2 สำหรับโมเดล/โค้ดการฝึกอบรม, CC-BY-A สำหรับการฝังข้อมูลระดับโลก
มีส่วนร่วมในการสำรวจธรรมชาติโดยใช้ข้อมูลดาวเทียมสำหรับการระบุชนิดพันธุ์พืช
มีส่วนร่วมในการสำรวจธรรมชาติโดยใช้ข้อมูลดาวเทียมสำหรับการระบุชนิดพันธุ์พืช

การทดสอบภาคสนามเผยความแม่นยำที่น่าประทับใจ

การทดสอบที่แท้จริงเกิดขึ้นเมื่อนักวิจัยนำการคาดการณ์ของโมเดลไปสู่การทดสอบภาคสนาม เริ่มต้นที่ Milton Community Centre พวกเขาพบพืชหนามภายใน 20 วินาทีในพื้นที่ที่ระบบ AI ของพวกเขาได้ทำการตั้งค่าสถานะ ทีมได้เยี่ยมชมหกหรือเจ็ดสถานที่ระหว่าง community center และทางเข้า Milton Country Park โดยค้นพบประชากรพืชหนามจำนวนมากในทุกไซต์ที่คาดการณ์ไว้

โมเดลแสดงความแข็งแกร่งเป็นพิเศษในการระบุแปลงพืชหนามขนาดใหญ่ที่ไม่มีสิ่งปกคลุม ในขณะที่ประสบปัญหากับพืชขนาดเล็กที่อยู่ใต้การปกคลุมบางส่วน ข้อจำกัดนี้สมเหตุสมผลเนื่องจากภาพถ่ายดาวเทียมไม่สามารถตรวจจับพืชพรรณที่ถูกปกคลุมด้วยหลังคาต้นไม้หรืออุปสรรคอื่น ๆ ได้อย่างง่ายดาย

TESSERA embeddings: วิธีการบีบอัดข้อมูลที่ลดการสังเกตการณ์ดาวเทียมหลายสิบครั้งให้เป็นสรุปตัวเลข 128 ตัวเดียวที่จับภาพลักษณะของพื้นที่และการเปลี่ยนแปลงตลอดเวลา

ผลการทดสอบภาคสนาม:

  • สถานที่ทดสอบ: 6-7 จุดระหว่าง Milton Community Centre และ Milton Country Park
  • อัตราความสำเร็จ: ตรวจจับพุ่มหนามได้ 100% ในพื้นที่ที่คาดการณ์ว่ามีความเชื่อมั่นสูง
  • เวลาในการตรวจจับ: ประมาณ 20 วินาทีในการค้นหาพุ่มหนามแรกที่จุดเริ่มต้น
  • จุดแข็งของโมเดล: พุ่มหนามขนาดใหญ่ที่ไม่มีสิ่งปกคลุม
  • ข้อจำกัดของโมเดล: พุ่มหนามขนาดเล็กที่อยู่ใต้สิ่งปกคลุมบางส่วน
การค้นหาพุ่มไผ่หนามในภาคสนามระหว่างการทดสอบโมเดล
การค้นหาพุ่มไผ่หนามในภาคสนามระหว่างการทดสอบโมเดล

ชุมชนสำรวจการประยุกต์ใช้ในวงกว้าง

การวิจัยได้จุดประกายความสนใจอย่างมากในการประยุกต์ใช้ที่มีศักยภาพนอกเหนือจากการตรวจจับพืชหนาม การอภิปรายของชุมชนเผยให้เห็นความกระตือรือร้นในการใช้เทคนิคที่คล้ายกันเพื่อระบุตำแหน่งโบราณสถาน คุณลักษณะทางธรณีวิทยา น้ำพุร้อน และแม้กระทั่งการตรวจสอบการเกษตร บางคนเสนอแนะว่าเทคโนโลยีนี้สามารถช่วยเกษตรกรระบุปัญหาสุขภาพพืชผลหรือช่วยเหลือผู้ที่หาอาหารในการค้นหาพืชเฉพาะ

อย่างไรก็ตาม ผู้เชี่ยวชาญสังเกตข้อจำกัดที่สำคัญ การระบุหินและแร่ธาตุเผชิญกับความท้าทายเนื่องจากคุณลักษณะทางธรณีวิทยาหลายอย่างดูเหมือนกันในสเปกตรัมแสงที่มองเห็นได้และอินฟราเรดใกล้มาตรฐาน ความสำเร็จมักต้องการการถ่ายภาพไฮเปอร์สเปกตรัลเฉพาะทางในช่วงอินฟราเรดคลื่นสั้น ซึ่งต้องการอุปกรณ์และวิธีการที่แตกต่างกัน

การสำรวจลักษณะทางนิเวศวิทยาที่ระบุได้จากข้อมูลดาวเทียม
การสำรวจลักษณะทางนิเวศวิทยาที่ระบุได้จากข้อมูลดาวเทียม

การดำเนินการทางเทคนิคและการเข้าถึง

นักวิจัยได้ทำให้งานของพวกเขาเข้าถึงได้อย่างน่าประหลาดใจสำหรับนักวิทยาศาสตร์และนักพัฒนาคนอื่น ๆ ไลบรารี Python geotessera ของพวกเขาช่วยให้ผู้ใช้ดาวน์โหลด embeddings ที่คำนวณล่วงหน้าสำหรับภูมิภาคใด ๆ และฝึกตัวจำแนกภายในไม่กี่วินาทีสำหรับพื้นที่เล็ก ๆ ระบบรวมเครื่องมือการทำแผนที่แบบโต้ตอบและความสามารถในการแสดงผลที่ทำให้ง่ายต่อการสำรวจข้อมูล 128 มิติ

โมเดลเองผสมผสาน logistic regression กับตัวจำแนก k-nearest neighbors ซึ่งเป็นเทคนิคการเรียนรู้ของเครื่องที่ค่อนข้างง่ายที่พิสูจน์ประสิทธิภาพเมื่อจับคู่กับข้อมูลดาวเทียมที่อุดมสมบูรณ์ ความเรียบง่ายนี้หมายความว่าวิธีการนี้อาจทำงานบนอุปกรณ์มือถือสำหรับการประยุกต์ใช้ภาคสนามแบบเรียลไทม์ได้

การนำไปใช้งานทางเทคนิค:

  • ประเภทของตัวจำแนก: การรวมกันของ logistic regression + k-nearest neighbors (kNN)
  • แหล่งข้อมูลการฝึก: TESSERA embeddings + ข้อมูล iNaturalist
  • ความเร็วในการประมวลผล: ใช้เวลาเพียงไม่กี่วินาทีสำหรับการฝึกตัวจำแนกพื้นที่ขนาดเล็ก
  • ไลบรารี: แพ็กเกจ Python geotessera
  • การแสดงผลด้วยภาพ: การแมป PCA แบบสีเท็จ สมุดบันทึกแบบโต้ตอบ เครื่องมือแมปเว็บ

ผลกระทบในอนาคตสำหรับการตรวจรู้จากระยะไกล

การสาธิตที่ประสบความสำเร็จนี้เปิดประตูสำหรับการประยุกต์ใช้ในทางปฏิบัติมากมาย บริษัทเกษตรกรรมใช้วิธีการที่คล้ายกันบนพื้นฐานดาวเทียมสำหรับการเกษตรแม่นยำแล้ว ช่วยลดของเสียโดยการใช้ปุ๋ยและยาฆ่าแมลงเฉพาะที่จำเป็นเท่านั้น เทคโนโลยีสามารถขยายไปสู่ความพยายามในการอนุรักษ์ การวางผังเมือง และการจัดการทรัพยากร

ทีมวิจัยวางแผนที่จะทดสอบวิธีการของพวกเขากับเป้าหมายที่ท้าทายมากขึ้นในการเดินทางภาคสนามในอนาคต ผลักดันขอบเขตของสิ่งที่สามารถตรวจจับได้จากอวกาศ ด้วยการครอบคลุมดาวเทียมทั่วโลกและโมเดล AI ที่ซับซ้อนมากขึ้น ความสามารถในการทำแผนที่คุณลักษณะเฉพาะทั่วทั้งทวีปกลายเป็นไปได้มากขึ้น

k-nearest neighbors (kNN): วิธีการเรียนรู้ของเครื่องแบบง่ายที่จำแนกจุดข้อมูลใหม่ตามตัวอย่างที่คล้ายกันที่สุดที่เคยเห็นมาก่อน

อ้างอิง: Can a model trained on satellite data really find brambles on the ground?