เทคนิค Computer Vision แบบดั้งเดิมกลับมาได้รับความนิยมอีกครั้งท่ามกลางการครอบงำของ AI

ทีมชุมชน BigGo
เทคนิค Computer Vision แบบดั้งเดิมกลับมาได้รับความนิยมอีกครั้งท่ามกลางการครอบงำของ AI

ในยุคที่ถูกครอบงำด้วย AI และ deep learning แนวโน้มที่น่าประหลาดใจกำลังเกิดขึ้นในชุมชนนักพัฒนา นั่นคือการกลับมาชื่นชมเทคนิค computer vision แบบคลาสสิกอีกครั้ง ในขณะที่เครื่องมืออย่าง TensorFlow ครองพื้นที่ข่าวสาร นักพัฒนากำลังค้นพบใหม่ว่าหน้าที่การประมวลผลภาพจำนวนมากสามารถทำได้โดยไม่ต้องใช้ neural network ขนาดใหญ่หรือพลังการประมวลผลจาก GPU

การปฏิวัติ Grayscale

การอภิปรายในชุมชนเผยให้เห็นความสนใจที่เพิ่มขึ้นในวิธีการประมวลผลภาพพื้นฐานที่ถูกบดบังด้วยกระแส AI นักพัฒนากำลังแบ่งปันเครื่องมือและเทคนิคที่ใช้การทำงานพื้นฐานอย่างการแปลงภาพเป็น grayscale, thresholding และการตรวจจับขอบ - วิธีการที่สามารถทำงานได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์มาตรฐานโดยไม่ต้องใช้อุปกรณ์พิเศษ

นักพัฒนารายหนึ่งได้แบ่งปันโปรเจกต์โปรแกรมแก้ไขภาพบนเบราว์เซอร์ของพวกเขา โดยระบุว่า: ในตอนนี้ฟีเจอร์ที่น่าสนใจที่มันมีคือความสามารถในการรันฟิลเตอร์แบบกำหนดเองด้วยขนาดหน้าต่างที่หลากหลายสำหรับภาพ และใช้สูตรกำหนดเองเพื่อผสมผสานภาพหลายภาพเข้าด้วยกัน แนวทางนี้แสดงให้เห็นว่า computer vision สามารถเข้าถึงได้ง่ายเพียงใดเมื่อสร้างขึ้นบนหลักการแบบคลาสสิกแทนที่จะใช้โมเดล AI ที่ซับซ้อน

โครงการชุมชนที่กล่าวถึง:

  • เครื่องมือแก้ไขภาพบนเบราว์เซอร์พร้อมฟิลเตอร์แบบกำหนดเอง
  • เครื่องมือประมวลผลภาพแบบโอเพนซอร์ส (GitHub: victorqribeiro/customFilter)
  • รองรับขนาดหน้าต่างที่ปรับเปลี่ยนได้และสูตรการผสมแบบกำหนดเอง
  • ฟีเจอร์ที่วางแผนไว้: การตรวจจับฟีเจอร์และการเชื่อมต่อภาพ

การประยุกต์ใช้ในทางปฏิบัติที่นอกเหนือจาก AI

ส่วนความคิดเห็นเผยให้เห็นการประยุกต์ใช้ในทางปฏิบัติหลายอย่างที่ computer vision แบบคลาสสิกทำได้ดีเยี่ยม ตั้งแต่เครื่องมือแก้ไขภาพไปจนถึงการตรวจจับคุณลักษณะและการต่อภาพเข้าด้วยกัน นักพัฒนากำลังค้นพบว่าเทคนิคที่ผ่านการทดสอบด้วยเวลานี้มีความหลากหลายอย่างน่าประหลาดใจ ความน่าดึงดูดอยู่ที่ความโปร่งใสและประสิทธิภาพในการคำนวน - คุณสามารถเข้าใจได้อย่างแท้จริงว่าอัลกอริทึมกำลังทำอะไรโดยไม่ต้องจัดการกับปัญหา black box ของ AI

ขอบคุณสำหรับแนวทางแบบเก่าๆ ที่ไม่ใช้ AI

ความรู้สึกนี้สะท้อนไปทั่วทั้งการอภิปราย ซึ่งเน้นย้ำถึงความต้องการโซลูชันที่นักพัฒนาสามารถควบคุมกระบวนการประมวลผลได้อย่างเต็มที่ ไม่เหมือนกับโมเดล AI ที่ต้องการข้อมูลการฝึกอบรมจำนวนมาก เทคนิค computer vision แบบคลาสสิกทำงานได้อย่างคาดเดาได้ across ภาพประเภทต่างๆ โดยไม่ต้องฝึกใหม่

เทคนิคคลาสสิกของ Computer Vision ที่กล่าวถึง:

  • การแปลงภาพเป็นโทนสีเทาและการรวมภาพ
  • ตัวกรอง Laplacian สำหรับการตรวจจับขอบ
  • การกำหนดเกณฑ์สำหรับการประมวลผลภาพแบบไบนารี
  • ตัวกรอง Sobel สำหรับการตรวจจับขอบ
  • การแบ่งส่วนภาพตามสี
  • การแบ่งส่วนแบบ nearest neighbor
  • อัลกอริทึมการตรวจจับจุดสำคัญ

การเชื่อมโยงทางวัฒนธรรมและการมีส่วนร่วมของชุมชน

ที่น่าสนใจคือ การอภิปรายขยายไปเกินกว่าความดีความชอบทางเทคนิคล้วนๆ ชื่อเรื่องของบทความที่อ้างอิงการ์ตูนคลาสสิกอย่าง He-Man ด้วยประโยค By the power of Grayskull! ได้จุดประกายการเชื่อมโยงทางความทรงจำในหมู่ผู้พัฒนา ผู้แสดงความคิดเห็นหลายคนชื่นชมการอ้างอิงทางวัฒนธรรม ซึ่งแสดงให้เห็นว่าสาระทางเทคนิคสามารถดึงดูดชุมชนผ่านจุดร่วมทางวัฒนธรรมที่แบ่งปันกันได้อย่างไร

การผสมผสานระหว่างการอภิปรายทางเทคนิคและการเชื่อมโยงทางวัฒนธรรมนี้แสดงให้เห็นว่าการพัฒนา computer vision ไม่ได้เป็นเพียงเรื่องของอัลกอริทึมเท่านั้น - มันเกี่ยวกับการสร้างชุมชนรอบๆ ความสนใจและประสบการณ์ที่แบ่งปันกัน การอ้างอิงถึงวัฒนธรรมป๊อปในยุค 70s และ 80s สร้างจุดเริ่มต้นที่เข้าถึงได้สำหรับนักพัฒนาที่อาจมองว่า computer vision น่ากลัว

อนาคตของการพัฒนา Computer Vision

ขณะที่บทสนทนากำลังพัฒนาไป เห็นได้ชัดว่าเทคนิค computer vision แบบคลาสสิกไม่ได้ถูกวางตำแหน่งให้เป็นตัวแทนของ AI แต่เป็นเครื่องมือเสริมในชุดเครื่องมือของนักพัฒนา ชุมชนตระหนักดีว่าปัญหาที่แตกต่างกันต้องการโซลูชันที่แตกต่างกัน - บางครั้งการดำเนินการ thresholding แบบง่ายๆ ก็เหมาะสมกว่า neural network ที่ซับซ้อน

ลักษณะ open-source ของโปรเจกต์เหล่านี้ ที่ซึ่งนักพัฒนาแบ่งปันโค้ดและเครื่องมือต่อสาธารณะ ทำให้มั่นใจได้ว่าเทคนิคแบบคลาสสิกเหล่านี้จะยังคงพัฒนาและค้นหาการประยุกต์ใช้ใหม่ๆ ต่อไป ดังที่นักพัฒนารายหนึ่งระบุเกี่ยวกับเครื่องมือประมวลผลภาพของพวกเขา พวกเขาวางแผนที่จะเพิ่มฟีเจอร์มากขึ้นตามที่คุณอธิบายไว้ในบทความของคุณ; การตรวจจับคุณลักษณะ, การต่อภาพ... ซึ่งแสดงให้เห็นว่าการแบ่งปันความรู้ขับเคลื่อนนวัตกรรมในพื้นที่นี้อย่างไร

การฟื้นตัวของความสนใจใน computer vision แบบคลาสสิกแสดงถึงความสมบูรณ์ของสาขานี้ - การยอมรับว่าในขณะที่ AI มีบทบาทของมัน แต่บางครั้งโซลูชันที่ง่ายที่สุดก็คือโซลูชันที่สง่างามที่สุด ขณะที่นักพัฒนายังคงแบ่งปันเครื่องมือและเทคนิคต่อไป วิธีการพื้นฐานเหล่านี้มีแนวโน้มที่จะค้นพบชีวิตใหม่ในการประยุกต์ใช้ตั้งแต่การพัฒนาเว็บไปจนถึงระบบ embedded ซึ่งพิสูจน์ว่าคุณไม่จำเป็นต้องมี AI เสมอไปเพื่อมองเห็นโลกอย่างชัดเจน

อ้างอิง: BY THE POWER OF GRAYSCALE!