ในยุคที่ถูกครอบงำด้วย AI และ deep learning แนวโน้มที่น่าประหลาดใจกำลังเกิดขึ้นในชุมชนนักพัฒนา นั่นคือการกลับมาชื่นชมเทคนิค computer vision แบบคลาสสิกอีกครั้ง ในขณะที่เครื่องมืออย่าง TensorFlow ครองพื้นที่ข่าวสาร นักพัฒนากำลังค้นพบใหม่ว่าหน้าที่การประมวลผลภาพจำนวนมากสามารถทำได้โดยไม่ต้องใช้ neural network ขนาดใหญ่หรือพลังการประมวลผลจาก GPU
การปฏิวัติ Grayscale
การอภิปรายในชุมชนเผยให้เห็นความสนใจที่เพิ่มขึ้นในวิธีการประมวลผลภาพพื้นฐานที่ถูกบดบังด้วยกระแส AI นักพัฒนากำลังแบ่งปันเครื่องมือและเทคนิคที่ใช้การทำงานพื้นฐานอย่างการแปลงภาพเป็น grayscale, thresholding และการตรวจจับขอบ - วิธีการที่สามารถทำงานได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์มาตรฐานโดยไม่ต้องใช้อุปกรณ์พิเศษ
นักพัฒนารายหนึ่งได้แบ่งปันโปรเจกต์โปรแกรมแก้ไขภาพบนเบราว์เซอร์ของพวกเขา โดยระบุว่า: ในตอนนี้ฟีเจอร์ที่น่าสนใจที่มันมีคือความสามารถในการรันฟิลเตอร์แบบกำหนดเองด้วยขนาดหน้าต่างที่หลากหลายสำหรับภาพ และใช้สูตรกำหนดเองเพื่อผสมผสานภาพหลายภาพเข้าด้วยกัน แนวทางนี้แสดงให้เห็นว่า computer vision สามารถเข้าถึงได้ง่ายเพียงใดเมื่อสร้างขึ้นบนหลักการแบบคลาสสิกแทนที่จะใช้โมเดล AI ที่ซับซ้อน
โครงการชุมชนที่กล่าวถึง:
- เครื่องมือแก้ไขภาพบนเบราว์เซอร์พร้อมฟิลเตอร์แบบกำหนดเอง
- เครื่องมือประมวลผลภาพแบบโอเพนซอร์ส (GitHub: victorqribeiro/customFilter)
- รองรับขนาดหน้าต่างที่ปรับเปลี่ยนได้และสูตรการผสมแบบกำหนดเอง
- ฟีเจอร์ที่วางแผนไว้: การตรวจจับฟีเจอร์และการเชื่อมต่อภาพ
การประยุกต์ใช้ในทางปฏิบัติที่นอกเหนือจาก AI
ส่วนความคิดเห็นเผยให้เห็นการประยุกต์ใช้ในทางปฏิบัติหลายอย่างที่ computer vision แบบคลาสสิกทำได้ดีเยี่ยม ตั้งแต่เครื่องมือแก้ไขภาพไปจนถึงการตรวจจับคุณลักษณะและการต่อภาพเข้าด้วยกัน นักพัฒนากำลังค้นพบว่าเทคนิคที่ผ่านการทดสอบด้วยเวลานี้มีความหลากหลายอย่างน่าประหลาดใจ ความน่าดึงดูดอยู่ที่ความโปร่งใสและประสิทธิภาพในการคำนวน - คุณสามารถเข้าใจได้อย่างแท้จริงว่าอัลกอริทึมกำลังทำอะไรโดยไม่ต้องจัดการกับปัญหา black box ของ AI
ขอบคุณสำหรับแนวทางแบบเก่าๆ ที่ไม่ใช้ AI
ความรู้สึกนี้สะท้อนไปทั่วทั้งการอภิปราย ซึ่งเน้นย้ำถึงความต้องการโซลูชันที่นักพัฒนาสามารถควบคุมกระบวนการประมวลผลได้อย่างเต็มที่ ไม่เหมือนกับโมเดล AI ที่ต้องการข้อมูลการฝึกอบรมจำนวนมาก เทคนิค computer vision แบบคลาสสิกทำงานได้อย่างคาดเดาได้ across ภาพประเภทต่างๆ โดยไม่ต้องฝึกใหม่
เทคนิคคลาสสิกของ Computer Vision ที่กล่าวถึง:
- การแปลงภาพเป็นโทนสีเทาและการรวมภาพ
- ตัวกรอง Laplacian สำหรับการตรวจจับขอบ
- การกำหนดเกณฑ์สำหรับการประมวลผลภาพแบบไบนารี
- ตัวกรอง Sobel สำหรับการตรวจจับขอบ
- การแบ่งส่วนภาพตามสี
- การแบ่งส่วนแบบ nearest neighbor
- อัลกอริทึมการตรวจจับจุดสำคัญ
การเชื่อมโยงทางวัฒนธรรมและการมีส่วนร่วมของชุมชน
ที่น่าสนใจคือ การอภิปรายขยายไปเกินกว่าความดีความชอบทางเทคนิคล้วนๆ ชื่อเรื่องของบทความที่อ้างอิงการ์ตูนคลาสสิกอย่าง He-Man ด้วยประโยค By the power of Grayskull! ได้จุดประกายการเชื่อมโยงทางความทรงจำในหมู่ผู้พัฒนา ผู้แสดงความคิดเห็นหลายคนชื่นชมการอ้างอิงทางวัฒนธรรม ซึ่งแสดงให้เห็นว่าสาระทางเทคนิคสามารถดึงดูดชุมชนผ่านจุดร่วมทางวัฒนธรรมที่แบ่งปันกันได้อย่างไร
การผสมผสานระหว่างการอภิปรายทางเทคนิคและการเชื่อมโยงทางวัฒนธรรมนี้แสดงให้เห็นว่าการพัฒนา computer vision ไม่ได้เป็นเพียงเรื่องของอัลกอริทึมเท่านั้น - มันเกี่ยวกับการสร้างชุมชนรอบๆ ความสนใจและประสบการณ์ที่แบ่งปันกัน การอ้างอิงถึงวัฒนธรรมป๊อปในยุค 70s และ 80s สร้างจุดเริ่มต้นที่เข้าถึงได้สำหรับนักพัฒนาที่อาจมองว่า computer vision น่ากลัว
อนาคตของการพัฒนา Computer Vision
ขณะที่บทสนทนากำลังพัฒนาไป เห็นได้ชัดว่าเทคนิค computer vision แบบคลาสสิกไม่ได้ถูกวางตำแหน่งให้เป็นตัวแทนของ AI แต่เป็นเครื่องมือเสริมในชุดเครื่องมือของนักพัฒนา ชุมชนตระหนักดีว่าปัญหาที่แตกต่างกันต้องการโซลูชันที่แตกต่างกัน - บางครั้งการดำเนินการ thresholding แบบง่ายๆ ก็เหมาะสมกว่า neural network ที่ซับซ้อน
ลักษณะ open-source ของโปรเจกต์เหล่านี้ ที่ซึ่งนักพัฒนาแบ่งปันโค้ดและเครื่องมือต่อสาธารณะ ทำให้มั่นใจได้ว่าเทคนิคแบบคลาสสิกเหล่านี้จะยังคงพัฒนาและค้นหาการประยุกต์ใช้ใหม่ๆ ต่อไป ดังที่นักพัฒนารายหนึ่งระบุเกี่ยวกับเครื่องมือประมวลผลภาพของพวกเขา พวกเขาวางแผนที่จะเพิ่มฟีเจอร์มากขึ้นตามที่คุณอธิบายไว้ในบทความของคุณ; การตรวจจับคุณลักษณะ, การต่อภาพ... ซึ่งแสดงให้เห็นว่าการแบ่งปันความรู้ขับเคลื่อนนวัตกรรมในพื้นที่นี้อย่างไร
การฟื้นตัวของความสนใจใน computer vision แบบคลาสสิกแสดงถึงความสมบูรณ์ของสาขานี้ - การยอมรับว่าในขณะที่ AI มีบทบาทของมัน แต่บางครั้งโซลูชันที่ง่ายที่สุดก็คือโซลูชันที่สง่างามที่สุด ขณะที่นักพัฒนายังคงแบ่งปันเครื่องมือและเทคนิคต่อไป วิธีการพื้นฐานเหล่านี้มีแนวโน้มที่จะค้นพบชีวิตใหม่ในการประยุกต์ใช้ตั้งแต่การพัฒนาเว็บไปจนถึงระบบ embedded ซึ่งพิสูจน์ว่าคุณไม่จำเป็นต้องมี AI เสมอไปเพื่อมองเห็นโลกอย่างชัดเจน
อ้างอิง: BY THE POWER OF GRAYSCALE!
