ในโลกที่มีการพัฒนาเทคโนโลยีแบบก้าวกระโดด ได้มีการนำเอาเทคโนโลยีปัญญาประดิษฐ์ หรือ Artificial Intelligence (AI) มาใช้ในทุกภาคธุรกิจและอุตสาหกรรม รวมทั้งมีบทบาทอย่างมากในชีวิตประจำวันของเราด้วย Computer Vision คือ แขนงหนึ่งของ AI ที่ทำให้คอมพิวเตอร์หรือระบบ สามารถมองเห็นและจดจำภาพนิ่งหรือภาพเคลื่อนไหวเพื่อนำไปวิเคราะห์ แยกแยะวัตถุต่างๆ ได้อย่างแม่นยำและรวดเร็ว คล้ายกับการมองเห็นของมนุษย์ หรือดีกว่า

ดังนั้น Computer Vision จึงถูกนำมาใช้ประโยชน์ในหลายภาคส่วน ในบทความนี้ได้กล่าวถึง Computer Vision และ AI Vision ว่าคืออะไร มีหลักการทำงานอย่างไร พร้อมตัวอย่างการประยุกต์ใช้ในการทำงาน

ทำความรู้จักกับ Computer Vision​

Computer Vision คือ แขนงหนึ่งของวิทยาการปัญญาประดิษฐ์ หรือ AI โดยการสร้างอวัยวะที่เสมือนดวงตาให้คอมพิวเตอร์หรือระบบ ทำให้สามารถจดจำ เข้าใจ และวิเคราะห์ข้อมูลภาพได้ เช่น รูปภาพนิ่ง วิดีโอ หรืออินพุตต่างๆ ที่เน้นด้านภาพเป็นหลัก ได้อย่างชาญฉลาด แม่นยำ และตอบสนองต่อข้อมูลภาพที่มองเห็นได้อย่างรวดเร็ว

Computer Vision เริ่มต้นขึ้นในปี ค.ศ. 1950 จากการใช้ Neural Network ในการจัดหมวดหมู่ให้แก่รูปทรงอย่างง่ายๆ เช่น รูปทรงสามเหลี่ยม สี่เหลี่ยม วงกลม ด้วยการค้นหาขอบและมุม ซึ่งยังไม่แม่นยำและผิดพลาดสูง ในปี ค.ศ. 1970 ได้มีการนำเอาเทคนิคประมวลผลที่เรียกว่า Optical Character Recognition มาใช้ในการตีความตัวหนังสือหรือข้อความ และมีการพัฒนาอย่างรวดเร็ว ในปี ค.ศ. 1990 เมื่อมีการพัฒนาของระบบอินเทอร์เน็ต จึงมีการอัปโหลดข้อมูลรูปภาพต่างๆ อยู่ตลอดเวลาจำนวนมหาศาล ทำให้สามารถวิเคราะห์ข้อมูลและจดจำภาพถ่ายได้จำนวนมาก ระหว่างปี ค.ศ. 2000-2001 มีการศึกษาด้านการตรวจจับวัตถุมากยิ่งขึ้น ส่งผลทำให้เกิดการพัฒนาการตรวจจับใบหน้าแบบเรียลไทม์เป็นครั้งแรก

ซึ่งการพัฒนาของเทคโนโลยีอย่างก้าวกระโดด ทำให้มีการพัฒนาด้าน Computer Vision เพิ่มขึ้นตามลำดับไปด้วย ทำให้การวิเคราะห์ข้อมูลและการจัดอันดับหมวดหมู่ภาพมีความแม่นยำมากขึ้น โดยอาจแม่นยำกว่ามนุษย์เสียอีก

ปัจจัยที่ทำให้ Computer Vision พัฒนาอย่างต่อเนื่อง​

  • การพัฒนาสมาร์ตโฟนและอุปกรณ์พกพาที่มีกล้องถ่ายภาพในตัว กล้อง CCTV ที่บันทึกวิดีโอได้ ทำให้ผู้คนสามารถถ่ายรูปและอัปโหลดได้ง่ายตลอดเวลา ข้อมูลจึงหลั่งไหลเข้าสู่ระบบอย่างรวดเร็วและเป็นจำนวนมาก
  • มีการพัฒนาระบบประมวลผลที่มีคุณภาพสูงแต่ต้นทุนต่ำลงกว่าเดิม จึงทำให้สามารถเข้าถึงได้ง่ายขึ้น
  • อุปกรณ์ Hardware สำหรับงานด้าน Computer Vision และการวิเคราะห์ระบบมีแพร่หลายและเข้าถึงได้ง่าย
  • มีการพัฒนาของ Hardware และ Software ซึ่งรองรับการทำงานของอัลกอรึทึมที่ทันสมัย เช่น Convolutional Neural Networks ได้อย่างเต็มประสิทธิภาพ

หลักการทำงานของ Computer Vision​

หลักการทำงานของ Computer Vision มีการแบ่งส่วนการทำงานออกเป็นหลายส่วนดังนี้

การจับภาพ​

สามารถนำข้อมูลภาพต่างๆ จำนวนมากเข้าระบบได้ ผ่านทางภาพถ่าย วิดีโอ หรือภาพสามมิติ เพื่อให้ระบบนำไปวิเคราะห์ข้อมูล เป็นการสอนให้คอมพิวเตอร์เรียนรู้และวิเคราะห์ภาพได้อย่างแม่นยำ จึงต้องใส่ข้อมูลภาพจำนวนมาก รวมถึงภาพที่มีความเกี่ยวข้องกัน เพื่อให้แยกแยะความแตกต่าง

การประมวลภาพ​

หลังจากมีการนำเข้าข้อมูลภาพแล้ว เทคโนโลยี Deep Learning และ Convolutional Neural Networks จะถูกนำมาใช้ในขั้นตอนนี้ โดยการใช้โครงข่ายประสาทเทียมประมวลผลและจัดเรียงข้อมูลภาพด้านต่างๆ โดยอัตโนมัติ ส่วนของ Convolutional Neural Networks จะช่วยให้ Deep Learning มองเห็นและเข้าใจภาพมากยิ่งขึ้นด้วยการแยกคุณลักษณะต่างๆ ของภาพ เช่น เส้นขอบ พื้นผิว รูปร่างเอาไว้ในแต่ละ Convolutional Layers และติดป้ายกำกับเอาไว้ เมื่อ Layer จดจำคุณลักษณะต่างๆ รวมกัน ทำให้โมเดลสามารถเรียนรู้และจดจำภาพที่มีความซับซ้อนได้อย่างรวดเร็วและแม่นยำมากยิ่งขึ้น

จดจำ ทำความเข้าใจ วิเคราะห์ตีความหมาย​

ตีความหมายภาพที่ได้จากการวิเคราะห์ โดยจะระบุชนิดและจัดประเภทของภาพที่ได้จากการวิเคราะห์นั้น

ทำไมหลักการทำงานจึงคล้ายจิ๊กซอว์​

หลักการทำงานของ Computer Vision นั้นคล้ายกับการต่อจิ๊กซอว์ โดยการรวบรวมชิ้นส่วน จิ๊กซอว์ของภาพนั้นๆ ที่อยู่อย่างกระจัดกระจาย มาต่อกันจนได้ผลลัพธ์ออกมาเป็นรูปภาพที่สมบูรณ์ ซึ่งคล้ายกับการทำงานของโครงข่ายประสาท ที่จะแยกชิ้นส่วนต่างๆ ของภาพ จากนั้นจึงติดต่อชิ้นส่วนย่อยต่างๆ ที่มีความเกี่ยวเนื่องเข้าด้วยกัน เพื่อทำให้คอมพิวเตอร์และระบบเข้าใจภาพได้ ผ่านการทำงานหลายขั้นตอน กระบวนการวิเคราะห์คำตอบของระบบจะแตกต่างจากการต่อจิ๊กซอว์ ซึ่งมีภาพเฉลยอยู่แล้ว คอมพิวเตอร์ไม่ได้มีข้อมูลเฉลยบอกไว้ ระบบจึงต้องฝึกฝนและคาดเดาคำตอบของภาพไปเรื่อยๆ จนได้บทสรุปเป็นภาพเป้าหมายที่ถูกต้อง

ประโยชน์ของ Computer Vision ในปัจจุบัน​

ปัจจุบัน Computer Vision ได้มีการพัฒนาอย่างต่อเนื่องและมีประสิทธิภาพสูง มีการนำเอาผลลัพธ์และข้อมูลจาก Computer Vision ที่มีอยู่หลายรูปแบบมาประยุกต์ใช้งานในหลายลักษณะดังนี้

การแยกส่วนของภาพ (Image segmentation)​

เป็นการแยกส่วนของภาพออกเป็นส่วนๆ โดยการพยายามแบ่งแยกภาพส่วนที่ต้องการออกมาจากส่วนที่ไม่ต้องการ โดยอาจมีวัตถุประสงค์เพื่อให้ได้รูปภาพที่มีรายละเอียดชัดเจนมากยิ่งขึ้น หรือกำหนดขอบเขตที่มีความสนใจ โดยอาจเลือกวัตถุแบบเจาะจงไปเลย หรือ เลือกส่วนของภาพที่มีคุณสมบัติบางอย่างเหมือนกัน

การแยกส่วนของภาพสามารถนำมาใช้ทางการแพทย์ เช่น การทำ MRI เพื่อตรวจหาสิ่งที่ผิดปกติของสมอง หรือนำมาใช้ในเทคโนโลยียานยนต์ไร้คนขับ โดยการช่วยให้ Self Driving Car ขับอยู่ในเลนถนนอย่างปลอดภัย โดยการแบ่งส่วนภาพระหว่างพื้นถนนกับเส้นเลน เป็นต้น

จัดกลุ่มภาพออกเป็นหมวด (Image classification)​

เป็นการจัดกลุ่มภาพออกเป็นหมวดหมู่ต่างๆ และติดป้ายกำกับ เช่น ต้นไม้ อาคาร รถยนต์ โดยสามารถนำไปประยุกต์ใช้ในงานด้านต่างๆ เช่น การตรวจสอบข้อบกพร่องของชิ้นส่วนอิเล็กทรอนิกส์ที่ผลิตในโรงงานอุตสาหกรรม การแยกประเภทอุปกรณ์ การแยกประเภทรถที่เข้ามาในลานจอดรถ การตรวจสอบหาเซลล์มะเร็ง และเซลล์เม็ดเลือดที่ผิดปกติ เป็นต้น

ทำงานด้วยการจัดกลุ่ม (Feature matching)​

เป็นการจับคู่จุดสนใจของรูปภาพสองรูป สามารถนำไปใช้เป็นส่วนหนึ่งของขั้นตอนการจดจำใบหน้า โดยการตรวจจับลักษณะเด่นของใบหน้าที่เข้าเครื่องสแกนเปรียบเทียบกับข้อมูลลักษณะเด่นจากภาพใบหน้าที่มีอยู่เดิมในฐานข้อมูล

การตรวจหาวัตถุ (Object detection) ​

เป็นการใช้ AI ในการตรวจจับวัตถุที่อยู่ในภาพแบบจำเพาะเจาะจง สามารถระบุวัตถุหลายชิ้นภายในภาพเดียวกันได้ โดยหลักการทำได้หลายวิธี เช่น การวาดกล่องรอบวัตถุ (Bounding Box) หรือถมสีให้ทุก Pixel ของวัตถุ เป็นต้น มีการนำมาใช้ประโยชน์อย่างแพร่หลาย เช่น การตรวจจับความหนาแน่นของยานพาหนะที่มีบนท้องถนน ตรวจจับรังนกภายในถ้ำ ตรวจจับสัมภาระ เป็นต้น

การจดจำใบหน้า (Facial recognition)​

เทคโนโลยีการจดจำใบหน้าของมนุษย์นอกจากใช้ในการระบุตัวตนของบุคคลนั้นๆ ยังสามารถแยกแยะบุคคลแต่ละคนออกจากกันได้ด้วย ถูกนำมาใช้งานอย่างแพร่หลายแทบจะทุกวงการธุรกิจ ตั้งแต่การสแกนใบหน้าเพื่อปลดล็อก ระบบสแกนเข้าทำงานหรือรับสวัสดิการต่างๆ ของรัฐ เป็นต้น

ระบุหาขอบเขตหรือวัตถุ (Edge detection)​

เป็นการหาขอบเขตของภาพ ทำให้ขอบเขตของภาพนั้นมีความเด่นชัดขึ้นมา เมื่อได้เส้นรอบวัตถุที่เป็นขอบเขตของภาพนั้นก็จะสามารถจดจำภาพ รวมทั้งขนาดพื้นที่ของวัตถุได้ สามารถนำไปใช้ในการตรวจหาวัตถุต้องสงสัย

ระบุวัตถุจากรูปทรง สี (Pattern detection)​

เป็นการระบุวัตถุจากรูปทรง รูปแบบ สี หรือสิ่งอื่นใดที่พบในภาพ ที่มีการพบเป็นรูปแบบเดียวกันซ้ำๆ ในวัตถุเดียวกัน ถูกนำมาใช้ประโยชน์ เช่น การสแกนลายนิ้วมือ การตรวจหาใบพืชที่เสียหาย เป็นต้น

Computer Vision มีบทบาทอย่างไร ในการพัฒนาเทคโนโลยี​

ในปัจจุบันนี้จะเห็นได้ว่า เทคโนโลยี Computer Vision ได้กลายเป็นส่วนหนึ่งของชีวิตมนุษย์ เป็นตัวขับเคลื่อนการพัฒนาเทคโนโลยีของโลก Computer Vision ถูกนำมาใช้งานในหลากหลายภาคส่วนตามวัตถุประสงค์ที่แตกต่างกัน ดังต่อไปนี้

การแพทย์ และบริการด้านสุขภาพ​

มีการนำเอา Computer Vision มาใช้อย่างแพร่หลายทางด้านการแพทย์ เช่น การพิจารณาภาพ MRI , CAT Scan ภาพ X-ray หรืออัลตร้าซาวด์ของผู้ป่วย เพื่อตรวจดูสิ่งผิดปกติของร่างกาย ทำให้การวิเคราะห์ผลมีคุณภาพและแม่นยำมากยิ่งขึ้น แพทย์สามารถออกแบบการรักษา รวมทั้งพยากรณ์โรคได้อย่างถูกต้อง เป็นการเพิ่มโอกาสสำเร็จในการรักษา

นอกจากนี้ ยังเป็นการช่วยเพิ่มมาตรฐานการให้บริการทางการแพทย์และการบริการด้านสุขภาพ

  • การตรวจสอบความหนาแน่นของคนไข้แต่ละแผนก จำนวนเตียงว่าง
  • ตรวจจับข้อมูลและระบุตัวตนของคนไข้ผ่านทาง Facial Recognition ลดเวลาการลงทะเบียนและกรอกเอกสาร และลดโอกาสในการระบุตัวตนคนไข้ผิด
  • ตรวจสอบหลังการรักษาและดูแลผู้ป่วยทางไกลโดยใช้ Video Analytic เพื่อติดตามผลการรักษาและพฤติกรรมของผู้ป่วยที่จำเป็นต้องดูแลตลอด 24 ชั่วโมง

ความมั่นคง และความปลอดภัย​

Computer Vision ถูกนำมาใช้อย่างแพร่หลายทางด้านความมั่นคงและความปลอดภัย

  • การตรวจจับบุคคลต้องสงสัย สิ่งของและวัสดุที่ผิดปกติ
  • การตรวจจับผู้บุกรุก การควบคุมการเข้าออกอาคารหรือสถานที่สำคัญ
  • การสืบหานักโทษหลบหนีหรือบุคคลสูญหาย
  • ใช้ติดกับแว่นตาร่วมกับเทคโนโลยีจับภาพในตอนกลางคืน ช่วยให้เจ้าหน้าที่ตำรวจปฏิบัติงานในช่วงเวลาที่อากาศย่ำแย่ หรือตอนกลางคืน
  • การตรวจจับป้ายทะเบียน ประเภทรถและลักษณะของรถ
  • การประเมินและคาดเดาการเกิดภัยธรรมชาติ เช่น การตรวจดูจุดความร้อนเพื่อทำนายการเกิดไฟไหม้ป่า และหมอกควัน
  • ภาคอุตสาหกรรมบันเทิง มีการนำเอาเทคโนโลยีใช้ในการตรวจสอบหาบุคคลที่ไม่น่าไว้วางใจ หรือกลุ่มแอนตี้แฟน ก่อนเข้าสู่งานคอนเสิร์ต หรืออีเวนต์มีตติ้งของศิลปิน

อุตสาหกรรม และการผลิต​

ในภาคอุตสาหกรรมและการผลิต ภาคการบริการ การเกษตร ก็มีการนำเอา Computer Vision มาใช้งาน เพื่อช่วยลดต้นทุน เพิ่มปริมาณการผลิต ลดการเกิดข้อผิดพลาด ประหยัดแรงงาน รวมทั้งเพิ่มมาตรฐานการให้บริการ

  • ร้านค้าปลีก นำเอามาติดตามพฤติกรรมและความสนใจของผู้บริโภคที่เข้ามาในร้านเพื่อปรับปรุงคุณภาพการให้บริการ
  • การเติมสต๊อกสินค้าเมื่อของหมด ภาคอุตสาหกรรมใช้ในการตรวจสอบหาสินค้าที่มีข้อบกพร่องจากฐานการผลิตและจัดเก็บทันทีก่อนส่งถึงมือผู้บริโภค
  • ทำนายช่วงเวลาที่ต้องบำรุงรักษาเครื่องมือและเครื่องจักร
  • ในส่วนของภาคการเกษตรก็มีการนำมาใช้งาน เช่น การตรวจสอบและคาดการณ์ว่าผักผลไม้สุกพร้อมเก็บแล้วจำนวนหลายแปลงพร้อมกัน การตรวจสอบสัตว์ในฟาร์ม เป็นต้น

ตัวอย่างการประยุกต์ใช้ Computer Vision ในการทำงาน​

เทคโนโลยี Computer Vision ได้มีการพัฒนาเป็นอย่างมาก สามารถแยกแยะและประมวลภาพได้อย่างแม่นยำและรวดเร็วกว่าการทำโดยมนุษย์ซึ่งมีข้อจำกัดอยู่มากมาย เช่น การอ่อนล้าจากการทำงานต่อเนื่องเป็นเวลานาน ซึ่งมีโอกาสที่จะเกิดความผิดพลาด มีความแม่นยำที่น้อย และใช้เวลาในการประมวลผลที่นานกว่า

การใช้ Computer Vision มาช่วยแก้ปัญหาข้อจำกัดของมนุษย์ จึงเป็นผลดีต่อธุรกิจในหลายด้าน เช่น บริการของ dIA DIGITAL METER READING ได้นำเอาเทคโนโลยี Computer Vision มาช่วยในการอ่านค่าการวัดสิ่งของ สามารถอ่านค่าการวัดได้อย่างรวดเร็วและแม่นยำ ลดโอกาสการเกิด Human Error ทั้งยังจดจำอุปกรณ์การวัดได้

นอกจากนั้นยังแจ้งเตือนผู้ปฏิบัติงานเมื่อใช้อุปกรณ์การวัดที่ไม่ถูกต้อง มี RPA (Robotic Process Automation) เพื่อบันทึกค่าการอ่านทั้งหมดและกรอกบัญชีแยกประเภทแบบเรียลไทม์ เพียงถ่ายรูปวัสดุที่ต้องการวัดด้วย dIA DIGITAL METER READING AI Mobile App ระบบ AI จะทำการประมวลผลการวัด และแสดงผลและจัดเก็บข้อมูลบน Web Application อย่างเป็นระบบ

Computer Vision คือ การฝึกฝนให้คอมพิวเตอร์หรือระบบ เรียนรู้และสามารถจดจำ เข้าใจ และวิเคราะห์ข้อมูลภาพ เช่น รูปภาพนิ่ง วิดีโอ หรืออินพุตต่างๆ ที่เน้นด้านภาพเป็นหลัก ได้อย่างชาญฉลาด แม่นยำ และตอบสนองต่อข้อมูลภาพที่มองเห็นได้อย่างรวดเร็ว ปัจจุบันมีการนำมาใช้งานในทุกภาคส่วน ไม่ว่าจะเป็น วงการธุรกิจ ภาคอุตสาหกรรมและการผลิต การแพทย์ การเกษตร หรือแม้แต่อุตสาหกรรมบันเทิง

โดยมีประโยชน์ในหลายด้าน เช่น ช่วยลดต้นทุน เพิ่มความมั่นคงและปลอดภัย เพิ่มคุณภาพและปริมาณการผลิต ลดการเกิดข้อผิดพลาด ประหยัดแรงงาน รวมทั้งเพิ่มมาตรฐานการให้บริการ โดยเฉพาะอย่างยิ่งการแก้ไขปัญหาข้อจำกัดในการทำงานโดยมนุษย์ เช่น สามารถเข้าไปตรวจสอบในส่วนที่มนุษย์เข้าไม่ถึง ลดโอกาสเกิดข้อผิดพลาดจากการทำงานที่เหนื่อยล้า เป็นต้น นอกจากนั้นยังมีบทบาทสำคัญในการทำให้เกิดการคิดค้นและพัฒนาเทคโนโลยีใหม่ๆ เช่น รถยนต์ไร้คนขับ หุ่นยนต์อัจฉริยะ เป็นต้น เพื่อช่วยให้การใช้ชีวิตของมนุษย์ง่ายและสะดวกสบายมากยิ่งขึ้น

สามารถติดต่อ dIA ได้ที่ www.dia.co.th หรือ โทร (+66) 95 8268778