دید ماشینی یا بینایی ماشینی (به انگلیسی: Machine vision) به استفاده از حسگرها برای دریافت سیگنالهایی که تشکیلدهنده تصویر یک شی هستند که توسط رایانه یا سایر وسایل پردازش سیگنال برای تفسیر و تحلیل سیگنالهای دریافت شده از قطعه مورد استفاده قرار میگیرند گفته میشود. دید ماشینی به عنوان یک ابزار مهندسی در ابزارهای دیجیتال و در شبکههای رایانهای، برای کنترل ابزارهای صنعتی دیگر از قبیل کنترل بازوهای ربات یا خارج کردن تجهیزات معیوب به کار میرود. در حقیقت دید ماشینی شاخهای از علم مهندسی است که به رشتههای علوم رایانهای و علم نورشناسی و مهندسی مکانیک و خودکارسازی صنعتی ارتباط دارد. یکی از مهمترین پر استفادهترین کاربردهای آن در بازبینی و بررسی کالاهای صنعتی از جمله نیمههادیها، اتومبیلها، مواد خوراکی و دارو میباشد. همانند نیروی انسانی که با چشم غیر مسلح در خط تولید کالاها را برای تعیین کیفیت و نوع ساخت آنها بازبینی میکنند، دید ماشینی از دوربینهای دیجیتال و دوربینهای هوشمند و نرمافزارهای پردازش تصویر برای این کار استفاده میکند. دستگاههای مربوط به دید ماشینی برای انجام دادن وظایفی خاص از جمله شمردن اشیاء در بالابرها، خواندن شماره سریالها، جستجوی سطحهای معیوب به کار میروند. در حال حاضر صنعت استفاده زیادی از سامانه دید ماشین برای آزمون چشمی[پانویس ۱] اشیاء که نیاز به سرعت بالا و دقت بالا و کار ۲۴ ساعته و تکرار محاسبات بالا دارد،میکند. اگرچه انسان عملکرد بهتر با قابلیت تطبیقدهی بیشتری برای خطاهای تازه در زمان کوتاه دارد ولی با توجه به ویژگیهای ذکر شده این دستگاهها به مرور جای نیروی انسانی را که به دلیل انحراف و شرایط بد دارای خطا میباشند، در صنعت پر میکند. رایانهها به همان صورتی که انسان میبیند نمیتوانند ببینند. در حالی که انسان میتواند بر استنباط و فرضیات اتکا کند، تجهیزات رایانهای باید به وسیله آزمودن و تجزیه و تحلیل کردن جداگانه پیکسلها و تلاش برای نتیجهگیری با توجه به پشتوانه اطلاعاتی و روشهایی مانند شناسایی الگو مشاهده کنند. علیرغم اینکه بعضی الگوریتمهای دید ماشینی برای تقلید کردن از بینایی انسان توسعه یافتهاند، تعداد معدودی روش برای تحلیل و شناسایی ویژگیهای مرتبط تصاویر به صورت مؤثر و ثابت توسعه یافتهاند. سامانههای دید ماشینی و دید رایانهای قادر هستند به صورت ثابت تصاویر را تجزیه و تحلیل کنند، ولی پردازش تصویر بر پایهٔ رایانه، به صورت کلی برای انجام کارهای تکراری طراحی میشود و علیرغم پیشرفتهای صورت گرفته در این زمینه، هیچ سامانهٔ دید ماشینی و دید رایانهای قادر نیست با برخی از ویژگیهای سامانه بینایی انسان در قالب درک تصویر، تحمل تغییرات نور، تضعیف قدرت تصویر و تغییرات اجزا و… تطبیق پیدا کند.
اجزای یک سامانه دید ماشین
اگرچه دید ماشینی بیشتر به عنوان یک فرایند در به کار بستنٍ آن در کاربردهای صنعتی شناخته شدهاست، برای فهرست کردن اجزای سختافزاری و نرمافزاری نیز میتواند مفید باشد. یک دید ماشینی معمولا از اجزای زیر ساخته شدهاست:
- یک یا چند دوربین دیجیتال یا آنالوگ (سیاه-سفید یا رنگی) با خواص نوری مناسب برای گرفتن عکس.
- واسطهای که عکسها را برای پردازش آماده میسازد. برای دوربینهای آنالوگ این واسطه شامل یک دیجیتالکننده عکس است. هنگامی که این واسطه یک سختافزارٍ جدا باشد، به آن چارچوب ساز[پانویس ۲] (کارتی که برای دریافت سیگنال تصویری و فرستادن آن به رایانه استفاده میشود) میگویند.
- یک پردازنده (گاهی یک رایانه خانگی یا پردازنده جاساز[پانویس ۳] مانند پردازنده سیگنال دیجیتال.
- نرمافزار دید ماشینی: این نرمافزار امکاناتی برای توسعه یک برنامه نرمافزاری که برای کاربردی مشخص است را فراهم میکند.
- ۵. سختافزار ورودی / خروجی (مثلاً I/O دیجیتال) یا حلقههای ارتباطی (مثلاً ارتباط شبکهای یا RS-232) برای گزارش نتایج.
- یک دوربین هوشمند: یک وسیله ساده که همه موارد فوق را داراست.
- لنزهایی که بتواند به مقدار مطلوبی روی حسگر تصویر بزرگنمایی کنند.
- منابع نوری مناسب و گاهی خیلی مخصوص (مثلاً چراغهای LED، فلورسنت، هالوژن و . . .)
- یک برنامهٔ مشخص که بتواند تصاویر را پردازش کرده و مشخصههای مربوط و مناسب را شناسایی کند.
- یک حسگر همزمانساز برای شناسایی اجزا (گاهی یک حسگر نوری یا یک حسگر مغناطیسی): این حسگر برای راهاندازی سامانه استخراج و پردازش تصویر میباشد.
حسگر همزمان ساز تعیین میکند که چه زمانی یک بخش (که معمولاً روی یک تسمه نقاله حرکت میکند) در موقعیتی قرار گرفتهاست که باید مورد بررسی واقع شود. این حسگر هنگامیکه از زیر دوربین میگذرد و یک پالس نوری برای ثابت نگه داشتن تصویر ایجاد میکند، دوربین را برای گرفتن عکس فعال میکند. نوری که برای روشن کردن آن بخش به کار میرود در واقع برای آن است که مشخصههای مطلوب را برجسته و مشخصات نامطلوب (مثل سایهها یا انعکاسها) را به حداقل برساند. معمولاً چارچوبهای الایدی با اندازه و طراحی مناسب برای این هدف مورد استفاده قرار میگیرند. تصویر دوربین یا توسط یک چارچوب ساز یا توسط یک حافظه رایانهای (که در آن از چارچوب ساز استفاده نشده است) گرفته میشود. چارچوب ساز یک وسیله دیجیتالکننده است (یا در داخل دوربین هوشمند یا بهطور جداگانه) که خروجی دوربین را به قالب دیجیتال تبدیل کرده (معمولاً این قالب از یک آرایه دو بعدی از اعداد تشکیل شده که هر عدد متناظر شدت روشنایی نقطه متناظر در آن تصویر میباشد. به این نقاط پیکسل میگویند) و سپس تصویر را به منظور پردازش توسط نرمافزارٍ دید ماشینی در حافظه رایانه ذخیره میکند. بهطور معمول نرمافزار، اقدامات متفاوتی را برای پردازش تصویر انجام میدهد. گاهی در ابتدا تصویر برای کاهش نویز یا تبدیل سایههای خاکستری به ترکیب سادهای از رنگهای سیاه و سفید دستکاری میشود ( تصویر دورنگی[پانویس ۴]). در قدم بعدی نرمافزار عمل شمردن، اندازهگیری و شناسایی اجسام، ابعاد، کاستیها و مشخصات دیگر تصویر را انجام میدهد. در نهایت با توجه به ضوابط و معیارهای برنامهریزی شده ممکن است بخشی را بپذیرد یا رد کند. اگر یک بخش رد شد، نرمافزار به یک دستگاه مکانیکی فرمان میدهد تا آن بخش را خارج کند و همچنین سامانه خط تولید را قطع کرده و به کارگر هشدار میدهد تا مشکلی که باعث ایجاد خطا شده را رفع نماید. اگرچه اکثر دیدهای ماشینی بر مبنای دوربینهای سیاه–سفید بنا نهاده شدهاند، استفاده از دوربینهای رنگی در حال رایج شدن است. همچنین امروزه شاهد افزایش استفاده از تجهیزات دوربینهای دیجیتال به جای یک دوربین و یک چارچوبساز جداگانه در دید ماشینی هستیم. استفاده از یک دوربین دیجیتال به منظور برقراری ارتباط مستقیم، باعث صرفه جویی در هزینه و نیز سادگی سامانه خواهد شد. دوربینهای هوشمند که در داخل آنها پردازنده تعبیه شده است، در حال تسخیر سهم بالایی از بازار ماشینهای دید هستند. استفاده از یک پردازنده تعبیه شده (و یا یک پردازنده بهینه) نیاز ما به چارچوبساز و یک رایانه خارجی را از بین میبرد. به همین خاطر این پردازندهها باعث کاهش هزینه، کاهش پیچیدگی سامانه و همچنین اختصاص توان پردازشی مشخص به هر دوربین میشود. دوربینهای هوشمند معمولاً ارزانتر از سامانههای شامل یک دوربین و یک برد و یک رایانه خارجی هستند. همچنین توان بالای پردازنده داخلی و پردازندههای سیگنال دیجیتال منجر به بالا رفتن عملکرد و توانایی آنها نسبت به سامانههای مرسوم (که بر مبنای رایانه خانگی هستند) شدهاست.
روشهای پردازش
شمارش پیکسل
شمردن تعداد پیکسلهای روشن و تاریک.
تعیین آستانه
تبدیل یک عکس با قسمتهای خاکستری به یک عکس سیاه و سفید به این طریق که با قرار دادن آستانهای، پیکسلهای روشنتر از آن را سفید و پیکسلهای تیرهتر از آن را سیاه در نظر میگیریم.
بخشبندی کردن[پانویس ۵]
تبدیل تصویر ورودی به بخشهای مختلف برای موقعیتیابی و شمارش پیکسلها.
تشخیص و شناسایی لکهها و دستکاری
بررسی یک عکس برای یافتن گسسته از بین تمامی پیکسلها. (به عنوان مثال یک حفره سیاه رنگ در درون یک جسم خاکستری) این لکهها به عنوان نشان اختصاصی عکس خواهند بود.
تشخیص و شناسایی توسط اجزاء موجود
استخراج اجزاءی خاص از یک تصویر ورودی مثلاً عکس.
تشخیص وشناسایی الگو به شکل مقاوم در برابر تغییرات
به این معنا که موقعیت جسمی که ممکن است چرخانده شود یا اندازهاش تغییر کند یا قسمتی از این جسم توسط جسم دیگر پوشانده شود، را بهطور دقیق شناسایی کند.
خواندن بارکد
شناسایی و تعیین کدهای یک بعدی[پانویس ۶] و دو بعدی[پانویس ۷] پویش شده توسط ماشینها طراحی شدهاست.
خواندن خودکار یک متن (مثال: یک رشته اعداد پشت سر هم).
اندازهگیری
اندازهگیری ابعاد یک جسم (بر حسب میلیمتر یا اینچ).
پیدا کردن لبههای یک جسم در یک تصویر. منظور از لبهها تشخیص انواع خطوط منحنی و صاف در قمستهای مختلف یک عکس میباشد که ممکن است برخی از لبهها بلند و طولانی و برخی کوتاه باشند. در برخی کاربردها مثل تصاویر تهیه شده زیردریایی، عکس مورد پردازش دارای نویز بالایی خواهد بود بنابراین تشخیص لبههای واقعی در چنین محیطهایی بهخصوص برای لبههای ضعیف سخت خواهد شد.
تشخیص و شناسایی از طریق تطبیق الگو
پیدا کردن، مطابقت دادن و شمارش اشکال خاص در یک تصویر.
در اکثر موارد یک سامانه دید ماشینی به منظور بررسی کامل یک تصویر، از زنجیره مرکبی از این روشهای پردازش استفاده میکند. به عنوان مثال میتوان به سامانهی اشاره کرد که بارکد را میخواند و علاوه بر آن سطح جسم را برای خراش احتمالی مورد بررسی قرار میدهد و طول و عرض ر نیز ا اندازهگیری کند.
کاربردهای دید ماشین
همانطور که در بین حواس انسان، بینایی از همه کاربرد وسیع تری دارد؛ دید ماشین نیز در زمینههای گوناگون کاربردهای متنوع و فراوانی دارد.
خودکارسازی صنعتی
دستگاهای دید ماشین دارای کاربردهای متنوعی هستند که از آن جمله بهطور خلاصه میتوان به موارد زیر اشاره نمود:
- تولید صنعتی در مقیاس بزرگ.
- ساخت اجزایی که نیاز به زمان تولید مشخصی دارند.
- سامانههای ایمنی موجود در محیطهای صنعتی.
- بررسی مواد اولیه تولید (مثلاً کنترل کیفیت و بررسی وقوع خطا)
- کنترل موجودی انبار و سامانههای مدیریتی (شمارش، بارکد خواندن و ذخیره اطلاعات در سامانههای دیجیتال)
- کنترل رباتهای تعقیب خطی که برای حمل بار در کارخانههای صنعتی استفاده میشوند.
- کنترل کیفیت و بهبود محصولات غذایی.
- ماشینی کردن اجزای کوچک صنعتی.
سامانههای دید ماشین بهطور گسترده در صنعت تولید نیمزساناها کاربرد دارند. بدون وجود این سامانهها تولید قطعات رایانهای کاهش مییابد. این دستگاهها برای بازبینی دقیق ویفرهای سیلیکونی و پردازندهها به کار میروند. در صنعت خودروسازی، دید ماشین برای هدایت روباتهای صنعتی، سنجش کیفیت کالاهای مشخصشده برای اهداف خاص و بازبینی سطحهای رنگ شده ماشین جهت یافتن عیب به کار میرود. اگرچه روشهای مربوط به سامانههای دید ماشین برای طیفهای مرئی از اشیاء گسترش یافتهاند ولی ممکن است مشابه آن برای طیفهای نامرئی نور مانند اشعه مادون قرمز کار برده شوند.
حمل و نقل
پلاکخوان
تشخیص نویسههای پلاک از جمله کاربردهای فراگیر دید ماشین میباشد. با شناساندن نویسههای پلاک هر کشور به سامانه پردازشی و جستجوی شباهت میان آنها و تصاویر ورودی دوربین میتوان پلاک موجود در تصویر را خواند. این سامانهها در پارکینگهای هوشمند، ورودی و خروجی سازمانها و مجتمعهای بزرگ جهت کنترل تردد مورد استفاده قرار میگیرند. علاوه بر اینها در صورت پلاک خوانی یک خودرو در ابتدا و انتهای یک مسیر میتوان سرعت میانگین آن را محاسبه و متخلفان را اعمال قانون کرد.
سرعتسنج
با استفاده از تصویر دو دوربین میتوان عمق تصویر را بهدست آورد و از این طریق تغییرات عمق را میتوان بهدست آورد که به معنی سرعت است. در نوعی از سرعتسنجهای بزرگراهی از دید ماشین جهت تشخیص سرعت استفاده میشود. مزیت این سامانهها بر نمونههای مشابهی که از رادار یا لیزر برای سرعتسنجی بهره میبرند، انفعالی بودن آنها است. انفعالی بودن به این معنی است که این تجهیزات امواجی از خود صادر نمیکنند و به همین علت استفاده از اختلالگر یا ردیاب به منظور جلوگیری از ثبت تخلف کارایی ندارد. این سامانهها در نوع ثابت و متحرک طراحی میشوند. سامانههای ثابت در کنار خیابان، جاده یا بزرگراه نصب شده و سامانههای متحرک بر روی خودرویهای پلیس نصب میشوند. از این سامانهها میتوان به عنوان ترددشمار و سامانه کنترل ترافیک نیز بهره برد.
ثبت تخلف چراغ راهنمایی و رانندگی
با پردازش تصاویر دوربینهای نصب شده در تقاطعها میتوان زمان، سرعت، جهت حرکت و پلاک خودروها را بهدست آورد و بدین ترتیب تخلفات متنوعی از جمله عبور از چراغ قرمز، توقف روی خط عابر پیاده، گردش به چپ و راست و تخطی از سرعت مجاز هنگام عبور از تقاطع را ثبت کرد.
ایمنی رانندگی
برای افزایش سطح ایمنی در رانندگی، خودروهای جدید مجهز به سامانههای دید ماشین شدهاند که به راننده در حفظ هوشیاری و دقت کمک میکنند. از جمله این سامانهها میتوان به سامانههای تشخیص مانع، آینهٔ کنار هشدار دهنده، هشداردهنده تابلوهای راهنمایی و رانندگی و هشدار دهنده خارج شدن از خطوط جاده اشاره کرد.
تشخیص حجم
با توجه به اینکه سامانههای دید ماشین قادرند مشخصات مکانی نقاط تصاویر را استخراج کنند، میتوان از آنها به عنوان سامانههای تشخیص حجم بهره برد. به عنوان نمونه میتوان به سامانه تشخیص حجم بار خودروهای سنگین اشاره کرد. این سامانهها در محلهای دفن پسماند یا نخاله ساختمانی، معادن و کارخانجات تولید مصالح ساختمانی کاربرد دارد.
زمینههای مربوط به دید ماشین
دید ماشین به مهندسی سامانههای تصویر در صنعت و تولید و همچنین به گستره وسیعی از علوم رایانه شامل دید رایانه، کنترل تجهیزات، شبکههای رایانهای، مدارهای واسط و فراگیری ماشین مربوط میشود. لازم است ذکر شود که دو مفهوم دید ماشین و دید رایانه نباید با یکدیگر اشتباه گرفته شوند. دید رایانه مفهوم گستردهتری در حل مسائل تصویری دارد درحالیکه دید ماشین یک روش مهندسی است که عموماً در مسائل مهندسی کاربرد دارد.
جستارهای وابسته
- واقعیت افزوده
- ادراک ماشین
- بارکد
- دید رایانهای
- پردازش تصویر دیجیتال
- Frame grabber
- ربات خانهدار
- پردازش تصویر
- ربات صنعتی
- تصویربرداری پزشکی
- ریختشناسی ریاضیاتی
- تشخیص نوری نویسهها
- بازشناخت الگو
- نقشهبرداری رباتیک
- دوربین هوشمند
- تحلیل تصویر
- mobile manipulator
پانویس
برای مطالعهٔ بیشتر
- E. R. Davies (2004). Machine Vision: Theory, Algorithms, Practicalities. Morgan Kaufmann.
- Batchelor B.G. and Whelan P.F. (1997). Intelligent Vision Systems for Industry. Springer-Verlag. ISBN 3-540-19969-1.. Online PDF version [۱]
- Demant C. , Streicher-Abel B. and Waszkewitz P. (1999). Industrial Image Processing: Visual Quality Control in Manufacturing. Springer-Verlag. ISBN 3-540-66410-6.
- Gonzales R. C. and Wintz P. A. (2001). Digital Image Processing. Longman Higher Education. ISBN 978-0-201-11026-5.
- Pham D.T. and Alcock R.J. (2003). Smart Inspection Systems: Techniques and Applications of Intelligent Vision. Academic Press. ISBN 0-12-554157-0.
- Berthold K.P. Horn (1986). Robot Vision. MIT Press. ISBN 0-262-08159-8.