چگونه یک کامپیوتر یاد می‌گیرد تا فورا یک شی را بازشناسی کند

0
134
yolo

تشخیص تصاویر با دقت ۹۹% توسط هوش مصنوعی

۱۰ سال قبل محققان بینایی ماشین فکر می کردند که گفتن فرق بین گربه و سگ به کامپیوتر؛ حتی با پیشرفت‌های قابل توجه درهوش مصنوعی تقریبا غیرممکن خواهد بود، اما حالا ما می‌توانیم این را با دقت بیشتر از ۹۹ درصد انجام بدیم، به این روش دسته بندی تصویر می‌گویند.

یک تصویر به برنامه می دهیم و یک برچسب به تصویر می زنیم و کامپیوترها هزاران دسته بندی دیگر را نیز به خوبی می توانند تشخیص دهند.

من دانشجوی ارشد از دانشگاه واشنگتن هستم و روی پروژه‌ دارک‌نت (شبکه سیاه) که در چارچوب شبکه عصبی است و برای آموزش دادن و تست کردن مدلهای بینایی کامیپوتر کار می کنم. خب بیاید به چگونگی فکر کردن دارک‌نت به این تصاویری که داریم، نگاه کنیم.

 

 

وقتی طبقه بندیمان را روی این تصاویر اجرا می‌کنیم، می‌بینیم که فقط پیش‌بینی سگ یا گربه بودن نیست در واقع پیش‌بینی‌ نژاد ها را نیز می‌گوییم. این سطح جزئیاتی است که الان داریم و صحیح است. سگ من در حقیقت مالاموت است.

 

سگ-مالاموت

 

خب گام‌های حیرت آوری در دسته بندی تصاویر ساخته‌ایم اما چه اتفاقی میفتد وقتی طبقه‌بندمان را روی تصویری مثل این اجرا می‌کنیم؟

 

سگ-و-گربه

 

پروژه یافتن اشیاء

خب می‌بینیم که طبقه‌بند یک پیش‌بینی خیلی مشابه کرده که درست هستش، یک مالاموت در تصویر وجود دارد، اما فقط یک برچسب داده شده، در واقع خیلی درباره اینکه در تصویر چه رخ داده نمی دانیم. به چیزی قویتر نیاز داریم.

من روی یک مسئله کار می‌کنم که یافتن اشیا نامیده می‌شود، وقتی به تصویری نگاه می کنیم و سعی در یافتن تمام اشیا رو داریم، آنها را داخل مستطیلهایی نمایش می دهیم و می‌گوییم که این اشیا چه هستند.

خب، این چیزی است که وقتی یابنده را اجرا کنیم اتفاق میافتد.

 

شناسایی-سگ-و-گربه

 

سیستم یابنده، مورد نیاز برای الگوریتم بینایی کامپیوتر

حالا با این نتایج می توانیم کمی بیشتربا الگوریتم بینایی کامپیوترمان کار کنیم. همانطور که میبینیم یک گربه و یک سگ در تصویر وجود دارد و محلهای نسبی، اندازه آنها و حتی شاید کمی اطلاعات اضافی را می‌داند؛ در پس زمینه هم یک کتاب قرار دارد.

اگر شما بخواهید یک سیستم در صدر بینایی کامپیوتر بسازید، مثل یک خودروی خودران یا یک سیستم رباتیکی، این نوع اطلاعاتی است که می‌خواهید، چیزی که بین شما و دنیای فیزیکی تعامل ایجاد کند.

این سیستم یابنده ماست که در زمان حقیقی روی لپ تاپ‌م اجرا می‌شود. خب به آرامی من را دنبال می‌کند بطوریکه من دور فریم حرکت می‌کنم و این شیوه مواجه با انواع تغییرات در اندازه ژست، رو به جلو، رو به پشت است.

این چیزیست که اگر بخواهیم سیستمی را در صدر بینایی کامپیوترها بسازیم به آن واقعا نیاز داریم.

 

حرکت-فريم-به-فريم

 

سیستم یافتن اشیاء در گذشته

ظرف فقط چند سال ما از ۲۰ ثانیه درتصویر به ۲۰ میلی ثانیه بر تصویر رفتیم، یعنی هزار بار سریعتر، چطور به اینجا رسیدیم؟

در گذشته سیستم‌های یافتن اشیا تصویری شبیه به این می‌گرفتند و آن را به بسیاری از مناطق تقسیم می‌کردند و سپس برای هر یک از این مناطق یک دسته بند را اجرا می‌کردند و بالاترین امتیاز برای این دسته بندی ها به عنوان تصویر یافته شده در نظر گرفته می شد.

اما این عمل دسته بند هزاران بار روی یک تصویر اجرا می‌شد و هزاران شبکه عصبی تصویر رو ارزیابی می‌کردند تا تشخیص درست بدهند که تصویر چه چیزی است.

 

سیستم‌های-یافتن-اشیا-در-گذشته

 

متد YOLO، سیستم یافتن اشیاء جدید

اما حالا ما یک تک شبکه را آموزش دادیم تا کل یافتنی ها را برای ما انجام دهد. همه باندهای محدود را تولید و همه احتمالات را با هم کلاس بندی می‌کند.

این سیستم به جای نگاه کردن به یک تصویر برای هزاران بار برای تشخیص درست مانند انسان فقط یکبار نگاه می کند؛ به همین دلیل ما اسم این سیستم را متد You Only Look Once) YOLO) برای یافتن اشیا گذاشته ایم.

کارایی همه منظوره سیستم YOLO

خب با این سرعت ما فقط به یک تصویر محدود نیستیم بلکه می‌توانیم ویدیو را نیز همزمان پردازش کنیم و به جای نگاه کردن به گربه و سگ می‌توانیم حرکت و تعامل آنها با یکدیگر را نیز ببینیم.
این یابنده‌ای است که ما در ۸۰ کلاس مختلف در دیتاست coco مایکروسافت آموزش دادیم. انواع اشیاء و تنوع عجیب و غریبی از اشیا را دارد : حیوانات ، ماشین ها ، گیاهان و …
خاطر داشته باشید که این یک سیستم یابنده اشیا همه منظوره است، ما می توانیم این را برای هر حوزه تصویری آموزش دهیم. از همین کدها در یک خودروی خودران برای تشخیص دادن تابلوهای راهنمایی و رانندگی، عابرپیاده، وسایل نقلیه استفاده شده است.

سیستم دارک نت چیست؟

سیستم دارک نت یک منبع آزاد است و در همه حوزه ها قابل استفاده است؛ بطور مثال از دارک نت در زمینه پزشکی می توان برای یافتن سلولهای سرطانی دریک نمونه برداری بافت استفاده کرد و یا محققانی در سراسر جهان وجود دارند که از این سیستم برای زمینه های پیشرفته تر مانند دارو روباتیک استفاده می‌کنند، همچنین دیده شده برای سرشماری حیوانات یک باغ وحش از سیستم YOLO به عنوانی بخشی از سیستم یابنده استفاده شده است.

 

سیستم-yolo

 

 

LEAVE A REPLY

Please enter your comment!
Please enter your name here

3 × 2 =