Zero-shot learning چیست؟
در روشهای هوش مصنوعی و یادگیری ماشین معمولا ما برای طیقه بندی، از هر کلاس تعدادی نمونه را به الگوریتم نشان میدهیم و پس از آموزش از آن کلاس ها از مدل میپرسیم، اما در Zero-shot learning شرایط متفاوت است!
Zero-shot learning (یادگیری بدون نمونه) یک روش یادگیری عمیق است که به ما امکان میدهد الگوریتمها و مدلهای یادگیری ماشینی را برای تشخیص دستههایی که در فاز آموزش دیده نشدهاند، استفاده کنیم. در واقع، بدون داشتن دسته بندی شده نمونههای آموزشی برای هر دسته، مدل میتواند بر اساس توصیفات دستهها و ویژگیهای آنها، دستهبندی کند. یکی از مزایای اصلی این روش، امکان تعمیم یادگیری بر روی دستههای جدید و ناشناخته است. به عبارت دیگر، مدل قادر است پس از آموزش بر روی دستههای موجود، بدون نیاز به آموزش مجدد، دستههای جدید را تشخیص دهد و بر روی آنها عملکرد قابل قبولی داشته باشد. این مورد در شرایطی که دستههای جدید به طور مداوم ایجاد و به سیستم اضافه میشوند، بسیار کاربردی است.
برای مثال مدل CLIP در بینایی کامپیوتر از یک روش یادگیری بدون نمونه یا Zero-shot learning بهره میبرد.
همچنین میتوان گفت مثلا در تسکهای NLP (پردازش زبان طبیعی)، تعمیم بدون نیاز به آموزش، کاربرد افراطی یک تکنیک به نام تعمیم با تعداد کمی نمونه (Few-Shot) است که در آن چند مثال درباره وظیفهای که میخواهیم مدل زبان انجام دهد به آن ارائه میدهیم و سپس از آن میخواهیم پاسخهای مشابهی برای ما فراهم کند. برای مثال در LLM ها میتوان به جای آموزش مدل، با نشان دادن چند مثال، تولید مدل را تحت تأثیر قرار میدهیم و احتمال این که متن ادامهدهنده ساختار و الگوی مشابه پرامپت ما را دنبال کند، افزایش میدهیم. (این مثال را ببینید)
دیدگاهتان را بنویسید