Zero-shot learning چیست؟

در روشهای هوش مصنوعی و یادگیری ماشین معمولا ما برای طیقه بندی، از هر کلاس تعدادی نمونه را به الگوریتم نشان میدهیم و پس از آموزش از آن کلاس ها از مدل میپرسیم، اما در Zero-shot learning شرایط متفاوت است!

Zero-shot learning (یادگیری بدون نمونه) یک روش یادگیری عمیق است که به ما امکان می‌دهد الگوریتم‌ها و مدل‌های یادگیری ماشینی را برای تشخیص دسته‌هایی که در فاز آموزش دیده نشده‌اند، استفاده کنیم. در واقع، بدون داشتن دسته بندی شده نمونه‌های آموزشی برای هر دسته، مدل می‌تواند بر اساس توصیفات دسته‌ها و ویژگی‌های آنها، دسته‌بندی کند. یکی از مزایای اصلی این روش، امکان تعمیم یادگیری بر روی دسته‌های جدید و ناشناخته است. به عبارت دیگر، مدل قادر است پس از آموزش بر روی دسته‌های موجود، بدون نیاز به آموزش مجدد، دسته‌های جدید را تشخیص دهد و بر روی آن‌ها عملکرد قابل قبولی داشته باشد. این مورد در شرایطی که دسته‌های جدید به طور مداوم ایجاد و به سیستم اضافه می‌شوند، بسیار کاربردی است.

برای مثال مدل CLIP در بینایی کامپیوتر از یک روش یادگیری بدون نمونه یا Zero-shot learning بهره میبرد.

همچنین می‌توان گفت مثلا در تسکهای NLP (پردازش زبان طبیعی)، تعمیم بدون نیاز به آموزش، کاربرد افراطی یک تکنیک به نام تعمیم با تعداد کمی نمونه (Few-Shot) است که در آن چند مثال درباره وظیفه‌ای که می‌خواهیم مدل زبان انجام دهد به آن ارائه می‌دهیم و سپس از آن می‌خواهیم پاسخ‌های مشابهی برای ما فراهم کند. برای مثال در LLM ها می‌توان به جای آموزش مدل، با نشان دادن چند مثال، تولید مدل را تحت تأثیر قرار می‌دهیم و احتمال این که متن ادامه‌دهنده ساختار و الگوی مشابه پرامپت ما را دنبال کند، افزایش می‌دهیم. (این مثال را ببینید)