مروری کلی تولید کاندیدا در سیستمهای توصیهگر
ایجاد کاندیدا یا نامزد اولین مرحله یک سیستم توصیهگر است. با توجه به یک پرس و جو، سیستم مجموعه ای از کاندیدهای مرتبط را تولید می کند. جدول زیر دو رویکرد رایج تولید کاندیدا را نشان می دهد:
نوع فیلتر | مثال |
---|---|
فیلتر مبتنی بر محتوا | از شباهت بین عناصر برای توصیه عناصر مشابه آنچه کاربر دوست دارد استفاده می کند. اگر کاربر A دو ویدیو گربه بامزه تماشا کند، سیستم می تواند ویدیوهای حیوانات بامزه را به آن کاربر توصیه کند. |
فیلتر همکارانه | همبستگی بین پرسوجوها و عناصر را به طور همزمان برای ارائه توصیه ها استفاده می کند. اگر کاربر A مشابه کاربر B باشد و کاربر B ویدیو 1 را دوست داشته باشد، سیستم می تواند ویدیو 1 را به کاربر A توصیه کند (حتی اگر کاربر A هیچ ویدئویی مشابه ویدیو 1 را ندیده باشد). |
فضای امبدینگ (Embedding Space)
هم فیلترسازی محتوایی (content-based filtering) و هم فیلترسازی مشارکتی (collaborative filtering)، هر آیتم و هر پرسوجو (یا context) را به یک بردار امبدینگ در فضای نگاشت مشترک تبدیل میکنند. به طور معمول، فضای نگاشت کمبعدی است (یعنی d بسیار کوچکتر از اندازه corpus است) و برخی از روابط پنهان بین آیتمها یا پرس و جوها را نشان میدهد. آیتمهای مشابه، مانند فیلمهای یوتیوب که معمولاً توسط یک کاربر خاص تماشا میشوند، در فضای امبدینگ نزدیک به هم قرار میگیرند. مفهوم “نزدیک بودن” نیز توسط یک معیار شباهت تعریف میشود.
معیار شباهت
معیار شباهت یک تابع است که یک جفت امبدینگ را میگیرد و یک عدد را به عنوان معیار شباهت آنها برمیگرداند. این امبدینگها را میتوان برای تولید کاندیداها به شرح زیر استفاده کرد: با داده امبدینگ پرسوجو ، سیستم به دنبال نگاشتهای آیتم ∈ است که به آن نزدیک هستند، به این معنی که نگاشتهایی با شباهت بالایی بین آنها وجود دارد. (،)
https://developers.google.com/machine-learning/recommendation/overview/candidate-generation
دیدگاهتان را بنویسید