بررسی اجمالی سیستم های توصیه‌گر

معماری مشترک سیستم های توصیه‌کننده متشکل از اجزای زیر است:

تولید کاندیدا (candidate generation)
امتیازدهی (scoring)
رتبه بندی مجدد (re-ranking)

تولید کاندیدا

در این بخش، سیستم از یک مجموعه عظیم بالقوه شروع می کند و یک زیرمجموعه بسیار کوچکتر از کاندیداها را ایجاد می کند. به عنوان مثال، تولیدکننده کاندیدا در YouTube میلیاردها ویدیو را به صدها یا هزاران ویدیو کاهش می دهد. مدل باید به دلیل اندازه عظیم مجموعه داده ها، پرس و جوها را به سرعت ارزیابی کند. یک مدل خاص ممکن است چندین تولیدکننده کاندیدا ارائه دهد، که هر کدام یک زیرمجموعه متفاوت از کاندیداها را نامزد می کنند.

امتیازدهی

سپس، یک مدل دیگر کاندیداها را ارزیابی و رتبه بندی می کند تا مجموعه ای از موارد (در حدود 10) را برای نمایش به کاربر انتخاب کند. از آنجایی که این مدل یک زیرمجموعه نسبتاً کوچک از موارد را ارزیابی می کند، سیستم می تواند از یک مدل دقیق تر استفاده کند که به پرس و جوهای اضافی متکی باشد.

رتبه بندی مجدد

سرانجام، سیستم باید محدودیت های اضافی را برای رتبه بندی نهایی در نظر بگیرد. به عنوان مثال، سیستم موارد را که کاربر به طور صریح دوست ندارد حذف می کند یا امتیاز محتوای تازه را افزایش می دهد. رتبه بندی مجدد همچنین می تواند به اطمینان از تنوع (diversity)، تازگی (freshness) و عدالت (fairness) کمک کند.

در طول دوره کلاس، هر یک از این مراحل را مورد بحث قرار خواهیم داد و از مثال هایی از سیستم های توصیه مختلف مانند YouTube استفاده خواهیم کرد.

منبع: https://developers.google.com/machine-learning/recommendation/overview/types

قسمت قبلی: واژه شناسی (ترمینولوژی) سیستم‌های توصیه‌گر

قسمت بعدی: