LightGCN چیست؟

LightGCN مدلی است که در سیستم‌های توصیه‌گر به کار می‌رود و از معماری شبکه‌های عصبی کانولوشنی گرافی (GCN) استفاده می‌کند. این مدل بر سادگی تأکید دارد و به جای استفاده از عملیات‌های پیچیده در سایر مدل‌های GCN، رویکردی مستقیم برای یادگیری تعبیه‌های کاربر و آیتم از طریق گسترش وزن‌های همسایگی در گراف دارد.

در LightGCN، تابع هدف برای آموزش بهینه‌سازی شده است تا اختلاف بین تعاملات مثبت واقعی کاربر با آیتم‌ها و تعاملات منفی تصادفی را به حداقل برساند. این کار به مدل کمک می‌کند تا ترجیحات کاربران را دقیق‌تر شناسایی کرده و پیش‌بینی‌های بهتری ارائه دهد.

1. مدل LightGCN

LightGCN یک نسخه ساده‌شده از Neural Graph Collaborative Filtering (NGCF) است که GCN‌ها را در سیستم‌های توصیه‌گر به کار می‌برد.

1.1 شبکه‌های گراف در سیستم‌های توصیه‌گر

GCN‌ها شبکه‌هایی هستند که می‌توانند الگوها را در داده‌های گرافی یاد بگیرند. آن‌ها می‌توانند در زمینه‌های متعددی به کار روند، اما به‌خصوص برای سیستم‌های توصیه‌گر مناسب هستند، زیرا قابلیت نمایش روابط را دارند.

در مدل‌های سنتی مانند matrix factorization، کاربران و آیتم‌ها به صورت embeddings نمایش داده می‌شوند. و تعامل، که سیگنالی است که رفتار را نمایش می‌دهد، بخشی از embeddings نیست، بلکه در تابع زیان نمایش داده می‌شود، معمولاً به صورت حاصل‌ضرب نقطه‌ای.

با وجود اثربخشی آن‌ها، برخی نویسندگان استدلال می‌کنند که این روش‌ها برای به دست آوردن embeddings رضایت‌بخش برای فیلتر مشارکتی (collaborative filtering) کافی نیستند. دلیل اصلی این است که تابع embedding فاقد نمایش مستقیم سیگنال همکاری است، که در تعاملات کاربر-آیتم پنهان است تا شباهت رفتاری بین کاربران (یا آیتم‌ها) را آشکار سازد.

GCN‌ها می‌توانند برای نمایش سیگنال تعامل در embeddings به کار روند. آیتم‌هایی که با آن‌ها تعامل شده به عنوان ویژگی‌های کاربر دیده می‌شوند، زیرا شواهد مستقیمی در مورد ترجیحات کاربر ارائه می‌دهند. به طور مشابه، کاربرانی که یک آیتم را مصرف می‌کنند، می‌توانند به عنوان ویژگی‌های آیتم تلقی شوند و برای اندازه‌گیری شباهت همکارانه دو آیتم به کار روند. یک راه طبیعی برای دربرگیری سیگنال تعامل در embedding، استفاده از اتصالات درجه‌بالا از تعاملات کاربر-آیتم است.

در شکل زیر، تعامل کاربر-آیتم نشان داده شده (در سمت چپ) و همچنین مفهوم اتصالات درجه‌بالا (در سمت راست) نمایش داده شده است.

lightgcn

اتصالات درجه‌بالا نشان‌دهنده سیگنال همکاری در یک فرم گرافی است. به عنوان مثال، مسیر $u_1 \leftrightarrow i_2 \leftrightarrow u_2 \leftrightarrow i_4$ نشان می‌دهد که رفتار شبیه‌سازی بین $u_1$ و $u_2$ وجود دارد، زیرا هر دو کاربر با $i_2$ تعامل داشته‌اند؛ مسیر طولانی‌تر $u_1 \leftrightarrow i_2 \leftrightarrow u_2 \leftrightarrow i_4$ نشان می‌دهد که $u_1$ احتمالاً $i_4$ را انتخاب خواهد کرد، زیرا کاربر مشابه $u_2$ قبلاً $i_4$ را مصرف کرده است. علاوه بر این، از دیدگاه کلی با $l = 3$ ، آیتم $i_4$ احتمالاً برای $u_1$ جالب‌تر است تا $i_5$ ، زیرا دو مسیر $i_4$ را به $u_1$ وصل می‌کنند، در حالی که تنها یک مسیر $i_5$ را به $u_1$ متصل می‌کند.

بر اساس این اتصالات درجه‌بالا، NGCF یک لایه انتشار تعبیه را تعریف می‌کند که تعبیه کاربر (یا آیتم) را با جمع‌آوری تعبیه‌های آیتم‌های تعامل‌یافته تصفیه می‌کند. با قرار دادن چندین لایه انتشار تعبیه، می‌توانیم سیگنال همکاری را در اتصالات درجه‌بالا تقویت کنیم.

به طور رسمی، فرض کنید $e_u^0$ تعبیه اصلی کاربر $u$ و $e_i^0$ تعبیه اصلی آیتم $i$ است. انتشار تعبیه به صورت بازگشتی به این صورت محاسبه می‌شود:

$e_u^{(k+1)} = \sigma \left(W_1 e_u^{(k)} + \sum_{i \in N_u} \frac{1}{\sqrt{|N_u||N_i|}} (W_1 e_i^{(k)} + W_2 (e_i^{(k)} \cdot e_u^{(k)})) \right)$

$e_i^{(k+1)} = \sigma \left(W_1 e_i^{(k)} + \sum_{u \in N_i} \frac{1}{\sqrt{|N_i||N_u|}} (W_1 e_u^{(k)} + W_2 (e_u^{(k)} \cdot e_i^{(k)})) \right)$

که در آن $W_1$ و $W_2$ ماتریس‌های وزن قابل آموزش، $\frac{1}{\sqrt{|N_i||N_u|}}$ یک عامل تخفیف بیان شده به عنوان نرم لاپلاسین گراف است، و $N_u$ و $N_i$ همسایه‌های اولیه کاربر و آیتم را نشان می‌دهند و $\sigma$ یک تابع غیرخطی است که در مقاله به عنوان LeakyReLU تنظیم شده است.

برای به دست آوردن نمایندگی نهایی، هر تعبیه منتشر شده به هم پیوسته می‌شود (یعنی $e_u^{(*)} = e_u^{(0)} \ldots e_u^{(l)}$ ) و سپس ترجیح نهایی کاربر بر روی یک آیتم به عنوان حاصلضرب نقطه‌ای محاسبه می‌شود: $y_{ui} = e_u^{(*)} \cdot e_i^{(*)}$ .