AI agentها یا عامل‌های هوش مصنوعی چیستند؟

یک عامل (Agent) هوش مصنوعی به سیستم یا برنامه‌ای اشاره دارد که قادر است به طور خودکار با طراحی گردش کار خود و استفاده از ابزارهای موجود، وظایفی را از طرف کاربر یا سیستم دیگری انجام دهد.

Agent‌های هوش مصنوعی می‌توانند طیف گسترده‌ای از قابلیت‌ها فراتر از پردازش زبان طبیعی را شامل شوند، از جمله تصمیم‌گیری، حل مسئله، تعامل با محیط‌های خارجی و اجرای اقدامات.

این Agent‌ها می‌توانند در کاربردهای مختلف برای حل وظایف پیچیده در زمینه‌های مختلف سازمانی به کار گرفته شوند، از طراحی نرم‌افزار و خودکارسازی IT گرفته تا ابزارهای تولید کد و دستیاران مکالمه‌ای. آنها از تکنیک‌های پیشرفته پردازش زبان طبیعی مدل‌های زبانی بزرگ (LLM‌ها) برای درک و پاسخ به ورودی‌های کاربر به صورت گام به گام استفاده می‌کنند و تشخیص می‌دهند چه زمانی از ابزارهای خارجی استفاده کنند.

چگونگی کار Agent‌های هوش مصنوعی

در هسته Agent‌های هوش مصنوعی، مدل‌های زبانی بزرگ (LLM‌ها) قرار دارند. به همین دلیل، به Agent‌های هوش مصنوعی اغلب Agent‌های LLM نیز گفته می‌شود. مدل‌های زبانی سنتی، پاسخ‌های خود را بر اساس داده‌هایی که با آنها آموزش دیده‌اند تولید می‌کنند و محدود به دانش و محدودیت‌های استدلالی هستند. در مقابل، Agent از فراخوانی ابزار در پشت صحنه برای دستیابی به اطلاعات به‌روز، بهینه‌سازی گردش کار و ایجاد زیروظایف به صورت خودکار برای دستیابی به اهداف پیچیده استفاده می‌کند.

در این فرآیند، Agent خودمختار می‌آموزد که با گذشت زمان با انتظارات کاربر سازگار شود. توانایی Agent در ذخیره تعاملات گذشته در حافظه و برنامه‌ریزی اقدامات آینده، تجربه‌ای شخصی‌سازی شده و پاسخ‌های جامع را تشویق می‌کند. این فراخوانی ابزار می‌تواند بدون دخالت انسان انجام شود و امکانات کاربردهای دنیای واقعی این سیستم‌های هوش مصنوعی را گسترش می‌دهد. رویکردی که Agent‌های هوش مصنوعی در دستیابی به اهداف تعیین شده توسط کاربران اتخاذ می‌کنند، از این سه مرحله تشکیل شده است:

هدف‌گذاری اولیه و برنامه‌ریزی

اگرچه Agent‌های هوش مصنوعی در فرآیندهای تصمیم‌گیری خود خودمختار هستند، به اهداف و محیط‌هایی که توسط انسان‌ها تعریف شده نیاز دارند. سه تأثیر اصلی بر رفتار Agent خودمختار وجود دارد:

تیم توسعه‌دهندگانی که سیستم هوش مصنوعی Agent را طراحی و آموزش می‌دهند.
تیمی که Agent را مستقر می‌کند و دسترسی کاربر به آن را فراهم می‌سازد.
کاربری که اهداف خاصی را برای Agent هوش مصنوعی تعیین می‌کند و ابزارهای موجود برای استفاده را مشخص می‌کند.

با توجه به اهداف کاربر و ابزارهای موجود Agent، Agent هوش مصنوعی سپس تجزیه وظایف را برای بهبود عملکرد انجام می‌دهد. اساساً، Agent برنامه‌ای از وظایف و زیروظایف خاص برای دستیابی به هدف پیچیده ایجاد می‌کند.

برای وظایف ساده، برنامه‌ریزی مرحله‌ای ضروری نیست. در عوض، یک Agent می‌تواند به طور تکراری روی پاسخ‌های خود تأمل کرده و آنها را بدون برنامه‌ریزی گام‌های بعدی بهبود بخشد.

استدلال با استفاده از ابزارهای موجود

Agent‌های هوش مصنوعی اقدامات خود را بر اساس اطلاعاتی که درک می‌کنند، پایه‌گذاری می‌کنند. اغلب، Agent‌های هوش مصنوعی پایگاه دانش کامل مورد نیاز برای پرداختن به تمام زیروظایف در یک هدف پیچیده را ندارند. برای رفع این مشکل، Agent‌های هوش مصنوعی از ابزارهای موجود خود استفاده می‌کنند. این ابزارها می‌توانند شامل مجموعه داده‌های خارجی، جستجوهای وب، API‌ها و حتی Agent‌های دیگر باشند. پس از بازیابی اطلاعات گمشده از این ابزارها، Agent می‌تواند پایگاه دانش خود را به‌روز کند. این بدان معناست که در هر مرحله، Agent برنامه اقدام خود را مجدداً ارزیابی و خود را اصلاح می‌کند.

برای کمک به توضیح این فرآیند، تصور کنید کاربری در حال برنامه‌ریزی تعطیلات خود است. کاربر به یک Agent هوش مصنوعی وظیفه می‌دهد تا پیش‌بینی کند کدام هفته در سال آینده احتمالاً بهترین آب و هوا را برای سفر موج‌سواری او در یونان خواهد داشت. از آنجا که مدل LLM در هسته Agent در الگوهای آب و هوایی تخصص ندارد، Agent اطلاعاتی را از یک پایگاه داده خارجی متشکل از گزارش‌های روزانه آب و هوای یونان در چند سال گذشته جمع‌آوری می‌کند.

با وجود کسب این اطلاعات جدید، Agent هنوز نمی‌تواند شرایط بهینه آب و هوایی برای موج‌سواری را تعیین کند و بنابراین، زیروظیفه بعدی ایجاد می‌شود. برای این زیروظیفه، Agent با یک Agent خارجی که در موج‌سواری تخصص دارد ارتباط برقرار می‌کند. فرض کنیم که در این فرآیند، Agent می‌آموزد که جزر و مد بالا و هوای آفتابی با باران کم یا بدون باران، بهترین شرایط موج‌سواری را فراهم می‌کند.

اکنون Agent می‌تواند اطلاعاتی را که از ابزارهای خود آموخته ترکیب کند تا الگوها را شناسایی کند. می‌تواند پیش‌بینی کند که کدام هفته سال آینده در یونان احتمالاً جزر و مد بالا، هوای آفتابی و احتمال کم بارندگی خواهد داشت. این یافته‌ها سپس به کاربر ارائه می‌شوند. این اشتراک‌گذاری اطلاعات بین ابزارها چیزی است که به Agent‌های هوش مصنوعی اجازه می‌دهد نسبت به مدل‌های سنتی هوش مصنوعی کاربرد عمومی‌تری داشته باشند.

یادگیری و بازتاب

Agent‌های هوش مصنوعی از مکانیسم‌های بازخورد، مانند Agent‌های هوش مصنوعی دیگر و انسان در حلقه human-in-the-loop (HITL)، برای بهبود دقت پاسخ‌های خود استفاده می‌کنند. بیایید به مثال موج‌سواری قبلی برگردیم تا این موضوع را برجسته کنیم. پس از اینکه Agent پاسخ خود را به کاربر شکل می‌دهد، اطلاعات آموخته شده را همراه با بازخورد کاربر ذخیره می‌کند تا عملکرد را بهبود بخشد و با ترجیحات کاربر برای اهداف آینده سازگار شود.

اگر از Agent‌های دیگر برای رسیدن به هدف استفاده شده باشد، ممکن است از بازخورد آنها نیز استفاده شود. بازخورد چند-Agent می‌تواند به‌ویژه در به حداقل رساندن زمانی که کاربران انسانی صرف ارائه دستورالعمل می‌کنند، مفید باشد. با این حال، کاربران می‌توانند در طول اقدامات و استدلال داخلی Agent نیز بازخورد ارائه دهند تا نتایج را بهتر با هدف مورد نظر همسو کنند.

مکانیسم‌های بازخورد، استدلال و دقت Agent هوش مصنوعی را بهبود می‌بخشند، که معمولاً به آن iterative refinement گفته می‌شود. برای جلوگیری از تکرار اشتباهات یکسان، Agent‌های هوش مصنوعی همچنین می‌توانند داده‌هایی در مورد راه‌حل‌های موانع قبلی را در یک پایگاه دانش ذخیره کنند.

چت‌بات‌های هوش مصنوعی Agentic در مقابل non-agentic

چت‌بات‌های هوش مصنوعی از تکنیک‌های هوش مصنوعی مکالمه‌ای مانند پردازش زبان طبیعی (NLP) برای درک سؤالات کاربر و خودکارسازی پاسخ‌ها به آنها استفاده می‌کنند. این چت‌بات‌ها یک روش ارائه هستند در حالی که Agent بودن یک چارچوب فناوری است.

چت‌بات‌های هوش مصنوعی non-agentic، چت‌بات‌هایی بدون ابزارهای موجود، حافظه و استدلال هستند. آنها فقط می‌توانند به اهداف کوتاه‌مدت دست یابند و نمی‌توانند برنامه‌ریزی آینده داشته باشند. همانطور که می‌دانیم، چت‌بات‌های non-agentic برای پاسخگویی به ورودی مداوم کاربر نیاز دارند. آنها می‌توانند پاسخ‌هایی برای پرامپت‌های معمول تولید کنند که احتمالاً با انتظارات کاربر مطابقت دارند، اما در مورد سؤالات منحصر به فرد کاربر و داده‌های آنها عملکرد ضعیفی دارند. از آنجا که این چت‌بات‌ها حافظه ندارند، نمی‌توانند اگر پاسخ‌هایشان نارضایت‌بخش باشد، از اشتباهات خود یاد بگیرند.

در مقابل، چت‌بات‌های هوش مصنوعی agentic می‌آموزند که با گذشت زمان با انتظارات کاربر سازگار شوند و تجربه‌ای شخصی‌سازی شده‌تر و پاسخ‌های جامع‌تری ارائه دهند. آنها می‌توانند وظایف پیچیده را با ایجاد زیروظایف بدون دخالت انسان و در نظر گرفتن برنامه‌های مختلف تکمیل کنند. این برنامه‌ها همچنین می‌توانند در صورت نیاز خود-اصلاح و به‌روز شوند. چت‌بات‌های هوش مصنوعی agentic، برخلاف انواع non-agentic، ابزارهای خود را ارزیابی می‌کنند و از منابع موجود خود برای پر کردن شکاف‌های اطلاعاتی استفاده می‌کنند.

پارادایم‌های استدلال

برای ساخت Agent‌های هوش مصنوعی یک معماری استاندارد واحد وجود ندارد. چندین پارادایم برای حل مسائل چند مرحله‌ای وجود دارد.

ReAct (استدلال و اقدام)

با این پارادایم، می‌توانیم به Agent‌ها دستور دهیم پس از هر اقدام انجام شده و با هر پاسخ ابزار، “فکر” کنند و برنامه‌ریزی نمایند تا تصمیم بگیرند از کدام ابزار بعدی استفاده کنند. این حلقه‌های تفکر-اقدام-مشاهده برای حل مسائل گام به گام و بهبود تکراری پاسخ‌ها استفاده می‌شوند.

از طریق ساختار پرامپت، می‌توان به Agent‌ها دستور داد تا به آرامی استدلال کنند و هر “تفکر” را نمایش دهند. استدلال کلامی Agent بینشی در مورد چگونگی شکل‌گیری پاسخ‌ها ارائه می‌دهد. در این چارچوب، Agent‌ها به طور مداوم زمینه خود را با استدلال جدید به‌روز می‌کنند. این را می‌توان به عنوان شکلی از پرامپت زنجیره‌ای تفکر (Chain-of-Thought) تفسیر کرد.

ReWOO (استدلال بدون مشاهده)

روش ReWOO، برخلاف ReAct، وابستگی به خروجی‌های ابزار برای برنامه‌ریزی اقدام را حذف می‌کند. در عوض، Agent‌ها از قبل برنامه‌ریزی می‌کنند. استفاده تکراری از ابزار با پیش‌بینی اینکه کدام ابزارها را هنگام دریافت پرامپت اولیه از کاربر استفاده کنند، اجتناب می‌شود. این از دیدگاه انسان‌محور مطلوب است زیرا کاربر می‌تواند برنامه را قبل از اجرا تأیید کند.

گردش کار ReWOO از سه ماژول تشکیل شده است. در ماژول برنامه‌ریزی، Agent گام‌های بعدی خود را با توجه به پرامپت کاربر پیش‌بینی می‌کند. مرحله بعدی شامل جمع‌آوری خروجی‌های تولید شده توسط فراخوانی این ابزارها است. در نهایت، Agent برنامه اولیه را با خروجی‌های ابزار جفت می‌کند تا یک پاسخ تنظیم کند. این برنامه‌ریزی از پیش می‌تواند استفاده از توکن و پیچیدگی محاسباتی و همچنین پیامدهای شکست ابزار میانی را به میزان قابل توجهی کاهش دهد.

شروع یادگیری Agentهای هوش مصنوعی

اگر میخواهید همین امروز Agentهای هوش مصنوعی را مسلط شوید و پیاده‌سازی کنید،

بعد از تسلط به پایتون و مبانی شبکه عصبی (اگر تا حالا شروع نکردید دوره فارسی هوش مصنوعی و دیپ لرنینگ خیلی توصیه میشه) مطالب زیر را مطالعه کنید:

منبع: https://www.ibm.com/think/topics/ai-agents

AI agentها یا عامل‌های هوش مصنوعی چیستند؟