AI agentها یا عاملهای هوش مصنوعی چیستند؟

یک عامل (Agent) هوش مصنوعی به سیستم یا برنامهای اشاره دارد که قادر است به طور خودکار با طراحی گردش کار خود و استفاده از ابزارهای موجود، وظایفی را از طرف کاربر یا سیستم دیگری انجام دهد.
Agentهای هوش مصنوعی میتوانند طیف گستردهای از قابلیتها فراتر از پردازش زبان طبیعی را شامل شوند، از جمله تصمیمگیری، حل مسئله، تعامل با محیطهای خارجی و اجرای اقدامات.
این Agentها میتوانند در کاربردهای مختلف برای حل وظایف پیچیده در زمینههای مختلف سازمانی به کار گرفته شوند، از طراحی نرمافزار و خودکارسازی IT گرفته تا ابزارهای تولید کد و دستیاران مکالمهای. آنها از تکنیکهای پیشرفته پردازش زبان طبیعی مدلهای زبانی بزرگ (LLMها) برای درک و پاسخ به ورودیهای کاربر به صورت گام به گام استفاده میکنند و تشخیص میدهند چه زمانی از ابزارهای خارجی استفاده کنند.
چگونگی کار Agentهای هوش مصنوعی
در هسته Agentهای هوش مصنوعی، مدلهای زبانی بزرگ (LLMها) قرار دارند. به همین دلیل، به Agentهای هوش مصنوعی اغلب Agentهای LLM نیز گفته میشود. مدلهای زبانی سنتی، پاسخهای خود را بر اساس دادههایی که با آنها آموزش دیدهاند تولید میکنند و محدود به دانش و محدودیتهای استدلالی هستند. در مقابل، Agent از فراخوانی ابزار در پشت صحنه برای دستیابی به اطلاعات بهروز، بهینهسازی گردش کار و ایجاد زیروظایف به صورت خودکار برای دستیابی به اهداف پیچیده استفاده میکند.
در این فرآیند، Agent خودمختار میآموزد که با گذشت زمان با انتظارات کاربر سازگار شود. توانایی Agent در ذخیره تعاملات گذشته در حافظه و برنامهریزی اقدامات آینده، تجربهای شخصیسازی شده و پاسخهای جامع را تشویق میکند. این فراخوانی ابزار میتواند بدون دخالت انسان انجام شود و امکانات کاربردهای دنیای واقعی این سیستمهای هوش مصنوعی را گسترش میدهد. رویکردی که Agentهای هوش مصنوعی در دستیابی به اهداف تعیین شده توسط کاربران اتخاذ میکنند، از این سه مرحله تشکیل شده است:
هدفگذاری اولیه و برنامهریزی
اگرچه Agentهای هوش مصنوعی در فرآیندهای تصمیمگیری خود خودمختار هستند، به اهداف و محیطهایی که توسط انسانها تعریف شده نیاز دارند. سه تأثیر اصلی بر رفتار Agent خودمختار وجود دارد:
- تیم توسعهدهندگانی که سیستم هوش مصنوعی Agent را طراحی و آموزش میدهند.
- تیمی که Agent را مستقر میکند و دسترسی کاربر به آن را فراهم میسازد.
- کاربری که اهداف خاصی را برای Agent هوش مصنوعی تعیین میکند و ابزارهای موجود برای استفاده را مشخص میکند.
با توجه به اهداف کاربر و ابزارهای موجود Agent، Agent هوش مصنوعی سپس تجزیه وظایف را برای بهبود عملکرد انجام میدهد. اساساً، Agent برنامهای از وظایف و زیروظایف خاص برای دستیابی به هدف پیچیده ایجاد میکند.
برای وظایف ساده، برنامهریزی مرحلهای ضروری نیست. در عوض، یک Agent میتواند به طور تکراری روی پاسخهای خود تأمل کرده و آنها را بدون برنامهریزی گامهای بعدی بهبود بخشد.
استدلال با استفاده از ابزارهای موجود
Agentهای هوش مصنوعی اقدامات خود را بر اساس اطلاعاتی که درک میکنند، پایهگذاری میکنند. اغلب، Agentهای هوش مصنوعی پایگاه دانش کامل مورد نیاز برای پرداختن به تمام زیروظایف در یک هدف پیچیده را ندارند. برای رفع این مشکل، Agentهای هوش مصنوعی از ابزارهای موجود خود استفاده میکنند. این ابزارها میتوانند شامل مجموعه دادههای خارجی، جستجوهای وب، APIها و حتی Agentهای دیگر باشند. پس از بازیابی اطلاعات گمشده از این ابزارها، Agent میتواند پایگاه دانش خود را بهروز کند. این بدان معناست که در هر مرحله، Agent برنامه اقدام خود را مجدداً ارزیابی و خود را اصلاح میکند.
برای کمک به توضیح این فرآیند، تصور کنید کاربری در حال برنامهریزی تعطیلات خود است. کاربر به یک Agent هوش مصنوعی وظیفه میدهد تا پیشبینی کند کدام هفته در سال آینده احتمالاً بهترین آب و هوا را برای سفر موجسواری او در یونان خواهد داشت. از آنجا که مدل LLM در هسته Agent در الگوهای آب و هوایی تخصص ندارد، Agent اطلاعاتی را از یک پایگاه داده خارجی متشکل از گزارشهای روزانه آب و هوای یونان در چند سال گذشته جمعآوری میکند.
با وجود کسب این اطلاعات جدید، Agent هنوز نمیتواند شرایط بهینه آب و هوایی برای موجسواری را تعیین کند و بنابراین، زیروظیفه بعدی ایجاد میشود. برای این زیروظیفه، Agent با یک Agent خارجی که در موجسواری تخصص دارد ارتباط برقرار میکند. فرض کنیم که در این فرآیند، Agent میآموزد که جزر و مد بالا و هوای آفتابی با باران کم یا بدون باران، بهترین شرایط موجسواری را فراهم میکند.
اکنون Agent میتواند اطلاعاتی را که از ابزارهای خود آموخته ترکیب کند تا الگوها را شناسایی کند. میتواند پیشبینی کند که کدام هفته سال آینده در یونان احتمالاً جزر و مد بالا، هوای آفتابی و احتمال کم بارندگی خواهد داشت. این یافتهها سپس به کاربر ارائه میشوند. این اشتراکگذاری اطلاعات بین ابزارها چیزی است که به Agentهای هوش مصنوعی اجازه میدهد نسبت به مدلهای سنتی هوش مصنوعی کاربرد عمومیتری داشته باشند.
یادگیری و بازتاب
Agentهای هوش مصنوعی از مکانیسمهای بازخورد، مانند Agentهای هوش مصنوعی دیگر و انسان در حلقه human-in-the-loop (HITL)، برای بهبود دقت پاسخهای خود استفاده میکنند. بیایید به مثال موجسواری قبلی برگردیم تا این موضوع را برجسته کنیم. پس از اینکه Agent پاسخ خود را به کاربر شکل میدهد، اطلاعات آموخته شده را همراه با بازخورد کاربر ذخیره میکند تا عملکرد را بهبود بخشد و با ترجیحات کاربر برای اهداف آینده سازگار شود.
اگر از Agentهای دیگر برای رسیدن به هدف استفاده شده باشد، ممکن است از بازخورد آنها نیز استفاده شود. بازخورد چند-Agent میتواند بهویژه در به حداقل رساندن زمانی که کاربران انسانی صرف ارائه دستورالعمل میکنند، مفید باشد. با این حال، کاربران میتوانند در طول اقدامات و استدلال داخلی Agent نیز بازخورد ارائه دهند تا نتایج را بهتر با هدف مورد نظر همسو کنند.
مکانیسمهای بازخورد، استدلال و دقت Agent هوش مصنوعی را بهبود میبخشند، که معمولاً به آن iterative refinement گفته میشود. برای جلوگیری از تکرار اشتباهات یکسان، Agentهای هوش مصنوعی همچنین میتوانند دادههایی در مورد راهحلهای موانع قبلی را در یک پایگاه دانش ذخیره کنند.
چتباتهای هوش مصنوعی Agentic در مقابل non-agentic
چتباتهای هوش مصنوعی از تکنیکهای هوش مصنوعی مکالمهای مانند پردازش زبان طبیعی (NLP) برای درک سؤالات کاربر و خودکارسازی پاسخها به آنها استفاده میکنند. این چتباتها یک روش ارائه هستند در حالی که Agent بودن یک چارچوب فناوری است.
چتباتهای هوش مصنوعی non-agentic، چتباتهایی بدون ابزارهای موجود، حافظه و استدلال هستند. آنها فقط میتوانند به اهداف کوتاهمدت دست یابند و نمیتوانند برنامهریزی آینده داشته باشند. همانطور که میدانیم، چتباتهای non-agentic برای پاسخگویی به ورودی مداوم کاربر نیاز دارند. آنها میتوانند پاسخهایی برای پرامپتهای معمول تولید کنند که احتمالاً با انتظارات کاربر مطابقت دارند، اما در مورد سؤالات منحصر به فرد کاربر و دادههای آنها عملکرد ضعیفی دارند. از آنجا که این چتباتها حافظه ندارند، نمیتوانند اگر پاسخهایشان نارضایتبخش باشد، از اشتباهات خود یاد بگیرند.
در مقابل، چتباتهای هوش مصنوعی agentic میآموزند که با گذشت زمان با انتظارات کاربر سازگار شوند و تجربهای شخصیسازی شدهتر و پاسخهای جامعتری ارائه دهند. آنها میتوانند وظایف پیچیده را با ایجاد زیروظایف بدون دخالت انسان و در نظر گرفتن برنامههای مختلف تکمیل کنند. این برنامهها همچنین میتوانند در صورت نیاز خود-اصلاح و بهروز شوند. چتباتهای هوش مصنوعی agentic، برخلاف انواع non-agentic، ابزارهای خود را ارزیابی میکنند و از منابع موجود خود برای پر کردن شکافهای اطلاعاتی استفاده میکنند.
پارادایمهای استدلال
برای ساخت Agentهای هوش مصنوعی یک معماری استاندارد واحد وجود ندارد. چندین پارادایم برای حل مسائل چند مرحلهای وجود دارد.
ReAct (استدلال و اقدام)
با این پارادایم، میتوانیم به Agentها دستور دهیم پس از هر اقدام انجام شده و با هر پاسخ ابزار، “فکر” کنند و برنامهریزی نمایند تا تصمیم بگیرند از کدام ابزار بعدی استفاده کنند. این حلقههای تفکر-اقدام-مشاهده برای حل مسائل گام به گام و بهبود تکراری پاسخها استفاده میشوند.
از طریق ساختار پرامپت، میتوان به Agentها دستور داد تا به آرامی استدلال کنند و هر “تفکر” را نمایش دهند. استدلال کلامی Agent بینشی در مورد چگونگی شکلگیری پاسخها ارائه میدهد. در این چارچوب، Agentها به طور مداوم زمینه خود را با استدلال جدید بهروز میکنند. این را میتوان به عنوان شکلی از پرامپت زنجیرهای تفکر (Chain-of-Thought) تفسیر کرد.
ReWOO (استدلال بدون مشاهده)
روش ReWOO، برخلاف ReAct، وابستگی به خروجیهای ابزار برای برنامهریزی اقدام را حذف میکند. در عوض، Agentها از قبل برنامهریزی میکنند. استفاده تکراری از ابزار با پیشبینی اینکه کدام ابزارها را هنگام دریافت پرامپت اولیه از کاربر استفاده کنند، اجتناب میشود. این از دیدگاه انسانمحور مطلوب است زیرا کاربر میتواند برنامه را قبل از اجرا تأیید کند.
گردش کار ReWOO از سه ماژول تشکیل شده است. در ماژول برنامهریزی، Agent گامهای بعدی خود را با توجه به پرامپت کاربر پیشبینی میکند. مرحله بعدی شامل جمعآوری خروجیهای تولید شده توسط فراخوانی این ابزارها است. در نهایت، Agent برنامه اولیه را با خروجیهای ابزار جفت میکند تا یک پاسخ تنظیم کند. این برنامهریزی از پیش میتواند استفاده از توکن و پیچیدگی محاسباتی و همچنین پیامدهای شکست ابزار میانی را به میزان قابل توجهی کاهش دهد.
شروع یادگیری Agentهای هوش مصنوعی
اگر میخواهید همین امروز Agentهای هوش مصنوعی را مسلط شوید و پیادهسازی کنید،
بعد از تسلط به پایتون و مبانی شبکه عصبی (اگر تا حالا شروع نکردید دوره فارسی هوش مصنوعی و دیپ لرنینگ خیلی توصیه میشه) مطالب زیر را مطالعه کنید:
- مقدمهای جامع بر AI Agents: مفاهیم، کارکردها و نحوه ساخت
- آموزش Agent-بخش 2:LLM چیست؟
- آموزش Agent-بخش 3 پیامها و توکنهای ویژه
- آموزش Agent-بخش 4: ابزارها (Tools) چیست؟
- آموزش Agent-بخش 5: درک Agentهای هوش مصنوعی از طریق چرخه تفکر-اقدام-مشاهده
- آموزش Agent-بخش 6 (تفکر): استدلال داخلی و رویکرد Re-Act
- آموزش Agent-بخش 7(اقدامات): توانمندسازی Agent برای تعامل با محیط خود
- آموزش Agent-بخش 8(مشاهده): یکپارچهسازی بازخورد برای تطبیق و بهبود
- آموزش Agent-بخش 9: کتابخانه Dummy Agent
- آموزش Agent-بخش 10: ساخت agent با smolagents
دیدگاهتان را بنویسید