معرفی Min P: روش جدید نمونهبرداری توکن برای LLMها
Min P، یک روش نمونهبرداری (sampling) جدید برای…
ارسال شده توسط مدیریت سایت
248 بازدید
GGUF چیست؟ راهنمای کامل فرمت جدید مدلهای هوش مصنوعی و مقایسه با GGML
در دنیای مدلهای زبان بزرگ (LLM)، فرمت فایلها…
ارسال شده توسط مدیریت سایت
276 بازدید
ایجاد مدلهای کوچک کارآمد با Llama 3.2 و هرس کردن (Pruning)
یکی از تکنیکهای اصلی در ایجاد مدلهای سبک…
ارسال شده توسط مدیریت سایت
387 بازدید
انقلابی در فرآیند Fine-Tune مدلهای هوش مصنوعی با Unsloth
در دنیای همیشه در حال تحول هوش مصنوعی…
ارسال شده توسط مدیریت سایت
550 بازدید
GSM8K چیست؟ دیتاست مسائل ریاضی برای آموزش LLMها
خلاصه دیتاست دیتاست GSM8K (مخفف Grade School Math…
ارسال شده توسط مدیریت سایت
208 بازدید
چطور مدلها را سادهتر با انسان همراستا کنیم: از RLHF تا DPO
مدلهای زبان بزرگ (LLM) هر روز هوشمندتر میشوند،…
ارسال شده توسط مدیریت سایت
247 بازدید
PPO به زبان ساده: چگونه هوش مصنوعی یاد میگیرد مثل ما فکر کند؟
دنیای هوش مصنوعی و بهخصوص مدلهای زبانی بزرگ…
ارسال شده توسط مدیریت سایت
1.23k بازدید
۴۰ معیار برتر مدلهای زبان بزرگ (LLM) با پشتوانه تحقیقاتی و موارد استفاده آنها
با توسعه روزافزون هوش مصنوعی مولد (GenAI)، تمرکز…
ارسال شده توسط مدیریت سایت
679 بازدید
درک مقاله DeepSeek R1
فهرست مطالب مقدمه و خلاصه مقاله لحظه دستیابی…
ارسال شده توسط مدیریت سایت
562 بازدید