معرفی Min P: روش جدید نمونهبرداری توکن برای LLMها
Min P، یک روش نمونهبرداری (sampling) جدید برای…
ارسال شده توسط مدیریت سایت
412 بازدید
GGUF چیست؟ راهنمای کامل فرمت جدید مدلهای هوش مصنوعی و مقایسه با GGML
در دنیای مدلهای زبان بزرگ (LLM)، فرمت فایلها…
ارسال شده توسط مدیریت سایت
507 بازدید
ایجاد مدلهای کوچک کارآمد با Llama 3.2 و هرس کردن (Pruning)
یکی از تکنیکهای اصلی در ایجاد مدلهای سبک…
ارسال شده توسط مدیریت سایت
477 بازدید
انقلابی در فرآیند Fine-Tune مدلهای هوش مصنوعی با Unsloth
در دنیای همیشه در حال تحول هوش مصنوعی…
ارسال شده توسط مدیریت سایت
702 بازدید
GSM8K چیست؟ دیتاست مسائل ریاضی برای آموزش LLMها
خلاصه دیتاست دیتاست GSM8K (مخفف Grade School Math…
ارسال شده توسط مدیریت سایت
276 بازدید
چطور مدلها را سادهتر با انسان همراستا کنیم: از RLHF تا DPO
مدلهای زبان بزرگ (LLM) هر روز هوشمندتر میشوند،…
ارسال شده توسط مدیریت سایت
317 بازدید
PPO به زبان ساده: چگونه هوش مصنوعی یاد میگیرد مثل ما فکر کند؟
دنیای هوش مصنوعی و بهخصوص مدلهای زبانی بزرگ…
ارسال شده توسط مدیریت سایت
1.6k بازدید
۴۰ معیار برتر مدلهای زبان بزرگ (LLM) با پشتوانه تحقیقاتی و موارد استفاده آنها
با توسعه روزافزون هوش مصنوعی مولد (GenAI)، تمرکز…
ارسال شده توسط مدیریت سایت
807 بازدید
درک مقاله DeepSeek R1
فهرست مطالب مقدمه و خلاصه مقاله لحظه دستیابی…
ارسال شده توسط مدیریت سایت
649 بازدید