معرفی Min P: روش جدید نمونهبرداری توکن برای LLMها
Min P، یک روش نمونهبرداری (sampling) جدید برای…
ارسال شده توسط مدیریت سایت
260 بازدید
GGUF چیست؟ راهنمای کامل فرمت جدید مدلهای هوش مصنوعی و مقایسه با GGML
در دنیای مدلهای زبان بزرگ (LLM)، فرمت فایلها…
ارسال شده توسط مدیریت سایت
299 بازدید
ایجاد مدلهای کوچک کارآمد با Llama 3.2 و هرس کردن (Pruning)
یکی از تکنیکهای اصلی در ایجاد مدلهای سبک…
ارسال شده توسط مدیریت سایت
393 بازدید
انقلابی در فرآیند Fine-Tune مدلهای هوش مصنوعی با Unsloth
در دنیای همیشه در حال تحول هوش مصنوعی…
ارسال شده توسط مدیریت سایت
561 بازدید
GSM8K چیست؟ دیتاست مسائل ریاضی برای آموزش LLMها
خلاصه دیتاست دیتاست GSM8K (مخفف Grade School Math…
ارسال شده توسط مدیریت سایت
215 بازدید
چطور مدلها را سادهتر با انسان همراستا کنیم: از RLHF تا DPO
مدلهای زبان بزرگ (LLM) هر روز هوشمندتر میشوند،…
ارسال شده توسط مدیریت سایت
255 بازدید
PPO به زبان ساده: چگونه هوش مصنوعی یاد میگیرد مثل ما فکر کند؟
دنیای هوش مصنوعی و بهخصوص مدلهای زبانی بزرگ…
ارسال شده توسط مدیریت سایت
1.28k بازدید
۴۰ معیار برتر مدلهای زبان بزرگ (LLM) با پشتوانه تحقیقاتی و موارد استفاده آنها
با توسعه روزافزون هوش مصنوعی مولد (GenAI)، تمرکز…
ارسال شده توسط مدیریت سایت
698 بازدید
درک مقاله DeepSeek R1
فهرست مطالب مقدمه و خلاصه مقاله لحظه دستیابی…
ارسال شده توسط مدیریت سایت
568 بازدید