تولید متن با LLMها در Keras
این پست از فصل 16 کتاب DEEP LEARNING…
ارسال شده توسط مدیریت سایت
4 بازدید
معرفی Min P: روش جدید نمونهبرداری توکن برای LLMها
Min P، یک روش نمونهبرداری (sampling) جدید برای…
ارسال شده توسط مدیریت سایت
489 بازدید
GGUF چیست؟ راهنمای کامل فرمت جدید مدلهای هوش مصنوعی و مقایسه با GGML
در دنیای مدلهای زبان بزرگ (LLM)، فرمت فایلها…
ارسال شده توسط مدیریت سایت
620 بازدید
ایجاد مدلهای کوچک کارآمد با Llama 3.2 و هرس کردن (Pruning)
یکی از تکنیکهای اصلی در ایجاد مدلهای سبک…
ارسال شده توسط مدیریت سایت
590 بازدید
انقلابی در فرآیند Fine-Tune مدلهای هوش مصنوعی با Unsloth
در دنیای همیشه در حال تحول هوش مصنوعی…
ارسال شده توسط مدیریت سایت
787 بازدید
GSM8K چیست؟ دیتاست مسائل ریاضی برای آموزش LLMها
خلاصه دیتاست دیتاست GSM8K (مخفف Grade School Math…
ارسال شده توسط مدیریت سایت
328 بازدید
چطور مدلها را سادهتر با انسان همراستا کنیم: از RLHF تا DPO
مدلهای زبان بزرگ (LLM) هر روز هوشمندتر میشوند،…
ارسال شده توسط مدیریت سایت
381 بازدید
PPO به زبان ساده: چگونه هوش مصنوعی یاد میگیرد مثل ما فکر کند؟
دنیای هوش مصنوعی و بهخصوص مدلهای زبانی بزرگ…
ارسال شده توسط مدیریت سایت
1.78k بازدید
۴۰ معیار برتر مدلهای زبان بزرگ (LLM) با پشتوانه تحقیقاتی و موارد استفاده آنها
با توسعه روزافزون هوش مصنوعی مولد (GenAI)، تمرکز…
ارسال شده توسط مدیریت سایت
906 بازدید