GSM8K چیست؟ دیتاست مسائل ریاضی برای آموزش LLMها
خلاصه دیتاست دیتاست GSM8K (مخفف Grade School Math…
ارسال شده توسط مدیریت سایت
142 بازدید
درک مقاله DeepSeek R1
فهرست مطالب مقدمه و خلاصه مقاله لحظه دستیابی…
ارسال شده توسط مدیریت سایت
447 بازدید
مقدمهای بر Reinforcement Learning و نقش آن در LLMها
در این پست قراره به Reinforcement Learning (RL)…
ارسال شده توسط مدیریت سایت
452 بازدید